小小林熬夜学编程

这个屌丝很懒，什么也没留下！

热门标签

热门文章

当前位置: article > 正文

实测阿里“通义千问”！一花独放不是春，百花齐放春满园

作者：小小林熬夜学编程 | 2024-04-22 03:30:34

赞

踩

通义千问7b 微调 csdn

阿里的大模型“通义千问”今天开启内测，距百度“文心一言”发布差不多20天。今天看到消息后厚着脸皮找达摩院的朋友要邀请码，下午拿到后，赶紧测了一下。

官方网址：https://tongyi.aliyun.com/chat

刚好上次文心一言出来的时候测试过一次，有一些现成的case，于是又用这些case测了一轮，有一些随意，个人观点，仅供参考。

帮我写一份招聘JD，第一步没问题，让继续写实习生JD的时候，大概也get到NLP实习生这个点，这里面还加上了“注释”和一个邮箱地址，特意搜了一下，非真实的，不过talos-deep看起来还挺有深意的

以下来自通义千问

以下来自文心一言

以下来自ChatGPT

测试一下写作和翻译能力

以下来自通义千问

以下来自文心一言

以下来自ChatGPT

角色扮演，通义千问、文心一言貌似都不支持

以下来自通义千问

以下来自文心一言

以下来自ChatGPT

一个半小时是多少分钟，通义千问答错了，提示了一下，大概算回答出来了

以下来自通义千问

以下来自文心一言

以下是ChatGPT的

继续测试一个数学问题

以下来自通义千问，解决的还不错

以下来自文心一言，这次是这样的

以下来自ChatGPT

父亲和母亲可以结婚吗？

以下来自通义千问

以下来自文心一言

在这个问题上，ChatGPT翻车了

还有一个天气问题，虽然有结果，但是是错的，这个问题如果没有调用接口，直接拒绝回答可能比较好

以下来自通义千问

以下来自文心一言

以下来自ChatGPT

类似的，还有卡塔尔世界杯冠军问题，之前ChatGPT因为数据最新到2021年，所以无法准确回答这个问题

以下来自通义千问，虽然说对了冠军，但是有一些陈述性错误

以下来自文心一言

最后说一下个人结论：首先阿里的这个模型比我预期的早，其次效果还不错，和文心一言各有千秋，最后是这段时间国内外出现了不少类ChatGPT的产品或者开源工具，虽然效果还达不到ChatGPT，GPT-4的高度，但是解决了“有”的问题，之后就好办一些了。

总之：一花独放不是春，百花齐放春满园。

题外话：按BAT的顺序，国内下一个发布此类大模型的会不会是腾讯？或者是其他家，欢迎大家留言。

一起交流

想和你一起学习进步！『NewBeeNLP』目前已经建立了多个不同方向交流群（机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等），名额有限，赶紧添加下方微信加入一起讨论交流吧！（注意一定o要备注信息才能通过）

format,png

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/466583

推荐阅读

相关标签

Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。

闽ICP备14008679号