当前位置:   article > 正文

我实测了国内外GPT,问了10个问题,差点把电脑砸了...

问gpt的刁难问题

观点| Mr.K   主笔| Wendy.L   编辑| Emma

来源| AI新猿人(ID:aixyr2023)

虽然ChatGPT早就火出圈好几个月,但是我敢保证有好多人还是不知道GPT三个字母代表什么。

G代表的是generative,表示有生产力的;

P代表的是pre-trained 的意思就是预训练

T代表的是transformer,表示变换模型(计算机)转换器。

ChatGPT的全称就是Chat Generative Pre-trained Transformer,也就是专门用来聊天的生成式预训练转换器。



01

测评了国内外GPT之后,心情很复杂

我总结出以下差异

测评之前,我首先问了一个问题

33a13e86951c072250b6f81694ac4aad.png

下面是它的回答:

GPT的全称是Generative Pre-trained Transformer,是一种基于Transformer架构进行预训练的神经网络模型。其技术原理如下:

1、预训练:GPT的训练数据集是通过大规模语料库(例如NLP训练数据库)进行训练得到的。这些数据集包含了大量的文本数据和对应的标签,预训练模型可以利用这些数据来生成文本、回答问题、进行对话等任务。

2、模型架构:GPT采用了Transformer架构作为其神经网络模型。Transformer是一种基于注意力机制的深度学习模型,其训练过程类似于循环神经网络(RNN),但具有更好的时间和空间效率。

3、损失函数:GPT的损失函数采用了交叉熵损失函数,这种损失函数能够更好地反映生成文本和回答问题的质量和准确性,并且可以通过交叉熵损失函数的剪枝来避免过度训练。

4、优化方法:GPT采用了反向传播算法和Adam优化器进行模型的训练和优化。反向传播算法可以帮助训练算法找到模型的局部最优解,Adam优化器可以通过学习动量来更好地调整模型的参数,以提高模型的训练效果。

也就说,GPT它是基于Transformer架构的预训练语言模型,并且通过处理大量的非标记语料来进行训练,通过预训练得到一个高效的神经网络模型,该模型可以自动生成文本、回答问题、进行对话等任务,并且可以通过交叉熵损失函数和Adam优化器进行训练和优化。

值得注意的是,GPT采用的是单向的、基于自回归的方式来预测生成下一个单词的概率,也就是说,当输入前面的句子时,GPT可以预测下一个最有可能出现的单词是什么。

由此可见,不管是chat GPT还是文心一言,它们的内容创作都不同于人类。

人类作家在创作之前,需要先整体构思出一个框架,可是GPT却是只需要给出它一个开头和关键词,他就挤牙膏一样把内容挤出来,在写完文章之前,GPT并不知道自己要写的是什么样一个故事。

这也就是为什么即使ChatGPT完全不理解你所说是什么东西,它仍然能够一本正经胡说八道跟你聊一堆。

当然了文心一言本身也是知道自己可能在“胡说”,而且自己也在回答当中很谦虚地承认了这一点:

83e0d2e2b3d9afa6046557d4f43aa69b.png

作为一个人工智能语言模型,我是基于自然语言处理技术来分析和回答你的问题的。

具体来说,我是通过分析你输入的文本,提取出其中的关键词和信息,然后使用自然语言处理技术中的语法分析技术来分析这些关键词和信息之间的语义关系,从而生成回答。

需要注意的是,我的回答是基于自然语言处理技术中的机器学习算法和模型,通过不断的训练和优化来生成的。因此,我的回答是基于大量的文本数据和语料库,具有一定的准确性和可靠性,但是也存在一定的限制和误差。

至于具体的测评结果,我根据自己的体验,综合了网上其它人的点评,总结出以下几点:

1、文学创作,首先要说明的是,不管是文心一言还是chatGPT,他们在文学创作或讲故事说段子方面,都是半斤八两 ,一言难尽。

43f7b9436ef35574a384751ef59c4576.png

bb618d0e74dd851cbab83c243ec07043.png

怎么说呢?讲的笑话本身并不好笑,但是它们讲笑话本身真的好好笑。

当然,这一点所谓仁者见仁智者见智。

对于本身需要情感或艺术水平、或者本身对质量要求比较高的创作, 如果让AI来生成的话,就算形容为差强人意,也真的是很勉强。

2、专业文稿,对于产品说明或者新闻消息乃至商业软文写作方面,二者各有千秋,并且与人类的水平不相上下,但更重要的是,比人类效率更高。

这要怎么说呢?AI就是一个没有感情的但产量奇高的创作机器。

3、写代码方面,根据好多专业程序员的测试,貌似文心一言的代码能力还需加强,而 ChatGPT 以擅长编码“出圈”果然名不虚传。

4、中文语义理解,所谓术业有专攻,文心一言在中文语义的理解以及中国传统文化相关内容的创作上显然更胜一筹。

文心一言生成的内容之所以还不够完善,是因为训练的参数相较国外的GPT4还不够,并不是外界谣传的那种“文心一言对中文的理解不好是因为基于国外某GPT XXX…… ”

拜托,我们要对国产AI有信心好吗?:)

5、多模态内容生成,这一点chatGPT目前还不支持,不能输出图片创作;可是文心一言是可以画图的,这一点完胜!



02

AI绘画测评:Midjourney

刚刚说到画图,我们就不得不提另一个AI作图神器,Midjourney。

Midjourney诞生在美国,是一款采用了类似于GPT-4的深度学习技术的绘画工具,它具有强大的绘画能力和便捷的使用体验,能够理解用户的输入信息,比如文字描述、草图、甚至是情感等,然后在大量的图像数据中寻找相似的元素和特征,最终生成一幅满足用户需求的作品。

42a0795a2413dfee54fc040ea155e794.png

Midjourney绘制,来自网络,侵删

它不仅能够生成传统意义上的图像,还能够创作出具有丰富意义和独特风格的作品。比如Midjourney可以将某种艺术风格应用到的作品上,例如梵高的星空风格、毕加索的立体主义等。只需上传一张图片和指定想要的艺术风格,Midjourney就能快速地生成一幅具有该风格特点的作品。

6c7a27416a83be55e77e4ee029598c1d.png

更重要的是,这些图片已经能传达出情绪和意境来了不是?!

95be3ad5f394b75b2ed2abbddef138aa.png

Midjourney绘制,侵删

此外,用户还可以对AI创作的图片进行分层编辑,允许用户在不同图层上绘制和修改,这样即使在复杂的创作过程中,也能轻松地实现对各个元素的控制和调整,而且还支持团队协作。

ba9446de04d4294d8baa00dfa575f6aa.png

前段时间火出圈的“中国式情侣”图片,由Midjourney生成

42f4b636d56cae13042cf19358b6e139.png

不得不说,Midjourney它是所有GPT里头最最最懂美学的。

另外我附上 这是文心一言绘制生成的中国式情侣。

bd3f87b4e965a6298e5cbd392013f6c1.png

怎么说呢?也不能说它不对,只是真的像极了十几年前,5块钱一本买的言情杂志当中插图。。。

我再来揭晓一个,前两天另一篇文张的谜语图:

6fdb0f7fdb5a5d92e16d6a5a76dce007.png

其实我说的是,画一只虎头虎脑的小熊。

6dbf345f5ce1b004fccd2a025d1b1c54.jpeg

虎头虎脑熊正确打开方式。

总体来说,文心一言能聊天会创作写代码还会画图,功能更综合全面一些。

Midjourney在绘图方面则是一骑绝尘了。

最后,Midjourney不仅是一个绘画工具,还是一个学习与教育乃至于社交平台。用户可以通过它来学习和掌握各种绘画技巧和风格,还可以在平台上与其他用户进行交流和分享自己的作品。

也许Midjourney真正令人叫绝的不是技术能力强大,而是产品塑造十分成功。

这一点,值得所有的GPT应用企业学习。



03

国内外GPT技术水平差多远?

导致差距的原因是什么?

其实透过现象看本质,中文大语言模型和GPT-4,目前的确是有一些的差距,但背后原因并不是在于技术研究水平的差距有多大,而是在于技术应用的滞后和环境的不佳方面。

以ChatGPT为例,目前,ChatGPT已经被广泛应用于金融、医疗、教育等领域,并且已经取得了不错的效果。例如,在金融领域,ChatGPT已经被应用于智能投资、客户服务等方面,可以帮助投资者进行智能投资,提高投资效率;在医疗领域,ChatGPT已经被应用于智能诊断、医疗预测等方面,可以帮助医生进行智能诊断,提高诊断准确率;在教育领域,ChatGPT已经被应用于智能教学、在线辅导等方面,可以帮助学生进行智能辅导,提高学习效果。

在中国,GPT技术的应用才刚刚起步,在文心一言刚发布的时候,大量的企业仅仅是才开始与百度签订合作,目前可能也只有一部分刚刚开始接入应用或者开发工具等,但实际的还没有看到很出彩的应用案例。

虽然还没有看到技术的应用,但是网上已经出现了关于GPT各种教赚钱课程,不少人已经靠GPT赚得了第一桶金,但用的是什么方式呢?

卖ChatGPT账号、直播卖课、以及炒股···

自然语言处理是一项需要大量资金投入的技术。美国在自然语言处理领域的投入是国内的数倍甚至数十倍,这也是美国在该领域能够取得领先地位的重要原因之一。

而在中国的今年的农历年之后,每一个投资人都在疯狂寻找中国的ChatGPT。

资本疯狂炒作GPT概念,但是这些年一直潜心研究大语言模型技术的百度公司,AII IN AI, 这些年股价却一路狂跌。

少有人是真的想研究技术造福社会科技兴国,多数只是想捞一笔钱然后离场,或者再去捞下一笔钱。

刘慈欣在《三体》里写过一句话:任何超脱飞扬的思想都会砰然坠地——现实的引力实在是太沉重了。

也许这就是社会环境的引力。



04

GPT未来发展前景分析

前面我们说道,国产的GPT与国外还存在一定差距。

但是,随着国内大语言模型训练的参数和时长不断增多,以及应用场景的不断扩展,其差距将会逐渐缩小。

1、横向继续扩展应用领域,AI+传统应用,引起产业升级

当前AI技术已经在多个领域得到了应用,例如:金融、医疗、教育等。未来,随着自然语言处理技术的不断提升和应用场景的不断扩展,其应用领域还将进一步拓展。

其次,自然语言处理技术与其他技术的融合也将成为未来的一个重要趋势。

例如:在智能客服领域,自然语言处理技术可以与语音识别技术、机器学习技术等结合,实现更加智能的客户服务;在智能翻译领域,自然语言处理技术可以与翻译技术结合,实现更加自然的翻译服务……

随着自然语言处理技术的不断发展和应用场景的不断扩展,其产业链也将得到进一步拓展和优化,从而带动整个人工智能产业的发展。

2、纵向深耕,垂类领域GPT还会不断浮现,信息安全成为主打要求

垂直GPT相对于通用的GPT产品(比如广而泛的ChatGPT)来说,优势其实是十分明显:

1、时间成本还是经济成本都显著降低

垂直GPT只需利用该领域内(如金融、教育、环保等)的专业数据进行训练,避免了采集高成本和高难度的数据,可以节省人力物力;同时,垂直GPT针对特定领域进行优化,训练数据更加专业化和精细化,可以通过更少的数据和更短的训练时间,获得更好的效果。

2、专业度高,应用效果更好

与通用的GPT产品相比,垂直GPT能够更准确地理解和处理领域内的语言数据,同时也减少了后续的人工修正和调整,在特定领域的应用效果会更好。

例如,IBM Watson Education推出了一款名为“Teacher Advisor with Watson”的教育GPT,可以为教师提供个性化的教学建议和支持;Kheiron Medical推出的“MIA”医疗GPT,可以为医生提供乳腺癌筛查和诊断支持,而专门为金融领域打造的大型语言模型(LLM)——BloombergGPT,更是一经发布就引发金融圈“地震”。

以上这些垂直GPT都更加适合商业化应用,可以为企业提供更高效、准确、具有定制性的自然语言处理服务。

3、在信息安全和隐私保护方面做到加强

对于ChatGPT类的产品,其实我们都知道,你的每次问答,都是在给它进行数据投喂。

可是如果有一天,当涉及到个人隐私、企业机密、乃至于国家秘密的时候,你还敢不敢使ChatGPT?——相信很多人在使用 ChatGPT的时候,都不免会有相同的隐忧。

这也就是为什么,自打国产的文心一言发布之后,我开始坚定地去用,因为我知道每次使用文心一言,都是在帮它优化性能,同时我也是觉得说,不想把更多中国人的数据,给到美国。

同样,对于一个企业来说更是如此。

未来的垂直GPT应该做到加注重信息安全与隐私保护,比如,采用加密过滤的方式,使企业数据不被泄露,也就是无法“二次训练”,同时,采用更为严格的数据保护措施,也可以确保用户的隐私和信息安全不受侵犯等等。

 --  END -- 

送你一份《顶尖机构 ChatGPT 研究报告》pdf

关注下方公众号,在对话框回复:gpt

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/156504
推荐阅读
相关标签
  

闽ICP备14008679号