跟无神学机器学习之大模型GPT4技术报告详解_gpt4技术报告分析

作者：秋刀鱼在做梦 | 2024-07-11 17:12:59

踩

gpt4技术报告分析

一、前言

对于从事AI方面的研究者来说，大语言模型的浪潮已势不可挡，任何此行业者都应对大语言模型有一定的认知和了解，这是这个时代必需的技能，今天，无神带大家详解open-AI的GPT4技术报告。

出于商业考虑，该报告不公开模型具体架构，只提了一嘴使用Transformer+强化学习做出来的，是在GPT3.5的基础上在另一个Human数据集上进行的微调，增加了一定的安全性和在各种行业考试上的表现能力。

3.1 参数量大

每个版本，参数量成好几个数量级的增加，因此，也是GPT能有如此强大的表现的原因。

3.2 训练的数据量大

这种大模型的开发，需要极强的计算资源，没有财力的话根本训练不成大模型这种硅积的模型。

Open-AI就在微软的财力的支持下进行的。

对于图片、视频的相关任务的支持力度更大。可以从官方给的例子看出：

更多的是对于图片-文字的一个生成的功能的支持。

据了解，该功能截止目前发表时间还未完全部署上线。

同时各种表现的准确性等打分指标比较3.5版本有了一定的提升。

在各类问题的准确率随着版本的提升：

在对抗的提示词下的准确率：

比如在敏感内容上的不正确表现的比率的对比：

仍然和其他版本一样，有着安全性、不稳定性、泄露信息、敏感话题等问题，还有待解决。

同时，在比较严格的应用时需要多次提示词Prompt。

本文更像是对于GPT4的使用手册而不是技术报告。

报告的官方链接如下：

码字不易，欢迎关注无神一起学习机器学习。

感谢一键三连，有问题欢迎评论区留言讨论补充。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/秋刀鱼在做梦/article/detail/810976