赞
踩
ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。
全球 | 最新消息 | 内容总结 | 同类产品重点关注公司 |
国内 | ①1月30日,有消息称国内互联网巨头百度将于3月在中国推出类似ChatGPT的人工智能聊天机器人,再次掀起公众对AI聊天机器人的关注热潮。 | 国内的互联网科技公司正在逐步关注到该技术,目前未能查询到该技术在国内任何一家公司有合作意愿,国内一些有自主创新能力的公司已开始布局相关类似产品,后期持续跟进。 | 百度、科大讯飞、汉王科技、海天瑞声、拓尔思、云从科技、腾讯 |
国外 | ①一项调查显示,截止2023年1月,美国89%的大学生都是用ChatGPT做作业。 | 经查询从22年年底兴起的新技术CHATGPT在国外的实际落地项目暂未找到,国外3家互联网科技公司对此技术进行相关应用,另外该技术在国外的评价褒贬不一,特别是在教育行业受到很大的抵制,后期持续跟进。 | 微软、亚马逊、谷歌 |
ChatGPT 是基于 GPT-3 模型构建的。GPT 是 Generative Pretrained Transformer(生成预训练变换器)的缩写,它是openAI推出的一种用于处理自然语言文本大型神经网络模型,GPT-3 是它的最新版本。
GPT-3 模型包含大量的语言数据,能够理解语言的语法和语义。当用户输入问题时,ChatGPT 会将问题转换为计算机能够理解的数据,并使用 GPT-3 模型进行处理。GPT-3 模型会根据语言数据,生成一个回答候选集,并从中选择一个最佳回答。最终,ChatGPT 会将生成的回答以自然语言NLP的形式返回给用户。
如此复杂的模型是怎么训练的呢?简单来说是 RLHF(从人类反馈中强化学习),分三步:
1.收集提示信息(prompt)和人工形成的任务示例(demonstration),并用监督学习方法训练模型。
2. 将初始模型用在新的对比数据上,生成多个输出,人工对这些输出进行排序,排序结果用于训练奖励模型。
3.使用PPO(Proximal Policy Optimization)强化学习算法训练奖励模型。
总结起来ChatGPT(对话GPT)其实就是InstructGPT(指令式GPT)的同源模型,然后指令式GPT就是基于GPT-3,先通过人工标注方式训练出强化学习的冷启动模型与reward反馈模型,最后通过强化学习的方式学习出对话友好型的ChatGPT模型。如下是论文中相应对话友好型的定量结果(其中PPO-ptx曲线就是InstructGPT模型),可以看到在回答友好型上InstructGPT是远超原始GPT的。
作为聊天机器人:ChatGPT可用于创建能与用户进行对话的聊天机器人。这可能对客户服务很有帮助,因为其可以提供信息,或者只是为了好玩。(应用领域:搜索引擎)
作为一个问答系统:ChatGPT可以进行微调,以回答特定类型的问题,例如与特定领域或主题相关的问题。这对于创建虚拟助手或其他类型的信息提供系统很有帮助。(应用领域:智能助手)
作为对话代理:ChatGPT可以用于创建与用户进行对话的虚拟代理或虚拟化身。这可能对社交媒体应用程序、游戏或其他类型的在线平台很有帮助。(应用领域:智能管理)
作为文本生成工具:ChatGPT可用于根据输入数据生成类似人类的文本响应。这对于为社交媒体、网站或其他应用程序创建内容很有帮助。(应用领域:报告编撰)
总结起来:chatGPT在金融领域可以在智能助手、智能搜索、智能问答以及智能编撰等领域均可实现应用。
网上对此技术的兴起褒贬不一,主要是因为它功能的强大对某些领域产生巨大的冲击,最终导致人类越来越依赖于AI技术,自主思考的能力交给了人工智能来完成,当然该技术在NLP领域是一项里程碑的事件。
区域限制:因国内网络限制的原因暂时无法亲身体验该此项技术,无法做出中肯定的评价,官网地址:https://www.chatgtp.com/,国内手机号没有权限注册试用。
资源投入:GPT-3有1750亿参数,45TB的训练数据,1200万美元费用用于模型训练,训练所用设备包括285000个CPU和10000个GPU,训练模型中两大鸿沟有训练数据的搜集和设备的维护
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。