当前位置:   article > 正文

国内大语言模型汇总

国内大语言模型

ChatGPT大火后,国内也掀起生成式AI热潮。

国产AI模型的前景非常广阔。随着中国国家战略的推动,中国的人工智能领域正在迅速发展。在这个领域中,中国公司和研究机构都在积极投入研发,并取得了一些重大的进展。

接下来,我们看一下已经开启内测的国产大语言模型,有哪些。

一、魔塔社区:阿里达摩院推出的AI模型社区,超过300+开源AI模型

汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。发现、学习、定制和分享心仪的模型。

阿里达摩院先后发布多个版本大模型,3月,阿里在“魔搭”上线了“文本到视频生成扩散模型”,实现视频生成功能。该模型由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿,扩散结构采用典型的U-Net网络架构,通过反向扩散过程,实现视频生成的功能。

内测地址:https://www.modelscope.cn/home

二、阿里巴巴通义千问,4月7日亮相

4月7日,阿里在A大模型领域的研究成果终于亮相,阿里云宣布自研大模型通义千间”开始邀请用户测试体验,这也是继百度的文心一言之后国内又一家巨头启动AI大模型邀测。

通义千问的官网是http://tongyialyun.com,打开网址后,可以看到它的自我介绍:“我是通义千间,一个专门响应人类指今的大模型。我服务于人类,致力于让生活更美好。我是效率助手,也是点子生成机”。

内侧地址:https://tongyi.aliyun.com/

三、百度,文心一言,3月16日开启内测

百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。

文心一言,百度全新一代知识增强大语言模型。能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。

文心一言,国内最早内测的大厂大语言模型产品。这得益于百度2016年开始ALL IN AI,有了不少积累。

内测地址:https://yiyan.baidu.com/

四、悟道,智源“悟道”大模型

智源“悟道”大模型,中国首个+世界最大人工智能大模型标签:AI训练模型

2021年6月,北京智源研究院(BAA)推出了悟道1.0的后续版本道2.0,作为中国第一个超大规模智能模型系统。悟道是一个语言模型,旨在在人类层面的思维上超越 OpenAl 的 GPT-3 和歌的 LaMDA,经过4.9TB的图像和文本训练,并在9个基准上超过了最先进SOTA)水平,悟道比任何同行都更接近于实现通用人工智能 (AGI) 和人类水平的思维。

悟道接受了4.9 TB高质量英文和中文图像和文本的训练:

。1.2TB中文文本数据

。2.5TB中文图形数据

。1.2TB英文文本数据

悟道是基于开源的 MoE 系统 FastMoE 进行训练的。MoE是一种机器学习技术,其工作原理如下:将测建道任务划分为子任务,针对每个子/条训练专家学习者)模型,开发门控模型,该门控模型基于要预测的输入来学习咨询哪个专家,并组合预测FastME使悟道够并行咨询不同的专家型,并切换到/预测结果最好的道型,口,如果输入是英文文本,悟道将使用预测懂型,该模型可以在英文文本中生成回应。

测试地址:https://www.baai.ac.cn/portal/article/index/cid/49/id/518.html

五、微信,WeLM,2022年7月推出

微信的AI产品,叫做WeLM (WeChat Language Model) 。官网介绍WeLM 提供续写功能,但并不具有原生对话能力,WeLM 是一个非常擅长理解和生成文本的通用语言模型。你可以通过调用 WeLM 的API 解决多种多样涉及文本的任务其实这并不是腾讯的混元大语言模型,而是微信推出的一个生成式AI。

腾讯很低调,至今未有类ChatGPT的消息。

这里,先让微信的WeLM占位。

WeLM 是微信推出的一个非常擅长理解和生成文本的通用语言模型。

你可以通过调用 WeLM 的 API 解决多种多样涉及文本的任务。

微信 AI 官网地址:

https://welm.weixin.qq.com/docs/

微信 AI 对话体验地址:

https://welm.weixin.gq.com/docs/playground/

六、商汤,商量,4月10日开启内测

商量(SenseChat),是商汤科技旗下的中文语言大模型应用平台。

商量支持多轮对话和超长文本的理解能力。

包括编程助手,可帮助开发者更高效地编写和调试代码。

健康咨询助手,为用户提供个性化的医疗建议。

PDF文件阅读助手,能轻松从复杂文档中提取和概括信息等。

内测地址:https://chat.sensetime.com/wb/

七、360,360智脑,4月16日开启内测

360智脑是360公司开发的大语言模型。

它利用了深度学习技术,可以帮助企业更好地理解用户需求,提升用户体验。

360智脑的五大核心能力是感知、学习、推理、决策、预测。

可以帮助企业实现智能化管理,从而提高工作效率和降低成本。

内测地址:https://www.so.com/zt/invite.html#/

八、昆仑万维,天工,4月17日开启内测

天工是由昆仑万维和奇点智源合作自研的大语言模型。

天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。该模型由昆仑万维与奇点智源联合研发,是国内首个对标 hatGPT 的双千亿大语言模型,

可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。

内测地址:https://tiangong.kunlun.com/

九、清华0penBMB

清华团队支持发起的大规模预训练语言模型库与相关工具

0penBMB全称为Open lab for Big Model Base,首在打造大规模预训练语言模型库与相关丁具,加读百7级以大模型的训练、微调与推理。降低大增型使用门槛,与国内外开发者共同努力形成大模型开源社区,推动大模型生态发展,实现大模型的标准化、普及化和实用化,让大模型飞入千家万户

OpenBMB开源社区由清华大学自然语言处理实验室和智源研究院语言大模型加速技术创新中心共同支持发起,发起团队拥有深厚的自然语言处理和预训练模型研究基础,近年来围绕模型预训练、提示微调、模型压缩技术等方面在顶级国际会议上发表了数十篇高水平论文。

内测地址:https://www.openbmb.org/home

十、科大讯飞,讯飞星火认知大模型,5月6日开启内测

科大星火,是科大讯飞的大语言模型。

讯飞星火认知大模型:是科大讯飞于2023年5月6日在讯飞星火认知大模型成果发布会上发布的类ChatGT产品。讯飞星火认知大模型是以中文为核心的新

代认知智能大模型拥有跨领域的识和语言理解能力,能够基于自然对活方式理解与执行务,从海量数据和大规规模知识中持续进化,实现从提出、规划到

解决问题的全流程闭环。

只需一个指令:懂你所言,答你所问,创你所需,解你所难,学你所教。

内测地址:https://xinghuo.xfyun.cn/

复旦大学,MOSS,4月21日新版测试

MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型。

MOSS是复旦大学团队开发的国内第一个发布的对话式大型语言模型,今年2月邀公众参与内测。它可以执行对活生成、编程、事实间答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路。4月21日,新版MOSS模型正式上线并宣布开源。

MOSS由邱锡鹏教授团队发布,2023年2月21日,邀公众参与内测。

2023年4月,复旦MOSS升级版开源上线。

内测地址:https://moss.fastnlp.top/

知乎,知海图AI,4月13日开启内测

知海图AI,是知乎和面壁科技合作发布的中文大模型。

由知乎和面壁科技合作的推出。

作为一个在toC内容平台上线的大语言模型项目,“知海图AI”是基于清华NLP实验室和面壁智能CPM-Bee(10B)模型的技术支撑。按照官方的说法,针对知乎热榜问题中的所有回答,在“热榜摘要”这个特定场景中将“知海图AI”大模型的效果与GPT-4进行比较发现,两个模型的表现几乎持平。

内测地址:公司内部测试,暂无地址

盘古大模型,4月8号发布

盘古大模型是业内首个千亿参数的中文大模型,拥有1100亿密集参数,经过40TB的海量数据训练而成。同时也通过多任务prompt等技术延伸出10亿参数、性能更好的落地版本,极大地加速了AI的商业应用效率和泛化能力;
盘古大模型的算法由循环智能主导和清华大学、华为的算法团队联合攻关,在预训练阶段引入基于Prompt的任务等多项创新方案,成功突破了大模型微调的难题。

中文优化:盘古大模型使用了大量的中文语料库进行训练,可以更好地理解中文语言的语法和语义,从而提高模型的准确度和质量。技术支持: 盘古大模型融入了华为在5G、云计算、物联网等领域的技术优势,可以更好地应用于这些领域的实际场景,为华为提供强有力的技术支持。应用广泛:盘古大模型可以应用于智能客服、机器翻译、语音识别等多个领域,为这些领域提供更加智能化的技术支持。

超大规模: 盘古大模型拥有超过1千亿个参数,是目前世界上最大的中文AI模型之一,可以支持多种自然语言外理任务,包括文本生成、文本分类、问答系统等等。可扩展性:盘古大模型采用了分布式计算技术,可以实现模型的在线训练和增量学习,可以随着数据量的增加不断优化模型,提高模型的准确度和质量。

内测地址:公司内部测试,暂无地址

腾讯混元、网易玉言、京东ChatJD等,还未对外发布和开启内测,还正在路上。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/1004467
推荐阅读
相关标签
  

闽ICP备14008679号