当前位置:   article > 正文

国内知名大模型推荐_国内主流大模型

国内主流大模型

 1 文心一言

地址:https://yiyan.baidu.com/

文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。

2 通义千问

地址:https://tongyi.aliyun.com/

通义千问是阿里云推出的一款超大规模语言模型,它具备多种强大功能,包括多轮对话、文案创作、逻辑推理、多模态理解以及多语言支持。这个模型能够与人类进行多轮交互,并且能够理解多种形式的知识,包括文字、图像等。

3 盘古大模型

地址:https://www.huaweicloud.com/product/pangu.html

华为盘古大模型由CV,NLP,多模态,预测和科学计算5大基础模型组成,可实现文本生成、图片生成、代码生成、图片理解、气象预测、智能助手打造等多种功能。华为盘古大模型作为通用AI预训练模型,可以广泛应用于矿山、药物分子、铁路、气象、海浪、制造等领域,提供智能化的解决方案。

4 星火大模型

地址:https://xinghuo.xfyun.cn/

科大讯飞推出的新一代认知智能星火大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,包括语言理解、知识问答、逻辑推理、数学题解答等。星火大模型从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

5 ChatGLM-6B

地址:https://github.com/THUDM/ChatGLM-6B

ChatGLM-6B是清华大学推出的一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM)架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。

ChatGLM-6B使用了和ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

6 字节跳动-云雀

地址:https://www.doubao.com/

字节跳动基于云雀大模型开发了一款生成式AI助手“豆包”。用户通过与豆包进行对话,可自动生成歌词、小说、文案等文本内容。每段回答除了文字外,也会由数字人豆包进行语音回答。

7 商量SenseChat

地址:https://chat.sensetime.com/wb/login

今年4月,商汤正式推出了商量SenseChat,是国内最早发布的千亿参数大语言模型之一。目前,它在语言、知识、理解、推理和学科五大能力上均处于行业领先水平,可以处理各类文本和信息,成为随身综合知识库、高效文本编辑器、数理计算器和简单易用的编程助手。据介绍, 商量SenseChat背后依托的是商汤人工智能大装置SenseCore,其上线GPU数量已由今年3月底的 27000块提升至30000块左右,算力规模提升了20%,达到6ExaFLOPS,能有效支持语言大模型的训练、升级迭代和服务。

8 混元大模型

地址:https://hunyuan.tencent.com/

腾讯云混元大模型是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。

9 书生通用

地址:https://api.minimax.chat/

Minimax成立于2021年,由前商汤科技副总裁、通用智能技术负责人闫俊杰创立。自成立以来,Minimax在AI领域取得了显著的进展。该公司已经发布了包括文本到视觉、语音、文本三个基础模型架构,并推出了自主研发的通用大模型“ABAB”

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/369122
推荐阅读
相关标签
  

闽ICP备14008679号