国内知名大模型推荐_国内主流大模型

作者：很楠不爱3 | 2024-04-06 01:51:40

踩

国内主流大模型

1 文心一言

地址：https://yiyan.baidu.com/

文心一言（英文名：ERNIE Bot）是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型，基于飞桨深度学习平台和文心知识增强大模型，持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。

2 通义千问

地址：https://tongyi.aliyun.com/

通义千问是阿里云推出的一款超大规模语言模型，它具备多种强大功能，包括多轮对话、文案创作、逻辑推理、多模态理解以及多语言支持。这个模型能够与人类进行多轮交互，并且能够理解多种形式的知识，包括文字、图像等。

3 盘古大模型

地址：https://www.huaweicloud.com/product/pangu.html

华为盘古大模型由CV，NLP，多模态，预测和科学计算5大基础模型组成，可实现文本生成、图片生成、代码生成、图片理解、气象预测、智能助手打造等多种功能。华为盘古大模型作为通用AI预训练模型，可以广泛应用于矿山、药物分子、铁路、气象、海浪、制造等领域，提供智能化的解决方案。

4 星火大模型

地址：https://xinghuo.xfyun.cn/

科大讯飞推出的新一代认知智能星火大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务，包括语言理解、知识问答、逻辑推理、数学题解答等。星火大模型从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。

5 ChatGLM-6B

地址：https://github.com/THUDM/ChatGLM-6B

ChatGLM-6B是清华大学推出的一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM)架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。

ChatGLM-6B使用了和ChatGPT 相似的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

6 字节跳动-云雀

地址：https://www.doubao.com/

字节跳动基于云雀大模型开发了一款生成式AI助手“豆包”。用户通过与豆包进行对话，可自动生成歌词、小说、文案等文本内容。每段回答除了文字外，也会由数字人豆包进行语音回答。

7 商量SenseChat

地址：https://chat.sensetime.com/wb/login

今年4月，商汤正式推出了商量SenseChat，是国内最早发布的千亿参数大语言模型之一。目前,它在语言、知识、理解、推理和学科五大能力上均处于行业领先水平,可以处理各类文本和信息,成为随身综合知识库、高效文本编辑器、数理计算器和简单易用的编程助手。据介绍, 商量SenseChat背后依托的是商汤人工智能大装置SenseCore，其上线GPU数量已由今年3月底的 27000块提升至30000块左右,算力规模提升了20%,达到6ExaFLOPS,能有效支持语言大模型的训练、升级迭代和服务。

8 混元大模型

地址：https://hunyuan.tencent.com/

腾讯云混元大模型是由腾讯研发的大语言模型，具备强大的中文创作能力，复杂语境下的逻辑推理能力，以及可靠的任务执行能力。腾讯混元大模型拥有超千亿参数规模，预训练语料超2万亿tokens，具有强大的中文理解与创作能力、逻辑推理能力，以及可靠的任务执行能力。

9 书生通用

地址：https://api.minimax.chat/

Minimax成立于2021年，由前商汤科技副总裁、通用智能技术负责人闫俊杰创立。自成立以来，Minimax在AI领域取得了显著的进展。该公司已经发布了包括文本到视觉、语音、文本三个基础模型架构，并推出了自主研发的通用大模型“ABAB”

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/很楠不爱3/article/detail/369122