赞
踩
24年被称为大模型智能体(AI Agent)应用元年,自从前段时间的百模大战,各头部大厂的AI智能体平台也是功能越发完善,百花齐放
字节跳动的“扣子”,以其独特的魅力和创意,为用户带来了前所未有的互动体验。
百度的“千帆”,正以其强大的搜索和智能分析能力,引领着智能体技术的新潮流。
阿里云的“百炼”,经过千锤百炼,展现出了超凡的稳定性和可靠性。
腾讯云的“元器”,以其强大的社交基因和用户基础,打造出了连接亿万用户的智能桥梁。
科大讯飞的“星火”,更是以其卓越的语音识别技术和智能体平台标准评测的通过,被誉为行业的领跑者。
接下来我们就逐一来介绍下各家模型,看看这盛世吧!
简介
Moonshot AI是一家专注于通用人工智能领域的创新型企业,其核心产品Kimi智能助手搭载了先进的语言模型——moonshot-v1。该模型专门训练用于处理和理解自然语言及书面语言,能够根据用户的输入生成相应的文本输出。moonshot-v1的应用范围极为广泛,包括但不限于内容创作、代码生成、文本摘要、对话系统以及创意写作等。
开发团队
月之暗面科技有限公司汇聚了一批来自顶尖学府和全球知名AI研究机构的杰出人才。公司由杨植麟创立,他不仅拥有清华大学计算机科学与技术系本科学位和卡内基梅隆大学语言技术研究所博士学位,还在学术界和工业界均有卓越成就。杨植麟曾与多位图灵奖得主合作,并在Facebook AI Research和Google Brain等机构担任要职。
联合创始人周昕宇和吴育昕同样毕业于清华大学,他们在人工智能领域积累了丰富的经验。周昕宇曾在旷视科技从事算法量产研究,而吴育昕则在Meta的人工智能研究院工作。这个年轻而充满活力的团队,以其专业和热情,致力于开发面向消费者的AI产品,尤其是推出了能够处理高达20万汉字输入的Kimi AI,展现出与众不同的创新精神和追求。
模型列表
Moonshot AI目前支持以下模型,以满足不同长度文本生成的需求:
moonshot-v1-8k:适用于生成短文本的模型,最大上下文长度为8k。
moonshot-v1-32k:适用于生成长文本的模型,最大上下文长度为32k。
moonshot-v1-128k:适用于生成超长文本的模型,最大上下文长度为128k。
这些模型在效果上差异不大,主要区别在于它们能够处理的最大上下文长度,用户可以根据自己的需求选择最合适的模型进行文本生成任务。
产品定价
模型 | 计费单位 | 价格 |
moonshot-v1-8k | 1M tokens | ¥12.00 |
moonshot-v1-32k | 1M tokens | ¥24.00 |
moonshot-v1-128k | 1M tokens | ¥60.00 |
此处 1M = 1,000,000,表格中的价格代表每消耗 1M tokens 的价格。
以上模型的区别在于它们的最大上下文长度,这个长度包括了输入消息和生成的输出,在效果上并没有什么区别。
收费接口说明
Chat Completion 接口收费:按照实际输入输出 tokens 的消耗计费
文件相关接口(文件内容抽取/文件存储)接口限时免费
豆包大模型(字节)
简介
豆包大模型,字节跳动推出的自研大模型。通过字节跳动内部50+业务场景实践验证,每日千亿级tokens大使用量持续打磨,提供多模态能力,以优质模型效果为企业打造丰富的业务体验。
开发团队
豆包大模型开发团队是字节跳动公司旗下的一个团队,成立于 2023 年。该团队致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。团队在 AI 领域拥有长期愿景与决心,研究方向涵盖 NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等 50+业务,并通过火山引擎开放给企业客户。
字节跳动公司提供的模型相关服务除了豆包外,还包括扣子、即梦、火山方舟2.0等,这些产品共同构成了字节跳动在AI领域的全栈服务,主要对比如下:
豆包大模型
定义:豆包大模型是字节跳动推出的多模态模型家族,包括通用模型Pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等九款模型。
官网定义:豆包是你的多功能AI助手,为你的生活、学习、工作提供帮助,为你搜索信息,答疑解惑,分析总结,提供灵感,辅助创作。
主要功能:提供AI对话助手、AI创作工具、AI应用开发平台等。
应用场景:广泛应用于抖音、飞书、巨量引擎等业务板块,提升效率和优化产品体验。
面向客户群体:企业用户,特别是需要智能客服、智能推荐、智能搜索等服务的行业。
优势:日均处理1200亿Tokens文本,生成3000万张图片,具有强大的处理能力和成本优势。
扣子AI应用开发平台
定义:扣子(coze)是字节跳动推出的新一代AI应用开发平台,具备低门槛、个性化、实时性、多模态等优势。
官网定义:无论你是否有编程基础,都可以在扣子上快速搭建各类Bot,并发布到各类社交平台、通讯软件或部署到网站等其他渠道。
主要功能:提供AI应用开发平台,集合海量的AI资源、丰富的发布渠道、一键自定义API服务。工作流支持通过可视化的方式,对插件、大语言模型、代码块等功能进行组合,从而实现复杂、稳定的业务流程编排,例如旅行规划、报告分析等。
当目标任务场景包含较多的步骤,且对输出结果的准确性、格式有严格要求时,适合配置工作流来实现。
应用场景:适用于智能体创新,驱动业务增长,已在招商银行、海底捞火锅等企业搭建智能体。
面向客户群体:AI应用开发者,特别是需要快速开发AI应用的企业和开发者。
优势:提供企业级SLA和多种高级特性,使AI应用更易落地。
即梦AI创作工具
定义:即梦是基于豆包大模型的AI创作工具,专注于图片和视频生成。
主要功能:提供AI创作工具,以图片和视频生成为核心卖点。
应用场景:适用于艺术创作、视频制作等领域,提升创作效率和作品质量。
面向客户群体:创作者、设计师、视频制作者等需要AI辅助创作的人群。
优势:在图片生成方面已经达到了不错的水准,视频生成方面仍有待优化,但潜力巨大。
火山方舟2.0
定义:火山方舟是字节跳动推出的AI大模型服务平台,提供模型即服务(MaaS)。
主要功能:与大模型生产方合作,提供优选的大模型服务,支持企业同步试用多个大模型。
应用场景:适用于金融、汽车、智能终端、电商零售、教育科研等多个行业。
面向客户群体:企业客户,特别是需要大模型服务进行智能化转型和升级的企业。
优势:提供充沛的GPU算力资源、分钟级千卡扩缩容的超强弹性、多维度的安全防护。
模型列表及定价
百度文心
简介
文心大模型是由百度研发的产业级知识增强大模型,它基于飞桨深度学习平台,通过知识增强技术,实现了对海量数据的深度理解和生成能力。文心大模型不仅涵盖了自然语言处理、视觉、跨模态等多个领域,还通过持续学习和优化,大幅提升了模型的零样本/小样本学习能力。
这里要特别说下百度智能云千帆,它是一个一站式企业级大模型平台,提供大模型开发全流程工具链和整套环境,支持企业高效率、低成本地开发和部署大模型应用。相比之下,文心系列模型是百度自研的一系列大模型,包括文心一言、文心一格、ERNIE等,涵盖了自然语言处理、图像生成等多个领域。
文心智能体平台
https://actions.baidu.com/lingjing/agents/action/agent-introduce
文心智能体平台是百度推出的基于文心大模型的智能体(Agent)平台,支持广大开发者根据自身行业领域、应用场景,选取不同类型的开发方式,打造大模型时代的产品能力。开发者可以通过 prompt 编排的方式低成本开发智能体(Agent),同时,文心智能体平台还将为智能体(Agent)开发者提供相应的流量分发路径,完成商业闭环,包括:
零代码智能体: 通过 prompt 编辑的方式,表达意图、提供行为说明,引入数据集、工具等能力,创建智能体。
低代码智能体: 通过拖拽方式快捷搭建业务流,结合大模型、数据集、工具等组件,完成智能体开发。
百度智能云千帆
https://cloud.baidu.com/doc/WENXINWORKSHOP/s/Slfmc9dds#%E4%BA%A7%E5%93%81%E5%AE%9A%E4%B9%89
百度智能云千帆大模型平台是面向企业开发者的一站式大模型开发及服务运行平台。千帆不仅提供了包括文心一言底层模型和第三方开源大模型,还提供了各种AI开发工具和整套开发环境,方便客户轻松使用和开发大模型应用。
支持数据管理、自动化模型SFT以及推理服务云端部署的一站式大模型定制服务,助力各行业的生成式AI应用需求落地。
开发团队
文心大模型由百度团队开发,专注于预训练大模型基础技术的研究和应用,在NLP、多模态等领域取得显著成果。团队推出了ERNIE系列模型,包括ERNIE 1.0至4.0等多个版本,以及文心一言(ERNIE-Bot)、ERNIE-M等多模态大模型,并在多项权威榜单上登顶榜首。团队成员由人工智能、计算机科学等领域的博士、硕士研究生组成,具备深厚的算法实现能力和对NLP前沿技术的了解。
模型列表
产品定价
混元大模型
简介
腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。腾讯混元通过采用混合专家模型(MoE)结构,推动了性能提升和推理成本下降。在中文表现尤其是文本生成、数理逻辑和多轮对话上性能表现卓越,整体处于业界领先水平。目前最大支持256K上下文;在长文输入场景,大海捞针指标达到99.9%。
除了混元,腾讯还提供了元宝与元器系列。总结来说,腾讯元宝主要面向消费者,提供直接的AI服务体验;腾讯元器则面向开发者和企业,提供智能体的创建和分发平台;而腾讯混元大模型是腾讯自研的AI技术基础,为元宝和元器等产品提供技术支持。
产品名称 | 定义 | 主要功能 | 应用场景 |
腾讯元宝 | 基于混元大模型的面向消费者端的AI助手 | AI搜索、AI解析、AI写作等 | 工作效率场景、日常生活场景 |
腾讯元器 | AI智能体创作与开发平台 | 智能体商店、低代码开发、工作流模式等 | 客服、教育、娱乐等业务场景 |
腾讯混元 | 腾讯研发的大语言模型 | 文本生成、图像创作、多轮对话等 | 文档创作、会议场景、广告场景等 |
开发团队
混元大模型由腾讯的混元大模型团队开发,该团队由顶尖的AI科学家、工程师和研究员组成,致力于深度学习、自然语言处理、计算机视觉等领域的研究与创新,旨在打造世界一流的智能模型。团队成员拥有丰富的学术背景和实战经验,在多个国际顶级会议上发表过重要论文,并多次获得相关竞赛的冠军。
产品定价
混元生文:
混元生图:
通义千问(阿里)
简介
通义千问是由阿里云自主研发的大语言模型,用于理解和分析用户输入的自然语言,在不同领域、任务内为用户提供服务和帮助。通义家族提供的能力包括:
产品名称 | 功能 | 应用场景 |
千问大语言模型 | 多轮对话、文案创作、逻辑推理、多模态理解、多语言支持 | 属于基础的模型服务 应用于:智能客服、智能推荐、智能搜索、自然语言处理、机器翻译、文本生成、对话系统、知识图谱、智能写作等领域 |
千问VL | 支持中英文等多种语言的视觉语言(Vision Language, VL)模型,具备图文识别、描述、问答及对话能力,新增视觉定位、图像中文字理解等能力 | 属于基础的模型服务 应用于:知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等多种场景 |
阿里云百炼 | 多样的大模型接入、丰富的全链路模型工具、开放的插件集成能力、灵活的应用编排能力、高效的专属模型构建、完善的安全保障能力 | 属于模型工具 可应用于:智能客服、智能营销、研报分析、智能创作、店铺经营、一网通办助手等 |
通义晓蜜 | 对话机器人、智能坐席助理、多模态智能联络中心 | 行业级模型应用 应用于:客服中心、销售团队、企业服务中心 |
通义星尘 | 角色创造、场景设定、对话互动 | 行业级模型应用 应用于:IP复刻、恋爱交友、萌宠养成、游戏NPC、教育服务 |
通义万相 | 文生图、相似图生成、风格迁移 | 行业级模型应用 应用于:艺术设计、游戏和文创等 |
通义听悟 | 实时语音识别、音视频语音识别、发言人角色区分、内容规整、章节速览、一键笔记、全文总结、提取PPT等 | 行业级模型应用 应用于:会议交流、教学培训、调研访谈、音视频理解与问答等 |
通义智文 | 网页阅读、论文阅读、图书阅读和自由阅读等多种阅读场景的智能解析与摘要 | 行业级模型应用 应用于:网页资讯、学术论文、电子图书、自由文本的阅读支持 |
通义法睿 | 智能法律咨询、文书自动生成、法律资料检索、文本分析与摘要、案情案件推理、裁判文书撰写 | 行业级模型应用 应用于:法律专业人士、法律服务需求者、法律学习者和学生、企业法务部门、政府和公共机构 |
开发团队
通义千问的研发团队隶属于阿里云,汇集了自然语言处理、深度学习、计算机科学等领域的顶尖专家。该团队专注于研发超大规模预训练语言模型,如Qwen系列,具备多轮对话、文案创作、逻辑推理等高级能力。他们不仅技术实力雄厚,推动了从320亿到1100亿参数模型的开源,还展现出了卓越的创新能力和前沿技术水平。
产品定价
智谱GLM
简介
GLM 全名 General Language Model ,是一款基于自回归填空的预训练语言模型。ChatGLM 系列模型,支持相对复杂的自然语言指令,并且能够解决困难的推理类问题。该模型配备了易于使用的 API 接口,允许开发者轻松将其融入各类应用,广泛应用于智能客服、虚拟主播、聊天机器人等诸多领域。
开发团队
智谱GLM模型的研发团队是一支来自清华大学计算机系知识工程实验室(KEG)的顶尖团队,以CEO张鹏为核心。团队成员具备丰富的技术背景和专业知识,包括中国工程院高文院士的弟子、智谱华章董事长刘德兵,以及清华创新领军博士、公司总裁王绍兰等。该团队专注于大规模预训练模型的研究与开发,推出了GLM大模型,并在人工智能领域取得了显著成果。他们致力于将先进的AI技术应用于实际场景,不断推动公司在政务服务、企业服务等领域的技术创新和应用落地。
模型列表及定价
天工大模型
简介
天工大模型是昆仑万维自研的双千亿级大语言模型。天工大模型能够满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多样化需求。该模型通过了第一轮算法工程师面试,展示了其对编程语言和包括中文在内的自然语言的理解能力。天工大模型还具备强大的自然语言处理和智能交互能力,能够实现个性化AI搜索、智能问答、聊天互动、文本生成等多种应用场景。
开发团队
天工AI开发团队是由昆仑万维与国内领先的AI团队奇点智源联合研发的。昆仑万维成立于2008年,专注于游戏、社交媒体和电子商务等领域。2023年,昆仑万维与奇点智源正式达成全面技术合作,共同研发了天工AI助手,具有强大的自然语言处理和智能交互能力。此外,天工AI开发团队还包括一些知名的科研人员,例如颜水成教授,他是计算机视觉和机器学习领域的国际顶级专家,加入了昆仑万维,并与昆仑万维创始人周亚辉一起出任天工智能联席CEO,并兼任昆仑万维2050全球研究院院长。
模型列表及定价
讯飞星火大模型
简介
讯飞星火大模型,拥有跨领域的知识和语言理解能力,完成问答对话和文学创作等任务。持续从海量文本数据和大规模语法知识中学习进化,实现从提出问题、规划问题到解决问题的全流程闭环。
开发团队
讯飞星火大模型由科大讯飞旗下的一支专注于人工智能技术研发的精英团队开发。该团队由一群具有丰富经验的科学家、工程师和技术人员组成,他们在人工智能、深度学习、自然语言处理等领域拥有深厚的专业知识和实践经验。团队成员致力于研究和开发先进的人工智能技术,以推动智能语音识别、机器翻译、智能对话系统等领域的发展。
模型列表及定价
商量大语言模型
简介
商量大模型,全名SenseChat,是商汤科技研发的一款中文语言大模型应用平台。这款模型于2023年4月10日在商汤科技的技术交流日活动中首次被公开。商量大模型的基模型是商汤联合国内多家科研机构发布的“书生·浦语InternLM-123B”,它拥有1230亿参数,并在全球知名评测集共计30万道问题集合上的测试总成绩中排名第二。
开发团队
商量大模型是由商汤科技开发的。商汤科技是一家全球领先的人工智能公司,致力于推进原创技术研究,不断增强行业领先的多模态、多任务通用人工智能能力,涵盖感知智能、自然语言处理、决策智能、智能内容生成等关键技术领域,同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。
Yi-Large模型
简介
Yi-Large是零一万物科技有限公司开发的千亿参数闭源模型,由李开复领导。该模型在多项评测中表现优异,包括在斯坦福的AlpacaEval 2.0全球大模型排行榜上Win Rate排名第一,以及在SuperCLUE的四月基准表现中中文能力排名第一。此外,Yi-Large模型在通用能力、代码生成、指令遵循等方面也展现出了强大的性能,稳居全球第一梯队大模型。
开发团队
Yi-Large大语言模型是由零一万物科技有限公司(01.AI)的研发团队共同开发的。这个团队的特点在于其多样性和专业性,团队成员来自全球各地,拥有不同的文化背景和专业技能。他们在大模型技术、自然语言处理、机器学习、系统架构、数据安全和产品创新等领域都有深厚的经验和专业知识。
团队的领导者是李开复博士,他是人工智能领域的先驱和专家,拥有超过四十年的行业经验。在他的领导下,团队致力于推动人工智能技术的发展,并通过开源项目和合作,与全球的开发者和研究人员共享技术成果。
MiniMax大模型
简介
MiniMax是国内领先的拥有文本、语音、视觉三模态融合的千亿参数语言大模型,并打通产品全链路的创业公司。通过搭建超大规模实验平台与推理平台,跑通技术与产品的迭代闭环,实现模型能力与用户交互量的极速增长。
开发团队
MiniMax 成立于 2021 年 12 月,是领先的通用人工智能科技公司,致力于与用户共创智能。MiniMax的开发团队由一群对人工智能充满热情的专家组成,他们拥有丰富的行业经验和深厚的技术背景。团队成员包括数据科学家、软件工程师、语言学家和机器学习专家等,他们共同协作,致力于模型的优化和创新。
模型列表及定价
阶跃大模型
介绍
当前阶跃星辰已推出step-1和step-2预览版两大系列文本大模型:千亿参数经典大模型step-1和万亿参数MoE架构大模型。能够处理各种复杂的语言任务。无论是文本创作、跨语种交流,还是解答问题、逻辑推理等,它都能提高使用者工作效率。此外,该系列模型还具备出色的数学和代码能力,在科学计算、程序开发等领域也能发挥重要作用。
开发团队
阶跃星辰是一家专注于研发通用大模型的初创公司。在2024年3月的全球开发者先锋大会上,他们首次发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型以及Step-2万亿参数MoE语言大模型预览版。这个团队由大约150人组成,核心成员包括创始人兼CEO姜大昕、系统负责人朱亦博和数据负责人焦斌星。他们在AI领域拥有丰富的研究和实践经验,致力于推动AI技术的发展。
模型列表及定价
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
保证100%免费
】Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。