当前位置:   article > 正文

通义千问更聪明了,阿里云要让大模型更好用_仟亿通问

仟亿通问

“为什么我家这个月的电费这么高”?可能很多人都有过类似经历,看到陌生的电力账单,拨打热线电话问询,被客服告知“耐心等待”,直到等到失去耐心……

查询电力账单,背后涉及电力行业多种复杂业务的关联逻辑。在线客服或者营业厅人员接到问询,一般需要转后台专业人员进行归因溯源,牵涉岗位多、流程长,要等上一段时间才能给出二次回复。这容易造成客户体验不佳,甚至引发投诉。

最近,一家名为朗新科技的公司用大模型做了个"电力账单解读智能助手",让大模型助手代为接待用户问询,把服务效率提升了50%以上,客户投诉减少了70%。

朗新科技是业内领先的能源科技企业,“电力账单解读智能助手”是其基于一站式大模型应用开发平台“阿里云百炼”成功开发的大模型原生应用。

2023年云栖大会上,阿里云正式对外发布这个平台,把阿里云与朗新等早期客户共同探索的大模型应用开发经验沉淀成工具模块,让企业和开发者用“拖拉拽”的方式就能便捷开发大模型应用。

千亿参数,通义千问更聪明了

朗新的智能助手,背后是朗新开发的电力行业专属大模型,而这个专属大模型的底座,则是阿里云的通义千问大模型。

作为基座模型的通义千问,自今年4月问世以来,已经进入电力、金融、医疗、法律等众多行业和领域,不断探索大模型落地的可能方案。

但基座模型本身也在不断进化,就在今年云栖大会上,阿里云正式将通义千问升级到2.0版本,模型参数规模达千亿级,模型规模和效果得到了全面提升,在10个权威测评中全面超越GPT-3.5和Llama2,加速追赶GPT-4。

相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。

为了充分理解这种进步,AI大模型工场进行了长达三个多小时的提问测试发现,经过全面升级的通义千问果然更加成熟且更好用。

它不仅知道"脆皮大学生"是什么梗,还能及时处理语言陷阱,分辨提问者口中的"吃豆腐"所代表的不同含义。

数学推理能力也得到了相当大的提升。大约五个月前,如果你问通义千问关于经典的"青蛙跳井"问题,它可能会算错。

但如今,它能够迅速识别陷阱,并快速给出答案。

轮到最喜闻乐见的写代码环节,前段时间有媒体测试时曾强调,通义千问虽然实现了按钮功能,但无法很好地完成整个代码的编写。

看下图,在短短几个月内,进化到2.0版本的通义千问已经能够相当优雅地实现了这个功能。

通义千问2.0在内容理解和生成方面快速进化。如果稍微掌握与大型模型对话的技巧,就能更好地实现预期效果。

同样是“张三差点没上上上上海的车”这道题,如果你的指令是“这句话是什么意思”,你得到的回答是这样的:

但如果你换个Prompt,通义千问2.0便可轻轻松松理解同一个中文词汇在不同语境中的含义。

通过更大的参数规模和先进的对齐技术,通义千问2.0模型实现了性能的巨大飞跃。

作为基础模型,通义千问官网已经上线了多模态和插件功能,支持图片输入、文档分析等细分任务。通义千问APP也在当天正式上线。

三分钟搭建一个新应用,谁心动了?

阿里云不仅要“好”的大模型,更要打造“好用”的大模型。阿里云不仅希望通义千问更好用,也想让所有的大模型变得更好用。

阿里云百炼平台就体现了这种“落地导向”的思路。平台集聚了数十款可被用户一键调用的大模型,除了通义系列大模型,还有为数众多的国内外优质三方模型。

“搭建大模型应用”这项原本是由专业人员来操作的任务,现如今不再需要专业程序员,普通企业和用户也能够直接上手。

按照官方介绍,阿里云百炼平台提供了模型选型、微调训练、安全套件、模型部署等服务,并提供全链路的应用开发工具。这些工具简化了底层算力部署、模型预训练、工具开发等复杂工作。

据AI大模型工场了解,阿里云百炼集成了国内外主流优质大模型,包括阿里云自研的通义系列大模型以及Llama2、Baichuan等三方模型,用户可一键选用模型进行二次训练,或者利用“拖拉拽”的方式进行应用开发。

为验证服务效果,AI大模型工场尝试搭建以下三种场景。

1.搭建新的应用:营销文案生成

进入阿里百炼平台后,用户可以从“应用广场”中挑选官方预置完整工程链路的应用或预置场景prompt的应用,目前预置的应用包括营销文案生成、营销标题生成、摘要抽取、文案润色等功能,用户只需要一键点击“创建应用”并进行测试即可。

如果预置的应用无法满足需求,用户也可以创建自己的应用,并利用通义系列大模型、官方出品的行业/场景大模型和第三方大模型等基础API进行开发。

AI大模型工场仅用了短短三分钟的时间,就成功从阿里云百炼平台调用了营销文案生成应用并进行了测试。我们让它角色扮演成一名专业的小红书爆款营销文案专家,以相机为主题,创作适用于小红书的文案,所得到的回答在格式和内容上都相当不错。

2.搭建新的插件:天气查询

除了搭建新的应用外,在阿里云百炼上还可以轻松添加API插件。假如,你要添加一个天气查询插件,只需要输入插件名称、选择调用接口、调用方式、接口地址以及相关参数,就能迅速生成一个插件。

插件就像是大模型的扩展部分,用户能够轻松地创建插件,这意味着大模型不再只是单一个体,就像钢铁侠拥有机械臂一样,变得更加强大。

3.训练专属模型:条件筛选

最后来看看最具吸引力的专属模型训练结果。

也不过短短半个小时的时间,AI大模型工场利用少量训练数据打造出一款关于“条件筛选”的大模型。虽然数据样本有限,但整个过程中体验到了阿里云百炼平台对普通用户的友好度。

在训练过程中,只需要按照平台指引,选择训练类型、模型、数据等参数,即可自动完成训练,操作简单易行。当然,不可否认的是,训练的成果与用户“投喂”的数据量和数据质量有极大关系。

去魅后的大模型赛道进入下半场竞争,应用层已经成为大厂角逐的主赛场。置身AIGC时代,各行各业都在积极拥抱大模型。

大模型重构千行万业已然成为一种趋势。而阿里云百炼平台的出现,无疑极大地降低了应用开发门槛,为企业打赢存量之战提供了充足弹药。

体验百炼后,我们的感受是,对开发者而言,借助阿里云百炼平台开发大模型应用以及搭建企业专属模型,很有效率。

我们分析,对阿里云来说,布局大模型一站式服务平台“阿里云百炼”背后有着更深层次的商业考量。阿里云的主攻方向是B端客户,通过打造大模型“智能工厂”,满足各行业企业对大模型的需求,阿里云最想成为“卖铲子的人”。

AIGC时代

阿里云想在大模型领域打造一个“淘宝”

阿里云的野心从来都不仅局限于“大模型”本身。

充分迎接AIGC浪潮,阿里云一方面在利用大模型重构自身,另一方面则是在大模型领域打造一个“淘宝”平台,构建大模型自由市场。

开放是打造大模型“淘宝”平台的基础。按阿里巴巴集团董事会主席蔡崇信的话说:“不开放就没有生态,没有生态就没有未来。”

今年7月,阿里云表态把“促进中国大模型生态的繁荣”作为首要目标,8月起就先后开源了通义千问7B和14B参数等多款模型。到了今天,在云栖大会现场,阿里云又预告,即将开源72B(720亿)参数的通义千问。看来阿里云这是要将开源开放进行到底了。

除了是国内大模型开源领域的领头羊,阿里云还在国内首倡“模型即服务”(MaaS)理念,并推动MaaS落地。

魔搭社区ModelScope是阿里云践行MaaS理念的重要探索,在去年云栖大会发布,短短一年时间,魔搭社区已经聚集了280万开发者和2300多个优质模型,模型下载量更是突破1亿次,成为国内规模最大、开发者最活跃的AI社区。

回到阿里云百炼,这无疑是MaaS理念的又一个具体实践。业界普遍认为,一站式的极简技术栈,有望成为未来大模型应用开发和部署的首选。

生成式大模型正在开创全新的时代,而阿里云或将可以凭借一朵AI时代最开放的云,迎来更广阔的未来。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/758677
推荐阅读
相关标签
  

闽ICP备14008679号