赞
踩
生成式人工智能(AI)是近年来迅速发展的一个领域,它主要基于监督学习技术。在2010到2020年间,大规模监督学习技术的发展为现代AI技术奠定了基础。生成式AI通过预测下一个词语来生成文本,例如在输入“i like”后,模型会预测“like”之后的词语,可能是“beauty”或“eating”,然后再预测“eating”后的词语如“food”,通过这种方式不断生成新的文本内容。这一过程需要依赖于庞大的词汇数据库,通常达到千亿甚至万亿级别。
大语言模型(LLM)不仅可以用来生成故事或修改文本,而且在网络搜索和提供策略建议方面也非常有用。与传统的网络搜索不同,LLM能够生成连贯的内容和建议,但同时也可能产生错误信息,因此使用时需要仔细甄别信息的准确性。
人工智能是一种通用技术,应用范围非常广泛。目前,人工智能应用可以通过基于网络的界面进行交互(如下方左图),或者将LLM集成到更大的软件程序中以实现自动化(如下方右图)。这些应用不仅限于特定领域,而是遍及多个行业和场景,展示了AI技术的多样性和灵活性。
使用LLM进行文本检查和总结:LLM可以被用来检查文本中的错误和总结长句,这对于处理大量的文本信息非常有帮助。例如,在客服领域,当需要传递大量信息给决策管理层时,可以利用LLM快速总结关键信息,提高信息传递的效率和准确性。
LLM在信息分类和语义分析中的应用:LLM还可以进行语义分析,帮助企业将邮箱、客户留言等外部信息有效地分类并传递给相关部门。这种应用不仅提高了信息处理的速度,也增强了信息处理的相关性和准确性。
构建和优化LLM模型:要构建一个能够有效处理信息的LLM模型,首先需要设置合适的提示词(prompt)。例如,可以设置LLM阅读邮件并将邮件分类给相关部门的任务。如果在实际应用中出现了如分配到不存在的部门的问题,可以通过优化提示词和提供更精确的部门分类来持续改进LLM的性能。
另一个案例是可以用于情感分析,对用户的留言进行政府情感分析,并用于仪表盘展示。
聊天机器人的多功能性:聊天机器人可以应用于多种场景,如旅游计划制定、职业咨询、烹饪建议等。这些机器人不仅能生成相关的文本信息,还能采取进一步的行动,例如在处理完用户的请求后,自动发送订单信息等。
聊天机器人的服务类型:聊天机器人提供服务的不同类型可以通过以下流程展示:从完全由人工处理,到机器处理后由人工审核,再到机器自动处理简单任务如退款,而将更复杂的任务留给人工处理。最终阶段是机器人完全自动处理所有任务。
大模型的比喻:将大模型比作一个刚毕业的大学生是一个形象的比喻,尤其在满足以下三个条件时:
大模型处理具体问题的能力:在上述条件下,我们可以探讨大模型处理以下问题的能力:
大模型的局限性: 尽管大模型具有一定的应用潜力,但也存在不少局限性,包括但不限于以下几点:
监督学习构建餐厅评价系统的过程:监督学习在构建餐厅评价系统中的应用通常包括以下步骤:
Prompt-based AI构建系统:使用基于提示的人工智能(Prompt-based AI)构建系统则包括这两个步骤:
人工智能项目的建立过程:建立人工智能系统的过程通常包括以下几个关键阶段:
遇到问题的处理
由于人工智能系统的复杂性和不确定性,建造人工智能软件是一个高度实验性的过程。这要求项目团队进行不断的实验操作、尝试、调整再尝试,以及再次调整,直到系统达到最优状态。
Token的消耗:如图所示,普通常见的单词通常使用一个token,但不常见的单词可能会被模型拆分成多个token,因此会消耗更多的token。例如,如果一个句子需要使用300个单词,大约会消耗400个token,这意味着token的消耗通常会比单词数量多出大约33%。
成本计算示例
普通的聊天机器人在被问及是否有供员工停车的地方时,通常会请求更多的信息。而RAG聊天机器人则会搜索相关文件并给出答案。
为什么使用RAG?
RAG的工作分为三个步骤:
搜索相关文件:在给出答案之前,首先搜索相关文件以寻找可能的答案。
合并文本:将检索到的文件文本合并到更新的提示词中。
生成答案:通过增加的内容来生成对应的答案,有时会直接展示链接文件供用户参考。
现在许多应用软件允许用户提交PDF文档、阅读网址信息等,用户可以直接向AI工具提问,从而获得所需信息。
虽然大型模型拥有海量的知识,但它们并不知道所有事情。通过提供相关信息,可以要求大模型处理信息并给出答案,将大模型作为推理引擎来处理信息,而不仅仅是作为一个知识库。
经过大量的预训练后,可以通过微调(Fine-Tuning)来调整生成的结果。预训练可能需要千亿级别的词语,但微调只需要千或万级别,甚至百级别的词语。微调可以改变大模型的输出,或者持续性地影响大模型以实现某种特定的转换效果。
何时需要使用微调?
解决难以定义的提示词任务:例如,总结特定风格或结构。在客户对话中,由于对话内容繁多,不同部门可能根据对话内容提取的信息不同,结果也会有所不同。例如,针对产品失效的客户电话可以定义为“消费者关于产品的问题”,或者是具体某个型号的故障问题。
模仿特定风格:使用数百个精心总结的特定风格的数据可以转化为你需要的特定风格。然而,定义特定风格的语句并不容易。
微调的其他原因
帮助大模型获得特殊领域知识:通过微调,大模型可以更好地理解和生成特定领域的内容。
适应小模型的需求:当需要在手机或电脑上运行一个小模型时,由于小模型的准确度可能不高,进行微调可以提高其性能。
在选择模型时,我们需要考虑模型的数据规模和其能力。不同规模的数据训练出的模型适用于不同的任务:
十亿数据模型:这类模型拥有匹配和对世界的基本知识,适用于执行一些基本的任务,如判断餐厅评价的情绪。
百亿数据模型:拥有更多的基础知识,能够遵循基本指令,适合用作如食物订单机器人等稍微复杂的任务。
超千亿数据模型:具备非常丰富的基础知识,能进行复杂的推理,适合作为进行头脑风暴的伙伴,帮助解决复杂问题。
RLHF(Reinforcement Learning from Human Feedback):RLHF 的目的是使大模型的回答更有帮助、更诚实且无害。这一过程可以分为两个步骤:
在实际应用中,如餐厅订单系统,可以利用大型语言模型(LLM)来自动化一些任务。例如,用户发送“给我送一个汉堡”的信息时,LLM可以自动生成订单并回复相应的话语,从而触发软件系统下餐厅订单。然而,下错订单可能导致严重的错误,因此通常需要用户进行确认。
工具的调用:在生成回答的过程中,可以调用外部计算器程序来计算正确的答案,并将其插入到文本中,为用户提供准确的数字。赋予LLM调用工具的能力可以显著提升其推理或行动能力。同时,需要确保工具的使用不会造成任何伤害。
Agent的作用:Agent可以分步骤帮助用户解决问题,通过逐步引导和提供必要的信息或操作,确保用户能够顺利完成任务,如正确下单等。
写作助手 可以重写一篇专业的商业报告,用于内容输出前的检查。
营销助手 用于构思营销想法,如提出营销想法或详细营销方案。
招聘助手 用户总结求职者的最终评价(使用前记得再次检查摘要)。
编程人员 可以用于编写基础代码。
工作与任务的区别
优化AI VS. 自动化AI:AI用于强化工作还是自动化,各有利弊。
在初期可以使用AI优化工作,当员工开始对AI建立信心与信任后,再推动AI将工作任务自动化。
软件工程师:负责编写软件应用程序并确保其稳健运行。
机器学习工程师:负责实现人工智能技术,熟悉大模型、RAG(Retrieval-Augmented Generation)、Fine-Tuning等技术。
产品经理:作为项目的负责人,负责识别和界定项目,确保项目对用户有用。
提示词工程师:虽然是一个被炒作的职位,实际上可能担任了机械学习工程师的部分职责。
小团队启动:对于小团队的启动,无论采取何种方式,都应该得到鼓励。
担忧一:是否会放大人类的负面影响
在技术层面上解决社会歧视等问题是可能的,例如通过使用RLHF(Reinforcement Learning from Human Feedback)来减少偏见。
担忧二:导致失业
人工智能会优化效率,但每个工作的组成部分并非单一。人类可以与人工智能更好地协同工作。吴恩达教授曾提到,尽管16年行业对放射科医生的需求看似下降,但实际上放射科医生并没有失业。这是因为解读X光照片实际上比预期更困难,而且放射科医生的工作由多个部分组成,解读X光照片只是其中一部分。最终,能够掌握人工智能技能的人将可能取代那些不会的人。
担忧三:人类毁灭
人工智能可能导致许多问题,但关于人工智能可能带来毁灭性影响的观点,吴恩达教授发现这些论点通常不具体,也没有明确说明人类如何灭绝。人类有丰富的经验来控制比个体更强大的事物,如公司与国家。许多没有完全控制的事物,如飞机,仍然是有价值且安全的。如果关注其他问题如气候变化和大流行病,AI可以成为解决这些问题的关键。
ChatGPT的崛起:ChatGPT的成功使得许多人开始认为大模型可能具有通用性。然而,通用技术并不等同于通用人工智能(AGI,即Artificial General Intelligence,强人工智能)。
强人工智能的定义:强人工智能被定义为能够像人类一样执行任何智力任务的技术。这意味着强人工智能应具备处理各种复杂和多样化问题的能力,而不仅仅是在特定领域或任务上表现出色。
虽然强人工智能(AGI)的实现还有一段路要走,但AI已经产生了巨大的影响力。因此,我们需要考虑如何实现一个负责任的AI。以下是实现负责任AI的几个关键维度:
建议:
人类的智慧是昂贵的资源。这就是为什么最富有的人群可以承担得起雇佣专业医生进行健康检查并提供专业建议,或者聘请高素质的家教来真正花时间了解并帮助他们的孩子。人工智能(AI)提供了一个将这种智慧成本大幅降低的可能性。
通过利用AI,我们可以使先进的智慧和指导变得更加普及和可达,从而为更广泛的人群带来益处。这不仅可以减少社会不平等,还可以提高整个社会的生活质量和效率。
[1] https://www.deeplearning.ai/courses/generative-ai-for-everyone/
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。