赞
踩
本章涵盖了
- 生成式人工智能简介
- 生成式人工智能生成内容的示例
- 组织在采用生成式人工智能时的指导
- 理解生成式人工智能的关键用例
- 生成式人工智能与其他人工智能的比较
人工智能(AI)大家都很熟悉,而且已经存在很多年了。我们都在使用它 - 使用搜索引擎,查看产品推荐,听精选的播放列表,或者在手机上输入建议的单词一一所有这些都是人工智能场景。然而,今天的人工智能似乎一切都是新的,全世界都在谈论人工智能,特别是生成式人工智能。
生成式人工智能(Generative Al)是人工智能技术的最新进展,吸引了公众的兴趣并激发了全球的热情,这在很大程度上是由 OpenAI 的 ChatGPT 推动的,该技术在两个月内惊人地积累了 1 亿用户,这是迄今为止人类采用任何技术最快的用户。 许多企业将这项技术视为即将到来的数字化转型和自动化浪潮的关键催化剂,因为它可以创建新的内容和流程,从而增强各种业务流程。生成式人工智能已经被用来创建一系列内容,从图像、文本、 和音乐到更复杂的输出,例如设计模式和代码。 它的潜力是巨大且令人兴奋的,能够生成几乎任何东西,从新的游戏关卡到新颖的食谱等等。
随着人工智能技术的快速进步,达到人类水平的过程变得越来越短、越来越快。 图 1.1。 下面来自 Out World inData [1] 的内容展示了图像和语言识别能力如何迅速超越人类。
本书将深入探讨这一新兴技术的各个方面。 我们将讨论潜在的用例以及企业如何将生成式人工智能纳入其现有框架。 我们将探讨其技术基础、关键组件以及应用程序架构所需的修改。 此外,我们还将介绍在生产环境中部署该技术并以最佳方式管理其运行的最有效实践。
生成式人工智能从根本上不同于其他类型的人工智能,因为它是创造新的东西,并且不会从训练数据中修改或复制。传统人工智能根据输入数据进行预测,而生成模型通过预测下一组单词的能力来创建新事物。 生成并理解现实世界的语义。 这些新事物涵盖了广泛的文本、图像、音乐和 3D 模型。 我们将展示企业如何适应使用这些新技术。 GenerativeAl,类似于富有想象力的艺术家或富有创造力的小说家,从信息片段中描绘出生动的图画,写出触动灵魂的诗歌,并凭空构建整个宇宙。 亲爱的读者,欢迎来到令人惊叹的生成人工智能世界——在这个世界里,机器学习理解、分析和创造。
读完本书后,您将全面了解生成式人工智能及其在企业中的应用。 本书深入探讨了生成式人工智能的基本技术和原理,例如基础模型、大型语言模型、嵌入以及相关算法和架构,将为读者提供识别和实施将生成式人工智能纳入组织人工智能战略的必要步骤所需的知识和项目。 您将深入了解实施生成式人工智能所带来的好处和挑战。
除了技术基础之外,本书还介绍了展示生成式人工智能实际应用的真实用例,读者将获得在企业环境中开发和部署生成式人工智能模型的指导,涵盖提示、提示工程、模型微调和评估等主题。 我们还将探索新兴的应用程序架构模式、最佳实践以及与现有系统和企业工作流程的集成模式。 随着生成式人工智能的不断发展,本书将重点介绍企业应注意的新兴工具和趋势,包括提示工程、可解释的人工智能、迁移学习和强化学习(特别是来自人类反馈的强化学习 -RLHF)
本书面向不同的读者,包括开发人员、软件架构师、数据科学家、业务决策者以及在各行业企业工作的高级用户。 虽然我们可能提供代表真实企业场景的行业特定示例,但这些主要概述了技术方面。 一些例子看起来像是玩具示例,但它们在寻求规模化时支撑了适用于企业的核心概念。我们的目标是展示生成式人工智能如何解决许多企业面临的独特挑战,包括治理、内部政策和监管要求,如 HIPAA、GDPR、 SOC、PI 和其他人员了解数据必要性以及遵守区域和国家/地区特定法律。尽管如此,我们讨论的基本原则同样适用于小型组织和初创企业。
最后,读者将了解与生成式人工智能相关的挑战和风险,例如如何使用企业和私人数据、护栏和道德考虑、数据隐私、安全性、安全考虑等,使他们能够在整合这些数据时做出明智的决策 技术融入他们的组织。
生成式人工智能并不是人工智能的一个新领域,但它最近越来越受欢迎和受到关注。 它可以生成各种输出的新内容 - 从逼真的人脸和编写有说服力的文本到创作音乐和开发新型药物化合物。 这种新的人工智能技术涉及复制现有模式、想象新模式、创造新场景以及创造“新”知识。
如图 1.2 所示,生成式人工智能是人工智能的一个分支,它接受大量数据的训练,学习潜在的模式和分布。 它具有产生“新颖”和“原创”事物的潜力的魔力,这项任务以前被认为是人类聪明才智的唯一领域。
图 1.2 生成式 AI 概述
机器学习和深度学习提供了我们在深入研究生成式人工智能之前需要了解的基本技术。 他们为我们提供了导航人工智能领域的工具包,了解数据工程、模型训练和推理背后的流程。 随着本书的进展,我们将应用这些原则,但不会在本书中讨论细节。 多本书专门讨论了这两个主题,读者最好查阅这些书籍以了解详细信息。
简而言之,机器学习 (ML) 是一门科学学科,专注于计算机如何从数据中学习。 在机器学习中,我们不是明确地对计算机进行编程来执行任务,而是着手开发可以从数据中学习并根据数据做出预测或决策的算法。这种数据驱动的决策适用于许多现实世界的场景,从垃圾邮件过滤到向电子商务平台上的推荐系统发送电子邮件。
深度学习 (DL) 是机器学习的一个子集,它进一步发展了这一概念。 它使用多层人工神经网络 - 称为深度学习。 这些网络试图以简化的形式模拟人脑的行为——从大量数据中学习。 虽然单层神经网络仍然可以做出近似预测,但额外的隐藏层可以帮助优化准确性。 深度学习推动了当今许多人工智能应用的发展,并帮助提高执行任务的效率、速度和规模。
如前所述,生成式人工智能是深度学习的演变。 许多人错误地认为 ChatGPT 是生成式 AI,这是一个常见的错误。ChatGPT 是一个在最简单的层面上使用生成式 AI 的 Web 应用程序。ChatGPT 的兴起和流行让许多人接触到了生成式 Al 和这些其他生成式模型(称为大语言模型)的强大功能 (LLMs)——顾名思义,与语言有关。 OpenAI 在不同的互联网文本上训练 ChatGPT,以产生类似人类的对话。 除了 ChatGPT 之外,表 1.1 还概述了当今使用的一些生成 AI 模型; 它们按生成的 AI 区域类型进行分组——语言生成、图像生成和代码生成。
表 1.1 流行的生成式 AI 模型
以下是当今使用生成式人工智能的几个领域。 随着生成式人工智能技术的发展,我们期望看到更多创新和创造性的应用。
我们将在下一章中深入探讨生成式人工智能的工作原理,但现在,我们先讨论一下使用这项技术可以生成什么以及它如何帮助您的企业。
当谈到使用生成式人工智能生成事物时,天空是极限;正如我们之前所展示的,我们可以生成文本、图像、音乐、代码、语音,甚至设计。 在我们看一些可以生成的东西的例子之前,值得注意的是,生成式人工智能并不像人类那样“理解”内容。 它使用数据(其训练集的一部分)中的模式来生成新的相似数据 - 生成内容的质量和相关性与训练数据的质量和相关性直接相关。
在此示例中,我们将使用 OpenAI 的 GPT-4 模型来提取名字,以下文本中的公司名称、位置、电子邮件和电话号码。
从以下文本中提取姓名、公司、电子邮件和电话号码:
我们可以在下图1.3 的输出中看到模型提取的实体.
图1.3 实体提取
以多种方式生成文本是生成式人工智能的基础。 我们可以生成不同的东西,例如诗歌、笑话和个性化内容。在本示例中,我们将使用 GPT-4 为一本关于生成 AI 的新书生成新书发布电子邮件。 我们向模型提供我们的要求和一些构建背景的提示。 我们基本上设置了场景,概述了要求和另一个上下文,例如文本的语气,它将为我们生成电子邮件。
为所有书店都有售的新生成人工智能书籍撰写一封简短的书籍发布电子邮件。 这本书涵盖了 GenerativeAl 简介、不同类型和用例以及企业的最佳实践,包括如何将这种新的 AI 技术融入其业务流程。 该书由曼宁出版,作者是阿米特·巴赫里。 书名是《Generative AI in Action: Real-World applications and Case Studies of AI for Enterprises》。 目标受众是开发人员和企业架构师,语气友好且令人兴奋。
- 电子邮件的主题行应该是什么?
- 电子邮件的正文应该是什么?
人们得到这样的答案,这相当不错
- 主题行:“通过 Amit Bahree 的新书探索生成式 AI 的力量:行动中的生成式 AI!”
- 电子邮件正文:
亲爱的[收件人姓名]我很高兴地宣布出版一本非凡的新书。《行动中的生成式人工智能:企业人工智能的真实世界应用和案例研究》,作者:Amit Bahree,曼宁出版。我们充满活力的商业环境正在呼唤 尖端的解决方案。生成式人工智能就是这样。 这是科技行业最令人兴奋的进步之一,可以改变您的企业的游戏规则。 无论您是开发人员还是企业架构师,这本书都是您利用生成式 AI 力量的门票。《生成式 AI 实践》揭示了生成式 AI 的复杂性。它提供了易于理解的介绍,并深入探讨了生成式 AI 的不同类型、用例、 以及它如何彻底改变业务流程。
此外,它还为希望将这种最先进技术融入其运营的企业提供了最佳实践。您可以从这本启发性的读物中获得以下内容:
- 生成式人工智能的全面介绍。- 探索各种类型的生成式人工智能 及其实际应用。
- 富有洞察力的案例研究展示了企业如何利用生成式人工智能。
- 关于在企业中实施 GenerativeAI 的最佳实践的宝贵指导。我们精心策划了这本书,以使任何渴望理解和使用 Generative AI 的人都可以使用它。 因此,无论您是人工智能新手,还是希望保持技术进步前沿的经验丰富的专业人士,“生成式人工智能实际行动”都是您一直在等待的资源。我们很高兴与大家分享,“生成式人工智能实际行动”现已推出 可在各大书店购买。 立即获取您的副本,开始您的利用生成式 AI 实现业务转型的旅程。感谢您的持续支持和愉快的阅读!
谨致问候,
[您的姓名]
[您的职位]
[您的联系信息]
我们不仅仅局限于文字; 我们可以使用提示生成图像。 需要明确的是,该模型并没有找到满足这些属性的相似图像; 相反,它正在产生一些不存在的新东西。 如果我们要求一些现实世界中不存在的异想天开的东西也没关系——比如一只狗在泰姬陵的背景下写一本书。人工智能可以解构和理解每个方面,然后用它来创造新的东西——类似于艺术家会怎样。 在下面图 1.4 的示例中,我们使用 OpenAI 的 DALL-E 3 模型根据提示生成图像。
提示:“生成一张戴着眼镜的狗坐在桌子旁的图像并使用计算机撰写一本关于人工智能的书。 让它成为一个积极的形象,以窗外的泰姬陵为背景,在黄金时刻"
图 1.4 使用 DALL-E 3 生成图像
在考虑生成代码时,不要将人工智能视为能够创建功能齐全的应用程序,而是将其视为某些功能和例程,这是有帮助的。 很多代码是关于不同运行时和框架的脚手架,而不是关于确切的业务逻辑。 在许多这样的场景中,代码生成确实可以帮助提高开发人员的工作效率。 在下面的示例中,我们使用 Codex 生成经典 Hello World 函数的代码。 我们可以给它一个提示,如下所示,它会为我们生成代码。
提示:为刚开始使用 OpenAI 的开发人员使用 OpenAI API 在 Python 中编写等效的 hello world,并将输出翻译成法语。
您会得到这样的答案,包括开始所需的步骤,这令人印象深刻。 当然,这只是一个说明性的例子,展示了模型的威力——理解请求的上下文和规则,包括编程语言、软件开发工具包(SDK)和要使用的包等,然后生成代码。 此代码不遵循既定的最佳实践(例如,代码中不应包含 API 密钥)。
清单 1.1 Hello World 调用 OpenAI 服务 - 由 Codex 生成
运行脚本:
我们可以运行它并看到如下图 1.5 所示的输出。 请注意,考虑到 Al 的不确定性,每次运行时我们都会得到一些不同的响应。 在第 3 章 - 生成文本中,我们将看到如何使用不同的选项来控制其中的一些内容,并使模型变得更加确定。 其中一些是大型语言模型(LLM)(一种生成式人工智能模型)的工作原理。 我们将在下一章探讨LLMs。
图1.5 生成的代码
虽然我们概述了代码生成,但LLMs可以在与代码相关的其他方面(例如可解释性、优化和可读性)提供帮助。 我们将在第 5 章后面详细介绍该代码。
生成式人工智能的推理能力非常令人印象深刻。 如果我们能够通过这些技术的突现行为的提示来表达问题域,我们就可以获得答案和该方法的逐步思考过程。 这类似于人类思考、分解和解决问题的方式。
例如,我们可以要求模型求解一个简单的数学方程(例如下面的示例),并且不仅求解它,还解释步骤并给出答案。
提示:解决这个问题并逐步思考
如果 x = 80 且 y = 60
当 y = 30 时 x 是多少?
这是响应,我们看到模型通过其步骤运行并向我们展示了它所经历的确切“思考”过程。 实现类似这样的可以用传统的 Al 泛化到更广泛的领域空间的东西即使不是不可能,也是很困难的。
假设当 y = 60 时 x = 80,我们可以建立一个比例来求解 y = 30 时的 x。
在这种情况下,我们假设 x 和 y 之间存在线性关系,即 x 为与 y 成正比。 因此,当 y 减半时,x 也会减半使用给定值:
x1/y1 = x2/y2
其中:
x1=80
y1 = 60
y2 = 30我们试图找到x2。
我们可以建立方程:
80/60=x2/30
求解x2,我们得到:
x2 =(80/60) * 30
这简化为:x2 =(4/ 3)* 30
x2 = 40
所以,如果 y = 30,则 x = 40
传统人工智能无法解决这个问题,因为它对世界的理解很狭隘。 它无法理解问题的意图,即概述一个逐步的过程。 这是因为传统人工智能不具有生成能力。 它只能遵循显式编程的指令。
另一方面,生成式人工智能可以理解问题的意图,因为它对世界有更广泛的理解,并且可以生成逐步的过程。允许这一点的另一个方面是生成式人工智能模型的涌现行为(emergent behavior)现象。 这种行为是概述逐步过程的能力。 它不存在于模型的任何单个组件中,而是从组件的交互中出现。下一章将在介绍大型语言模型时更详细地介绍涌现行为(emergent behavior)
与我们如何使用提示和生成图像类似,我们可以对音乐做同样的事情。 与文本相比,音乐生成还处于早期阶段,但底层模型和技术正在迅速进步。 我们可以用生成式 AI 音乐模型,例如 Google 的 MusicLM 或 Meta 的 MusicGen 等来生成音乐。 例如,如图1.6所示,我们可以使用这样的提示:“用长笛和吉他创作一首令人平静和舒缓的冥想歌曲。 音乐应该是缓慢的,重点是营造一种和平与安宁的感觉。” 这会生成几个 30 秒的剪辑。
图1.6 MusicLM截图
生成式人工智能是一项强大的技术,可以从现有的内容或数据中创建新的内容或数据。 许多企业将其用于组织内部和外部的不同用例。 其中一些是为了改善他们的工作流程或效率,而另一些则是为客户提供更好的服务或产品。 根据不同的目的,使用生成人工智能的挑战可能会有所不同。 例如,一个常见的挑战是人工智能系统产生一些没有意义的东西(即它编造的东西 - 也称为幻觉)。 这通常比外部更容易在内部处理,因为客户可能对人工智能系统有更高的期望或更低的信任。
人工智能系统产生幻觉的原因有很多,但通常是因为底层模型无法区分训练数据中的事实和虚构。 LLMs 接受的培训是生成连贯的、上下文感知的文本,而不是事实上准确的答案。 当提示或上下文与任务不准确且不相关时,他们往往会产生幻觉。 我们将在本书后面介绍幻觉以及可以用来将其最小化的技术。
下面的表 1.2 概述了一些企业用例 - 这些都是通用的,因为它们是适用于多个行业的更横向的示例。稍后的表 1.3 概述了一些特定于行业的用例。
表 1.2 生成式人工智能的横向企业用例
表 1.3 生成式人工智能的特定行业用例
这些只是生成式人工智能的一些企业用例。 随着技术的不断发展,我们预计在未来几年会看到更多创新和有影响力的生成式人工智能应用。
在企业环境中使用生成式人工智能与出于个人原因使用生成式人工智能有很大不同。 组织必须遵守适用于其行业的某些法规和期望,其中一些法规和期望会因地点而异。 此外,还有其他财务、法律、技术和道德问题需要考虑。 比如说,如果人工智能生成的内容不正确、充满偏见,或者只是纯粹的冒犯——这会导致什么问题? 例如,如果人工智能聊天机器人弄乱了食谱,并没有太大的危害,但如果它给修理复杂机器的人发出错误的指令,那就完全不同了。
如果企业不为生成人工智能制定适当的道德准则,可能会导致意想不到的后果。 生成式人工智能可以创建错误信息和虚假内容,包括虚假新闻文章、虚假图像、敏感内容和恶意内容。 一张图片已经抵不上千言万语; 有些图像非常好,以至于越来越难以区分假图像和真实图像。在某些情况下,生成的输出还可能侵犯第三方受版权保护的材料。 增加人类监督和贡献可以帮助解决其中一些挑战。
生成式人工智能模型还可能无意中放大训练数据中存在的偏见,导致产生有问题的输出,从而延续刻板印象和有害意识形态。
公司需要制定一个可靠的计划来使用生成式人工智能,并确保它符合他们的业务目标,例如它将如何影响销售、营销、商业、服务和 IT 工作。在涉及生死攸关的决策的地方,确保有一个人类 —— 在人工智能作为副驾驶和协助的情况下做出最终决定的人。
传统人工智能,现在有些人称为狭义人工智能,主要是我们今天遇到的人工智能的常见形式。 传统人工智能使用经典数据科学和系统方法,使用各种方法和技术从数据中提取见解和知识。 它通常涉及以下步骤:数据收集、数据准备、数据分析、特征工程、训练和数据验证。 它用于预测在经过训练的预先建立的边界内运行的事物。 这些边界是模型中编码的规则和指令。 它只能根据预定义的条件、约束和潜在结果采取行动。因此,结果是确定性的且相对可预测的。 例如,传统的人工智能可以被编程为通过聊天机器人根据预定义的脚本生成响应来自动化客户服务。 虽然这些系统在其规定的领域内非常有效,但它们仍停留在自己的泳道内,无法学习和适应其编程知识之外的情况 - 因此是“狭窄”的方面。 迄今为止,几乎所有的人工智能实施和企业实施都是传统人工智能。
另一方面,生成式人工智能倾向于概率方法,其中结果是根据输入数据和学习模式影响的概率来计算的。 这使得这些人工智能系统能够创建既不是硬编码也不是明确教授给系统的输出。生成人工智能需要经典的数据科学过程,在很多方面增强和补充它。 生成式人工智能可以帮助处理新型数据和内容,评估生成输出的质量和有效性,并确保生成式人工智能的使用符合道德和负责任。 经典数据科学和生成人工智能必须共同努力,从数据中创造价值和影响。
一个显着的区别是,“与这些较新的生成式人工智能模型对话的方式是通过提示来提示它们,正如我们在之前的示例中所看到的那样。 更正式地说,提示是一组指令,告诉再生人工智能系统我们想要创建什么样的内容。 提示越好,结果就越好。 提示应根据您想要收到的响应类型以及您使用的生成人工智能的具体情况进行定制。 稍后我们将更详细地介绍即时工程。
在某些方面,提示可以让我们更具表现力,不仅概述要求和意图,还可以通过语言捕捉同理心和情感。 对于开发商和企业来说,提示工程是一个新兴的新兴领域——其中一些领域更多的是艺术,更少的是科学。
提示:写一段关于提示工程与传统人工智能的有趣俳句
AI生成的文本:
老旧的人工智能令人生厌,而通过提示,我们可以设计出更多–笑声不断,再来一次!
表 1.4 概述了大致的类别,以显示生成式 AI 架构和传统 AI 架构之间的差异。 同样重要的是要注意不同类型的AI之间存在很多重叠。 例如,聊天机器人可能会同时使用生成模型和预测模型 - 根据对语言的理解生成响应,并预测用户可能会发现哪种类型的响应最有帮助。
表 1.4 生成式人工智能与传统人工智能有何不同
生成式人工智能可以弥补传统数据驱动的人工智能系统的局限性,并提供非凡的工具包来构建更智能的应用程序和系统;对于企业来说,可能性是巨大且令人兴奋的。 想象一下,设计能够随着时间的推移进行自我优化的系统,或者开发可以起草电子邮件、报告、生成代码片段等的人工智能助手(Copilot),从而提高生产力并缩短上市时间。
许多组织可能会因为错过生成性人工智能而感到兴奋和恐惧,而生成性人工智能似乎很神奇。 然而事实是,拥有像 GPT-4 这样的大语言模型这样的基础模型本身并没有什么区别。这些先进的人工智能系统必须像任何其他外部软件一样实现并连接到企业的业务线和流程。 我们将在后续章节中看到如何实现这一点的示例。
从高层次上看,整体方法不应有太大变化;仍然建议企业在整合生成式人工智能时应采取深思熟虑的战略方法。 以下是一些关键考虑因素,这些考虑因素涵盖了大多数企业需要考虑的各个维度,从战略、业务和技术。
如果您是一名企业开发人员,看到有关生成式 AI 的所有新闻以及各大科技公司发布的各种产品,您可能会认为对于 Al 来说,一切都已经改变了。 然而,现实是一切都没有改变。
从企业的角度来看,生成式人工智能有一些新的方面需要考虑 - 其中大多数(如果不是全部)都将是添加到现有架构最佳实践和指南中的内容,而不是丢弃任何内容。 本书,但必须在较高层次上考虑新的架构模式。 我们在本章前面已经接触过其中的许多内容,但关键的是:
您的企业在利用生成式人工智能推动创新和效率方面迈出了关键一步。 然而,了解接下来会发生什么对于最大限度地提高这项先进技术的收益并降低其风险至关重要。
为了帮助入门,我们将使用实施“EnterpriseChatGpT”的示例,并概括概括所需的步骤。 在接下来的几章中,我们将深入探讨更多技术细节,包括实施指南和最佳实践。 下面的图 1.7 显示了企业中典型工作流程的高级概述。
图 1.7 实施生成式人工智能的高级概述
首先,您需要明确定义您的目标。 你想用生成式人工智能解决什么问题? 哪里可以增加最大的价值? 这可以是任何内容,从营销中的内容创建到通过聊天机器人改善客户服务、业务策略的预测建模,甚至产品或服务创新。 在我们的示例中,我们正在实现一个企业 ChatGPT,例如 OpenAI 的 ChatGPT。 尽管如此,它还是在企业环境中部署和运行,使用内部和专有数据,并且只有授权用户才能访问它。 企业聊天GPT,
其次,我们需要确保您拥有适当的资源 - 这包括拥有适当技能的人员、适当的硬件和软件基础设施、概述成功的衡量标准以及建立适当的治理和道德准则。
第三,考虑数据。 在我们的示例中,企业聊天机器人需要访问企业数据,这些数据是相关的、高质量的并且可供用户使用。 这些数据需要被提取和索引,以便我们可以使用它来帮助回答专有问题。 在此之前,必须妥善管理数据,确保隐私和法律合规性。 请记住,输入数据的质量将影响输出质量。
接下来,我们需要将企业聊天机器人集成到业务应用程序中,以解决用例和我们试图解决的问题。 作为一家企业,我们还希望解决与生成式人工智能相关的风险,并围绕安全和负责任的人工智能实施企业指导。
最后,尽管我们可能已经准备好在生产中部署,但实施生成式人工智能并不是一次性事件,而是一个旅程。 它需要持续的监控、测试和微调,以确保其以最佳和负责任的方式工作。 最好从较小的、可管理的项目开始,随着您在处理这项强大技术方面获得更多信心和专业知识,逐渐扩大规模。
采用生成式人工智能是一项重大承诺,可以改变您的企业,但它需要仔细的规划、适当的资源、持续的监控以及对道德考虑的坚定关注。 有了这些,您的企业就可以获得生成人工智能的多种好处。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。