学习大语言模型（LLM），从这里开始

作者：从前慢现在也慢 | 2024-03-01 06:15:35

踩

学习大语言模型（LLM），从这里开始

在见识了ChatGPT的各种强大能力后，不少 NLP一线从业人员很自然地想到，以后开发者只要借助 ChatGPT，就可以做到现在大部分NLP工程师在做的事，比如文本分类、实体抽取、文本推理等。甚至随着大语言模型（largelanguagemodel，LLM）能力的不断提升，它们可能做得比NLP 工程师都要好。

如何利用大语言模型做一些NLP任务或服务？这本关于大语言模型的开发指南《ChatGPT原理与应用开发》来啦！

ChatGPT原理与应用开发

Datawhale的开源大模型实战教程，透彻解读4类常见NLP任务的系统设计，书-课-代码仓库全方位学习，每个人都可以用大语言模型轻松做出自己的AI产品。

本书主要面向非算法、有一定编程基础、对人工智能和 ChatGPT（或其他类似的大语言模型）感兴趣，并乐意使用大语言模型接口开发相关应用的读者。当然，部分内容不需要任何编程经验也可以学习。通过本书进一步降低大语言模型的使用门槛，让更多对人工智能和大语言模型感兴趣的非 NLP 工程师或算法专业人士，能够无障碍地使用大语言模型并创造价值。希望新的技术突破能够更多地改善我们所处的世界。

本书内容

本书内容聚焦于如何使用大语言模型开发新的功能和应用，一共有 8 章内容，分别如下。

第 1 章基础知识 —大语言模型背后，主要介绍了与 ChatGPT 相关的 NLP 领域的基础知识和原理，具体内容包括自然语言背景、Token 与 Embedding、语言模型、Transformer、GPT和RLHF 等。掌握了这部分知识，就能大概知道 ChatGPT 或其他大语言模型是怎么回事。

第 2 章相似匹配—万物皆可 Embedding，主要介绍了文本表示，以及与文本匹配相关的任务和应用。这是 NLP 领域（以及其他一些算法领域）最常用的技术，具体内容包括相似匹配基础、接口使用，以及简单问答、聚类任务和推荐应用。

第 3 章句词分类—句子 Token 都是类别，主要介绍了 NLP 领域最常见的任务—分类。这其实也是人类最基本的认知方式（比如用男或女、老或少、勤奋、乐于助人等简单的标签化方式具象化某个个体），具体内容包括句词分类基础、接口使用，以及文档问答、模型微调和智能对话应用。

第 4 章文本生成—超越理解更智能，主要介绍了与文本生成技术相关的任务，具体内容包括文本摘要、文本纠错和机器翻译。文本生成技术在实际场景中的使用相对少一些，也相对独立一些。

第 5 章复杂推理—更加像人一样思考，主要介绍了如何使用大语言模型做复杂的逻辑推理任务。这部分内容在现实中的应用很少，但在新的产品形态上有很多想象空间。

第 6 章工程实践—真实场景大不同，主要介绍了如何在真实业务上使用大语言模型。我们不再仅仅构建一个简单的 Demo（demonstration 的简写，指示例、样品），而是要将大语言模型真正用在产品开发上。我们会给出一些需要特别注意的事项，以帮助读者更高效地构建应用。

第 7 章局限与不足—工具不是万能的，主要介绍了 ChatGPT（或其他类似的大语言模型）的缺陷或不擅长的地方，包括事实性错误、实时更新、性能瓶颈等方面。我们在畅想和利用 ChatGPT 或其他类似的大语言模型做各种人工智能应用时，也应该了解其不擅长的地方：一方面要对其有更加全面的认识；另一方面，反向思维有时候也能想象出好的应用或服务。

第 8 章商业应用—LLM是星辰大海，可以把该章当作一篇调研报告来阅读，主要针对工具应用和行业应用两大方面展开，期望能够给读者更多启迪，帮助大家构思更好的应用或服务。

本书有两个基本的设计理念。

各章相对独立，彼此之间没有明显的依赖关系。这既体现在内容上，也体现在设计上。读者可以灵活选取自己感兴趣的章节阅读。

以“任务”为核心。我们始终强调“任务”多于“工具”，ChatGPT 是目前大语言模型领域总体效果最好的，但未来一定会有其他大语言模型出现。不过，只要我们理解了要做的事情，理解了系统设计，工具就能为我们所用。

阅读建议

通过上面的介绍，相信读者应该对本书有了初步了解。下面主要从创作者的角度简单说明如何更好地使用本书。

第一，我们期望读者能够亲自动手完成一个应用或服务的 Demo 。光看不做在编程领域是绝对不行的，实践出真知，脑子想、嘴上说与亲自干完全不一样。而且，万事开头难，做了第一个，后面再做类似的就会相对容易一些。

第二，我们期望读者能在学习过程中多思考，既可以与自己工作的实际业务相结合，也可以天马行空地构想。我们非常期待读者能分享自己的想法，众人拾柴火焰高，个人能想到的太少了，但这么多人一起想，也许能够改变一个行业。

第三，我们期望读者能对 NLP 领域的常见任务有个基本的认识。我们并非想要读者都成为 NLP 工程师，阅读本书也不会让你成为 NLP 工程师。但我们期望读者能够利用 ChatGPT （或其他类似的大语言模型）提供的接口来完成 NLP 任务，并提供相关服务。期望读者在阅读完本书后都具备这样的能力。

第四，洛克菲勒说过：真正重要的不在于有多少知识，而在于如何使用现有的知识。知识只是潜在的力量，只有将其付诸应用，而且是建设性的应用，才会显示出其威力。本书内容围绕着任务展开，很多设计思路和细节其实可以应用到多个领域。我们再次强调，期望读者能够多实践，多应用，尤其是与自己的工作多结合。

第五，由于创作团队精力有限，本书难免有疏漏甚至错误，我们期望读者在学习的同时，也能积极给我们提建议，我们将不胜感激。

ChatGPT 火爆背后蕴含着一个基本道理：人工智能能力得到了极大突破— 大模型，尤其是大语言模型的能力有目共睹，未来只会变得更强。世界上唯一不变的就是变化。适应变化、拥抱变化、喜欢变化。“天行健，君子以自强不息。” 我们相信未来会有越来越多的大模型出现。人工智能正在逐渐平民化，将来每个人都可以利用大语言模型轻松地做出自己的人工智能产品。我们正在经历一个伟大的时代，我们相信这是一个值得每个人全身心拥抱的时代，我们更加相信这个世界必将因此而变得更加美好。

详细目录

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/171567