当前位置:   article > 正文

什么是提示词工程?什么是大语言模型?这是我见过最粗俗的解释!原来如此!_提示语和大模型的关系

提示语和大模型的关系

提示词是什么呢?

简单来说,就是在使用像ChatGPT这样的工具时,给它的问题和指示,让它能理解我们想要的是什么。

提示词工程的目的呢?

就是写出能让AI按照我们的需求来进行反馈的提示词。

所以提示词重要吗?

当然重要,它几乎是我们和AI沟通的唯一方式,它决定了我们能否充分发挥这些强大的模型的能力。市场上有很多课程会夸张的告诉你,如果不学习这个技能,你就会失去工作,就会被这个时代淘汰。

他们还会告诉你,提示词工程师在就业市场上有多么抢手,年薪几十甚至上百万。

但是普通人,真的需要学习所谓的提示词工程吗?

完全没有必要。为什么这么说呢?因为对于我们普通人来说,真正需要的提示词技巧并不是因为GPT这种语言模型的出现而新生的知识,而是一种很基本的,很多人本来就具备的能力——动员和管理别人的能力。

现阶段与Chat GPT交流的唯一方式就是用语言进行多轮对话。利用好语言就成了唯一的技巧。不能否认,提示技巧是提高语言模型输出内容精度的手段。

一个精心设计的提示,可以引导AI生成更加有用的回答,这对于数据分析、内容创作,甚至日常问题的解决都很有帮助。

其实这反映了人们对于利用AI实现具体工作的渴望,以及如何对于实现这些目的的探索。这也可能导致对提示词作用的过度夸大。

实际上也不会出现一个专门的职位叫提示工程师。也许在短期内可能有公司会因为对提示工程产生误解,从而公布一个这样的职位,但这种情况马上会被纠正。

学习提示词技巧有点像当年学习搜索引擎的搜索技巧,格式和技巧不是重点,重要的是你知不知道你想要的关键词,是你对问题的理解和描述。

实际上任何提示词的框架都可以理解为两个部分:你现在知道什么,你希望从大圆模型中得到什么。甚至框架也不是首先需要的,你要做的就是与AI对话,让他帮你探索已知和未知。

因为大多数时候,我们也不知道自己想要的是什么,我们的需求往往很模糊,我们甚至不确定我们知道的信息是否全面,是否只是冰山一角。

大语言模型厉害的地方就是可以无限的向上抽象,因此采用迭代式的对话,每一轮都能带来新的发现和惊喜。这是个基本技能,但并不是每个人都能做好。

Chat GPT其作为一种对话形式的AI工具,其最根本的价值是一种激发人思考的创意机器。然而一个有趣的现象是,许多人在与这些模型进行多轮对话之后,试图提炼出一种通用的对话模板,希望在后续对话中直接应用这一模板获得最高质量的回答。

我们都希望少对话几轮,但并不存在一种万能模板能够适用于特定情境并产生优质的AI响应。这种想法是对于大语言模型能力的一种简化理解,忽视了对话内容的复杂性和上下文的重要性。

如果你曾经做过老板,或者负责过一个团队,你可能会很熟悉这样的场景:就是当一个新员工刚刚加入你的公司或者团队,这时你需要做哪些事呢?

为了让新人能够马上上手,你可能需要先向他介绍你们的行业、你们的公司,可能还会带他在办公室转一圈,熟悉一下环境,认识一下同事。

然后呢?你还会给他分配岗位,给他具体的工作任务,讲明白任务的背景、要求和截止日期。有时你甚至会示范一下怎么完成任务,或者给他看一下完成好的工作应该是什么样子的。

最后呢?在他的工作过程中,你还会时不时的给他一些指导和反馈。

如果你让他写一篇关于某主题5,000字的论文,但没有给出任何具体的其他指示,他也敢写。至于写出来的是个什么东西,那就保证不了了。

我确实看到很多人就是这么做的,诡异的是,这还是他们,在示范GPT有多强大的时候,这样做。这真的很讽刺,就好比说,你想证明这辆跑车有多快,然后徒步推着他跑了200米。

那么结论是什么呢?

很简单,你真的不需要专门学习所谓的提示词工程。唯一需要做的,就是主动转换一下自己的认知状态,把GPT当做一个真正的下属或者是同事,就像和人交流一样和他去交流。换句话说,只要你懂得怎么给人分配工作,你就已经是一个提示词专家了。

当你给人分配工作时,你需要告诉他们这件事的背景、他的岗位角色、工作目标、你对工作结果的要求,最好给他个示例,最好呢还能阶段性的给出反馈。

如果你有参加那些收费的所谓提示词课程,你会发现他们教的也就是这些。这些其实就是所有管理者,不仅是说管理他人,也包括自我管理的人,都应该具备的素质。

而且你应该相信,技术肯定是向着更方便、学习成本更低的方向去发展的。就像现在的智能手机,学习成本实际上非常低,小朋友都能轻松上手。

因为学习成本太高的东西,除非特别刚需,是不太可能成为大众化的产品或者应用的。随着GPT技术的发展,肯定也会逐步降低对提示词的要求,或者说会有更友好的用户界面。

当我们接触到一个新事物时,我们应该尽量的去探索它的底层逻辑或者本质是什么,否则就会浪费大量的时间在一些表面文章上,似乎学习了很多,但真正碰到变化还是不知道该怎么办。

尤其是在像AI这种变化如此快速的领域,很多东西会很快过时,一味的追逐热点只会徒增烦恼。我们应该更多的去关注那些底层的、本质的东西。

为什么问GPT一些专业领域的问题,它会回答一堆正确的废话?

因为大语言模型,是用大量的通识数据训练出来的,在解决通识问题上会有很出色的表现,专业领域一般都是使用的在通用大模型上训练出来的垂直小模型,这种训练需要更精准更高质量的数据,所以通用大语言模型,在解决垂类问题的时候并不能取得很好的效果。

让GPT解决通识问题的能力可以打个很简单的比喻:医生能写文章、律师也能写文章、打螺丝的我也能写文章,你看我这篇文章就巴拉巴拉了两千多字。

但是!律师写不了医生的病例,医生写不了律师的上诉状。这个就是行业的专业能力,而写普通的文章就输通识能力。

就像我们从小学到高中接受的都是通识教育,看似啥都知道,实际啥都干不了,这就类似于通用大语言模型阶段。

如果我们需要在某一个领域继续研究,我们就需要到大学里学习更加细分的专业,比如数学专业,物理专业,化学专业。 这个阶段就类似于在通用大语言模型的基础上去训练一个行业的细分垂直小模型。

所以关于什么是提示词和什么是大语言模型,你现在明白了吗?

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号