提示工程的状态并不强大。只需看看我们现在必须包含在提示中的信息,以引出我们想要的回应。这既荒谬又令人担忧。拟人化的程度已经高得离谱。我们现在必须贿赂 LLMs?得了吧。

从一开始,我就发现提示工程有一些严重的局限性。同一个提示并不总是产生相似的或甚至是连贯的结果。改变一个词可能会对输出产生巨大的影响。提示工程往往太脆弱,太不可靠。我们不能在沙子上建造未来的系统,更不用说人工通用智能(AGI)了。顺便说一下,我最近提出,我们可能甚至无法建造任何 AGI。

我的核心信念一直是,我们越快消除对提示工程花招的过度依赖,我们就会越好。这就是为什么现在是摆脱 Langchain 的时候。LangChain 建立在严重依赖提示工程的想法上。那不是通往未来的路。

我最近开始使用 DSPy,这是一个美丽的框架,它通过为你生成和优化提示来减少你对提示工程的依赖。DSPy 非常强调编程而不是提示。那才是通往未来的路。每个 AI 工程师现在都应该放弃 LangChain,使用 DSPy!!!现在就行动!!!!!在接下来的几行中,我将解释为什么?


DSPy 集成了提示、微调和增强语言模型(LMs)的方法,通过推理和工具/检索增强。这是通过 Python 中的一系列流畅的操作实现的,这些操作是可组合的。

通过用户友好的 Pythonic 语法,DSPy 提供了模块化和声明式的组件来指导 LMs。此外,DSPy 还具有创新的自动编译器。这个编译器解释你程序中的声明式程序,使其能够为更大的 LMs 生成复杂的提示或为较小的 LMs 进行自动微调,有效地指导它们完成特定任务的过程。

这里没有必要重新发明轮子,我只是采用了 DSPy 文档中介绍的那个。它非常完美。

脚本首先启用模块的自动重新加载,确保代码中的更改在不重启笔记本的情况下得到反映。然后,脚本检查是否在 Google Colab 中运行;如果是,它通过从现有存储库拉取更新或从指定的 GitHub URL 克隆来设置存储库 ‘dspy’。这确保始终使用 DSPy 的最新版本。

此外,脚本将存储库路径添加到系统路径,并为 DSPy 的缓存目录设置环境变量。它还检查是否安装了 ‘dspy-ai’ 包,如果没有,它会安装或更新它。这一步确保 DSPy 环境完全配备了所有必要的依赖项。最后,它导入了 ‘dspy’ 模块,表明设置过程已经完成,DSPy 已准备好在笔记本中使用。

对于我们的实验,我们需要访问一个语言模型和一个检索器。在这种情况下,我们将使用 OpenAI 和 Colbert。对于某些高级用例,可以使用自定义检索器模型。
For every task, DSPy workflow includes collecting data, writing a program, adding validation logic, compiling and finally iterating to improve the workflow.
对于每项任务,DSPy 工作流程包括收集数据、编写程序、添加验证逻辑、编译,最后迭代以改进工作流程。

%load_ext autoreload
%autoreload 2

import sys
import os

  import google.colab
  repo_path = 'dspy'
  !git -C $repo_path pull origin || git clone https://github.com/standfordnlp/dspy $repo_path
  repo_path = '.'

if repo_path not in sys.path:

os.environ["DSP_NOTEBOOK_CACHEDIR"] = os.path.join(repo_path, 'cache')

import pkg_resources
if not "dspy-ai" in {pkg.key for pkg in pkg_resources.working_set}:
  !pip install -U pip
  !pip install dspy-ai

import dspy
现在,DSPy 的真相是它在后台仍然使用了一些提示工程。例如,当你定义一个签名类时,你必须包括任务或字段的文本描述。那仍然是提示工程。在下面的 GenerateAnswer 类中,“用长而详细的答案回答”,“可能包含相关事实”,和“通常在 10 到 50 个单词之间”仍然是提示。

class GenerateAnswer(dspy.Signature):
  "Answer with long and detailled answers"
  context = dspy.InputField(desc="may content relevant facts")
  question = dspy.InputField()
  answer = dspy.OutputField(desc="often between 10 and 50 words")
  • 1
  • 2
  • 3
  • 4
  • 5

DSPy 只是使创建带有少量示例的提示自动化。否则,你将不得不编写自己的提示并选择一些示例包括在提示中以引出更好的响应。DSPy 使用一个根据你提供的示例数据更新的后台提示模板。
如果你查看 DSPy 的代码,你会发现他们仍然在底层使用文本提示,比如“推理:让我们一步步来思考”。我猜只要你使用语言模型,这就是不可避免的,对吧?
到目前为止,我的信念是,DSPy 只是基于这样一个想法:要使你的提示更有效,你必须在其中提供一些示例。所以 DSPy 似乎在任何地方都使用这个想法,因此专注于使使用这些示例生成提示更容易。你可以用 LangChain 做同样的事情,只是方式不同。我觉得 DSPy 有趣的地方是他们在检索领域的专业知识,和 Colbert 以及同事们一起。
DSPy 和 LangChain 之间的差异更多在于如何提示,而不是我们是否应该提示。DSPy 旨在保持最低限度的手动提示。DSPy 的优势在于,只要您有一些数据,它就会通过智能地添加少量示例来创建提示,从而提高效率。此外,DSPy 还简化了评估过程,即使这些评估有局限性(对于问答进行精确匹配对我来说并没有太大意义,但我们有更好的选择吗?)。LangChain 和 DSPy 之间的差异更多是语法上的,而不是根本上的。

