当前位置: article > 正文

LLM Agent之数据分析领域的应用_agent意图识别

作者：知新_RL | 2024-08-21 13:59:12

踩

agent意图识别

数据分析：Data-Copilot

paper: Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow
github: https://github.com/zwq2018/Data-Copilot

先介绍下浙大提出的已扩展的数据分析框架，支持多种金融数据类型的查询，数据处理，简单建模，和数据可视化。Data-copilot 以金融领域的数据分析为例，提供了一套可以简单基于已有数据进行扩展生成的数据分析框架。

整个框架分成两个部分，基于大模型的 API 生成和基于生成 API 的 llm 任务规划和执行。其实说复杂也不复杂，数据分析任务里面几个核心的要素就是

分析啥：提问的实体，股票？债券？基金经理？
分析哪段时间：数据的覆盖范围，一季度？今年？
用什么指标：股票的收益率？债券利率？基金净值？
如何分析：收益对比？价格涨跌？排名？
如何输出：绘图？表格？文本？

API生成

设计部分其实是使用大模型来构建更符合上下文语义的 API 调用语句，以及 API 的输入输出。这部分代码并未开源…所以我们只依据论文和脑补做简单介绍。主要分成以下四个步骤

1. 生成更多的用户请求

API 的生成需要基于用户会问什么样的问题。而用户的提问又是基于你有什么样的数据。因此这里使用数据描述和人工编写的种子提问作为上文，让 LLM 生成更多的用户提问。

2. 生成 API 调用语句

把以上生成的所有用户提问，一个个输入模型，使用以下 prompt 指令引导 llm 生成完成一个数据分析任务，所需的多个步骤，以及每个步骤对应的API 描述和伪代码"Interface1={Interface Name: %s, Function description:%s, Input and Output:%s}"

3. 合并相似的 API 调用

每得到一个新的 API function，都会和已生成的 API function 配对后输入模型，并使用以下指令让大模型判断两个 function 是否功能相似可以合并为一个新的 API。例如把查询 GDP 的 API 和查询 CPI 的 API 合并为查询 GDP_CPI 的 API。不过个人感觉这个方案时间和 token 开销颇大，可能比较适合 online API 的在线构建，在离线构建时先基于 API 的描述进行聚类，然后每个 cluster 进行合并可能更经济实惠？

4. 为每个 API 生成对应代码

最后针对合并后的 API，使用大模型进行代码生成。这里使用了 pandas DataFrame 作为数据处理，数据绘图的数据交互格式。这里论文把工具调用分成了 5 个大类：数据获取，数据处理，合并切片，建模和可视化。

看完以上整个 API 构建流程，不难发现使用 llm 来自动生成 API 有以下几个好处（不过估计完全自动化难度不小…）

节省人力
和 APE 的思路类似，大模型生成的指令更符合模型生成偏好，API 同理
当前是离线批量生成，如果可以优化为 online 的 API 生成的话，可以使得 API 具有动态可扩展性

API调用

获得 API 之后，就是如何排列组合规划 API 的执行来回答用户的提问/完成用户的任务。这里的任务流同样拆成了多个步骤：

意图识别

第一步是意图识别，这里其实融合了搜索中 query 预处理的几个功能：

意图识别用于缩小问题范围提高后面 API 调用的准确率
时效性模块基于今天的日期和用户提问，生成问题对应的具体时间范围（包括时间范围标准化）
实体模块用于定位问题的核心实体
输出形式的判别是绘图、表格还是文本输出

论文把以上多个模块融合成了基于 few-shot 的大模型改写任务，会把用户的提问改写成一个新的具有明确时间区间，任务类型更加明确的文本，与其说是意图识别，其实更像 query 改写。如下

个人感觉意图这里完全可以不基于大模型，或者可以用大模型造样本再蒸馏到小模型上。以及整个意图识别的模块可以拆分成多个独立且粒度更细的模块，在金融领域至少可以拆分成大类资产实体的抽取对齐，针对不同资产类型的不同问题意图的识别，以及独立的时效性生成/判别模块。意图模块直接影响后面的行为规划，需要准确率和执行成功率都足够高。

行为规划

行为规划模块包含两个步骤，第一步是任务拆解，以上改写后的 query 会作为输入，输入任务拆解模块。同样是基于 few-shot 的大模型指令任务，把任务拆分成多个执行步骤，每个步骤包括任务类型。

这里作者定义了 stock_task、fund_task、economic_task, visualization_task、financial_task 这 5 种任务，任务拆解类似 COT 把一个任务拆分成多个执行步骤，但本质上还是为了缩小 API的调用范围。指令如下

基于以上任务选择模块每个步骤的任务类型，例如 stock_task，会有不同的 few-shot prompt 来指导模型针对该任务类型，生成多步的 API 调用，包括每一步调用的 API，输入，输出和返回值。行为规划部分通用指令如下

行为规划中一个有意思的点，是论文构建的API中包含三种不同的执行方式，串行操作常规单个输入单个输出，并行操作获取一个证券的多个指标数据，以及循环操作，类似 map 对多个输入执行相同的操作。以下是Data-Copilot的Demo

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/知新_RL/article/detail/1012093