赞
踩
大模型(LLM)的浪潮席卷了各个行业,由于其强大的搜索能力和生成能力,被应用也是极为广泛。但是常常市面上开源的大模型更多是通用大模型,针对企业级的大模型应用往往需要微调,但这需要消耗很大的资源,因此RAG(Retrieval Augmented Generation)即增强检索生成的研究给专用大模型带来了希望,不用重新训练模型,仅仅喂给大模型足够多的知识,即可减少大模型幻觉,增强结果。一个RAG的流程大概如下图所示:
通常指的是将自然语言(文本)转换为SQL查询的过程或技术。
比如:
文:显示所有员工的姓名和工资,其中工资高于50000。
SQL:
SELECT name, salary FROM employees WHERE salary > 50000;
但这往往只能回答一些简答的问题,针对企业的需求是不可能充分满足的。根据接触到的场景,大模型几乎无法完成,比如:
当然,我猜想可能有财大气粗的公司会训练这一功能,但是SQL脚本动辄上千行,token数巨大,成本实在是太高,我认为实现这一需求可能不会付出这么多资源。
这时候RAG技术真的就十分强大了(与其说RAG技术强大,不如说大模型的理解能力真的很强),在真正进行我们的项目介绍前,需要介绍一下LangChain。
LangChain是一个开源框架,专为开发基于语言模型的应用程序设计。它由三大部分组成:语言模型、链(chains)和向量数据库。LangChain旨在帮助开发者轻松构建和部署涉及自然语言处理(NLP)的任务,特别是那些利用大型语言模型的场景。
最初的LangChain是基于python的后来为了满足软件开发人员,相继出现了LangChain4J,这是一个基于java的工具包,你可以搭建自己的工作流,有丰富的组件和函数供你使用。
介绍了这么多前置知识,现在介绍一下项目背景。
在电子商务行业中,精准的用户画像构建是至关重要的。这些用户画像包括用户的浏览行为、购买偏好等多方面信息,使电商企业能够提供更加个性化的推荐和营销服务。然而,营销团队通常不具备直接操作数据分析工具的能力,这限制了他们快速响应市场变化的能力。因此,他们需要依赖数据团队将业务需求转化为数据分析和挖掘的结果,以支持他们的营销决策。说白了就是业务人员不懂技术,他们想通过一些指标来分析用户行为以便他们的工作,就需要技术人员实现这个需求,把这个需求“算”出来,然后做成接口,直接让业务人员查看。
该应用作为脚本开发平台中的辅助工具,旨在帮助开发人员通过自动化的方式快速理解业务需求,并提供一个可操作的SQL脚本起点。通过减少从业务需求到技术实现的转化时间,开发人员可以更高效地进行脚本的优化和调整,提升数据处理的精确度和效率。 说白了就是帮技术人员省点劲,提升效率,给点SQL脚本参考。
SpringBoot+Redis+MySQL+Gauss DB+MyBatis-Plus+Langchain4J,其实项目逻辑挺容易的,但是亮点在于其新颖。
因为设计到公司内容,所以放出简化版,仅仅是个思路,大概是通过检索找到相似的口径,然后通过一系列操作找出对应的SQL加工脚本,最后pt工程。
功能方面:参考了DAIL的prompt模板,多智能体协同(避免一人承担所有)等
系统稳定性:引入了限流、异步操作增强系统鲁棒性,redis避免总使用接口去解析SQL,对输入和输出都做正反馈机制,比如规范化输入,保存好的输出增加知识库等。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。