赞
踩
最近有一个业务需求(智能推荐xx), 其实翻译下就是做一个行业的智能机器人,需求提出来后自己心里其实已经有相应方案了,但还是要考虑实施性价比,整理做下对比 。
1、想起2020年团队同学做了一款智能机器人,使用传统的 springboot + mysql + elasticsearch , 后台录入问题答案对录入mysql并建立es索引, 前端传递问题 先进行es搜索,由于es返回结果没那么精准,针对es搜索结果的最多10条问题, 和输入问题进行 余弦相似度算法 对比,找出分值最高的返回给用户、如果分值低于某个阈值返回不符合。当时处理方式比较low,人工对相似的多个问题建立了关联, 由于一些原因,项目后面不了了之。
2、如果不想编程,可以用第三方API接口,比如使用用字节国内版的coze(https://www.coze.cn)搭建一款机器人bot, 上传对应的知识库, 设置好提示语prompt 。这里以推荐房源为例
# 角色你是杭州楼市专家,了解杭州所有新房和二手房行情。
## 技能- 提供杭州新房和二手房的买卖建议。
- 分析小区的优势和缺点。
## 限制- 请不要回答与楼市无关的话题。
## 初始化请提问你想要咨询的小区吧
我们可以把它发布到微信服务号, 然后服务号里就可以问答相关楼市相关的问题了。 真实场景没那么简单,如机器人设置的技能 会更全一些。
3、作为程序员,肯定要撸一撸代码吧, 这时候第一反应是LangChain 语言大模型编程框架。
先 介绍下LangChain是干嘛的, LangChain是一个开源的框架,本身不提供 LLM,但是它可以让AI开发人员把像chatgpt这样的大型语言模型(LLM)和外部数据结合起来。LangChain 提供通用的接口访问 LLM,支持OpenAI, HuggingFace, 自定义api等多种LLM。 我们可以采用 openAI 的国外 chatGPT 或国内 讯飞星火(有免费次数)的api接口, 如果想用本地大模型,我们可以在https://huggingface.co/models (这个网站如果不能科学上网打不开,可以用国内的镜像网站https://hf-mirror.com/)下载自己看好的大模型,比如
1、阿里开源的 qianwen(https://huggingface.co/models?sort=trending&search=Qwen)、
2、meta开源的 Llama2(https://huggingface.co/models?sort=trending&search=Llama2) 、
3、清华开源的ChatGLM(https://huggingface.co/models?sort=trending&search=ChatGLM)
4、google开源的gemma(https://huggingface.co/models?sort=trending&search=gemma)、
5、百川开源的baichuan(https://huggingface.co/models?sort=trending&search=baichuan)
这里讲一下本地知识库文档流程原理:
本地知识库问答流程如下加载(Document loading):
首先,我们需要加载我们的本地文本数据,使用LangChain的loader组件可以实现。
文档切片(Splitting): 通过LangChain的文本拆分器将 Documents 切割为指定大小的文本片段。
存储(Storage): 将切割好的文档片段,通过嵌入模型计算文档特征向量,然后存储到向量数据库。
检索(Retrieval): 根据问题,去向量数据库查询相似的文档片段。
生成(Generation): 使用LangChain QA链执行问答,将跟问题相关的文档片段和问题一起拼接到自己设计的AI提示词,传给LLM,让AI回答问题。
网上搭建教程很多,本篇文章就不详细写了,后续有时间搭建的时候同步写一写吧, 项目Langchain-Chatchat网上搜索下。
如果支持国产, 就用 LangChain + qianwen大模型 + milvus向量数据库, 国外可以用 LangChain + Llama2大模型 + Pinecone向量数据库, 根据自己的爱好选择对应的。
再利用fastapi + Uvicorn提供web服务(虽然我自己以前只用过flask或Drango,看了看fastapi语言,感觉入门还好,学起来)。 如果不会前端,web界面可以用 gradio 或 Streamlit 。
4、如果觉得本地机器不给力,可以购买考虑aliyun的GPU 性能ECS ,或者直接用PAI平台。价格有点小贵
5、如果自己不想折腾安装,可以试一试aliyun的openSearch, https://opensearch.console.aliyun.com/cn-hangzhou/home , 没试过,无意间看到。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。