赞
踩
这个在另外一篇文章:微信接入chatgpt
下面就是完整的介绍了。效果的话,也不介绍了,反正有点意思,这里放几个截图:
这里因为使用的是一个“怼人的知识库”导致返回的答案就很气人。
其实这里也可以换成别的知识库,都是可以的。都是通用的。
本项目是在不借助数据库的情况下:
创建知识条目
更新知识条目的答案
、更新知识条目中相似问法
删除知识条目
、删除相似问法
一个完整的知识库中的条目,起码要有这三个部分:
我这里采用标题和相似问法剥离的处理方式。把他们分为两个表:
维度有:
title
answer
create_time
modify_time
rep_id
:和相似问法表
关联status_question
: 0代表关闭,1代表激活维度有:
rep_id
:和标题表
问法关联similarity
create_time
modify_time
status_similar
: 0代表关闭,1代表激活sim_index
还有两个表:
这个对硬件要求不高。唯一要求就是,起码内存要16G以上。
我的MacBook pro 16寸的(内存16G,无cuda)
按照requirements.txt的指导,安装对应的包。基本上都是nlp开发者经常用到的包,不需要特别注意
backend_new.py
是整个问答机器人的核心。这个能运行即可。需要等待一段时间,有加载模型数据和初始化知识库的步骤。
细节部分:
http://0.0.0.0:8010/docs
就能看到所以的暴露接口了。如何把这个向量搜索引擎用起来呢?可以看看front_search.ipynb
文件,这里会教你如何查询一个文本,并且提取结果。
在文件front_admin.ipynb
里面,你可以看到这些内容:
因为你的一切修改,都是在内存里面,如果你的程序结束,那么所有的内容都会消失。比如你维护的知识条目。这个也考虑到了。在http://0.0.0.0:8010/docs
你可以看到一个叫saved2f
接口,运行一下,就会把你的条目放在文件夹QADIR
里面,一个是相似问法的表,一个是标题的表。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。