赞
踩
信息检索、搜索 (简单,效果一般,对数据问答对的要求高)
关键词:tfidf、SVM、朴素贝叶斯、RNN、CNN
知识图谱(相对复杂,效果好,很多论文)
在图形数据库中存储知识和知识间的关系、把问答转化为查询语句、能够实现推理
从{位置}到{位置}的票
2个位置的参考地址:https://juejin.im/entry/59e96f946fb9a04510499c7f
从图可以看出:
可以看出其流程为:
通过上图可知,小蜜的检索式回答的流程大致为:
参考地址:http://www.6aiq.com/article/1536149308075?p=1&m=0
58的客服主要用户为公司端和个人端,智能客服主要实现自动回答,如果回答不好会转到人工客服,其中自动回答需要覆盖的问题包括:业务咨询、投诉建议等
整体来看,58的客服架构分为三个部分
KB-bot的流程大致为:
在问答模型的深度网络模型中使用了多套模型进行融合来获取结果
通过以上两个模型来组合获取相似的问题,返回相似问题ID对应的答案
58同城的闲聊机器人使用三种方法包括:
智能客服解决不了的可以使用人工客服来实现
在小智同学板块实现聊天机器人,能够起到智能客服
的效果,能够为使用app的用户解决基础的问题,而不用额外的人力。
但是由于语料的限制,所以这里使用了编程相关的问题,能够回答类似:python是什么
,python有什么优势
等问题
整个流程的描述如下:
闲聊模型使用了seq2seq模型实现
包含:
问答模型使用了召回和排序的机制来实现,保证获取的速度的同时保证了准确率
下载地址:https://mirror.tuna.tsinghua.edu.cn/help/anaconda/
下载对应电脑版本软件,安装
添加到环境变量
export PATH="/root/miniconda3/bin:$PATH"
创建虚拟环境
conda create -n 名字 python=3.6(版本)
conda env list
切换到虚拟环境
conda activate 名字
退出虚拟环境
conda deactivate 名字
文档地址:https://fasttext.cc/docs/en/support.html
github地址:<https://github.com/facebookresearch/fastText
安装步骤:
git clone https://github.com/facebookresearch/fastText.git
cd fastText
python setup.py install
文档地址:https://github.com/facebookresearch/pysparnn
安装步骤:
git clone https://github.com/facebookresearch/pysparnn.git
python setupy.py install
最终词典的格式:
词语 词性(不要和jieba默认的词性重复)
各种输入法的词典
例如:https://pinyin.sogou.com/dict/cate/index/97?rf=dictindex
例如:https://shurufa.baidu.com/dict_list?cid=211
手动收集,根据目前的需求,我们可以手动收集如下词典
传智
,传智播客
,黑马程序员
python
,人工智能+python
,c++
等输入法的词典都是特殊格式,需要使用特殊的工具才能够把它转化为文本格式
工具名称:深蓝词库转换.exe
下载地址:https://github.com/studyzy/imewlconverter
下载使用不同平台的多个词典之后,把所有的txt文件合并到一起供之后使用
对句子进行分词之后,句子中不重要的词
常用停用词下载地址:https://github.com/goto456/stopwords
对于停用词的具体内容,不同场景下可能需要保留和去除的词语不一样
比如:词语哪个
,很多场景可以删除,但是在判断语义的时候则不行
问答对有两部分,一部分是咨询老师整理的问答对,一部分是excel中的问答对,
最终我们需要把问答对分别整理到两个txt文档中,如下图(左边是问题,右边是答案):
Excel中的问答对如下图:
Excel中的问答对直接使用pandas就能够处理
python_qa_path = "./data/Python短问答-11月汇总.xlsx"
def load_duanwenda():
import pandas as pd
ret = pd.read_excel(python_qa_path)
column_list = ret.columns
assert '问题' in column_list and "答案" in column_list,"excel 中必须包含问题和答案"
for q,a in zip(ret["问题"
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。