赞
踩
Rasa NLU负责意图提取和实体提取。例如,输入“明天上海的天气如何?”,Rasa NLU要提取出改句子的意图是查询天气,以及对应的实体值和类型名:明天—日期、上海—城市。 Rasa NLU使用有监督算法来完成功能,因此需要开发者提供适当数量的语料,包括意图信息和实体信息。
Rasa NLU在软件架构上设计的很灵活,允许开发者使用各种算法来完成功能,这些算法的具体实现被称为组件(component)。为了让组件灵活配置和维持正确的前后组件的依赖关系,Rasa NLU引入了有向无环图DAG的组件配置系统。
1、语言模型组件:加载模型文件,为后续组件提供框架支持,如初始化spaCy和BERT;
2、分词组件:将文本分割成词,为后续的高级NLP任务提供基础数据;
3、特征提取组件:提取词语序列的文本特征,可以同时使用多个特征提取组件;
4、NER组件:根据前面提供的特征对文本进行命名实体识别;
5、意图分类组件:按照语义对文本进行意图的分类,也成意图识别组件;
6、结构化输出组件:将预测结果整理成结构化数据并输出。这一部分不是以组件的形式提供的,而是流水线内建的功能,开发者不可见。
nlu.yml 是Rasa NLU的数据文件。包括意图字段和对应的例子。
Rasa NLU的训练数据为yaml格式。从结构上说,训练数据都在键(key)为nlu的列表内。列表中每个元素都是一个字典,依靠字典中的键来区分功能。具有特殊含义的键有 intent、synonym(同义词字段)、regex(正则表达式字段)、lookup(查找表字段)。除intent外,其他3个都是可选的。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。