当前位置:   article > 正文

rasa学习笔记(nlu管道部分)_rasa3.5自定义nlu

rasa3.5自定义nlu

Rasa NLU负责意图提取实体提取。例如,输入“明天上海的天气如何?”,Rasa NLU要提取出改句子的意图是查询天气,以及对应的实体值和类型名:明天日期、上海城市。        Rasa NLU使用有监督算法来完成功能,因此需要开发者提供适当数量的语料,包括意图信息和实体信息。


Rasa NLU在软件架构上设计的很灵活,允许开发者使用各种算法来完成功能,这些算法的具体实现被称为组件(component)。为了让组件灵活配置和维持正确的前后组件的依赖关系,Rasa NLU引入了有向无环图DAG的组件配置系统。

1、语言模型组件:加载模型文件,为后续组件提供框架支持,如初始化spaCyBERT

2、分词组件:将文本分割成词,为后续的高级NLP任务提供基础数据;

3、特征提取组件:提取词语序列的文本特征,可以同时使用多个特征提取组件;

4NER组件:根据前面提供的特征对文本进行命名实体识别;

5、意图分类组件:按照语义对文本进行意图的分类,也成意图识别组件;

6、结构化输出组件:将预测结果整理成结构化数据并输出。这一部分不是以组件的形式提供的,而是流水线内建的功能,开发者不可见。

nlu.yml Rasa NLU的数据文件。包括意图字段和对应的例子。

Rasa NLU的训练数据为yaml格式。从结构上说,训练数据都在键(key)为nlu的列表内。列表中每个元素都是一个字典,依靠字典中的键来区分功能。具有特殊含义的键有 intentsynonym(同义词字段)、regex(正则表达式字段)lookup(查找表字段)。除intent外,其他3个都是可选的。

 

 

 

 

 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/喵喵爱编程/article/detail/982606
推荐阅读
相关标签
  

闽ICP备14008679号