rasa学习笔记（nlu管道部分）_rasa3.5自定义nlu

作者：喵喵爱编程 | 2024-08-15 07:42:50

踩

rasa3.5自定义nlu

Rasa NLU负责意图提取和实体提取。例如，输入“明天上海的天气如何？”，Rasa NLU要提取出改句子的意图是查询天气，以及对应的实体值和类型名：明天—日期、上海—城市。 Rasa NLU使用有监督算法来完成功能，因此需要开发者提供适当数量的语料，包括意图信息和实体信息。

Rasa NLU在软件架构上设计的很灵活，允许开发者使用各种算法来完成功能，这些算法的具体实现被称为组件（component）。为了让组件灵活配置和维持正确的前后组件的依赖关系，Rasa NLU引入了有向无环图DAG的组件配置系统。

1、语言模型组件：加载模型文件，为后续组件提供框架支持，如初始化spaCy和BERT；

2、分词组件：将文本分割成词，为后续的高级NLP任务提供基础数据；

3、特征提取组件：提取词语序列的文本特征，可以同时使用多个特征提取组件；

4、NER组件：根据前面提供的特征对文本进行命名实体识别；

5、意图分类组件：按照语义对文本进行意图的分类，也成意图识别组件；

6、结构化输出组件：将预测结果整理成结构化数据并输出。这一部分不是以组件的形式提供的，而是流水线内建的功能，开发者不可见。

nlu.yml 是Rasa NLU的数据文件。包括意图字段和对应的例子。

Rasa NLU的训练数据为yaml格式。从结构上说，训练数据都在键（key）为nlu的列表内。列表中每个元素都是一个字典，依靠字典中的键来区分功能。具有特殊含义的键有 intent、synonym(同义词字段)、regex(正则表达式字段)、lookup(查找表字段)。除intent外，其他3个都是可选的。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/喵喵爱编程/article/detail/982606