赞
踩
训练数据主要分为三大块,nlu,rule, story,存放在data目录下
NLU(自然语言理解)的目标是从用户消息中提取结构化信息。这通常包括用户的意图和他们的消息包含的任何实体。您可以向训练数据添加额外的信息,如正则表达式和查找表,以帮助模型正确识别意图和实体。
nlu里的数据内容如下:
规则是一种训练数据,用于训练助理的对话管理模型。规则描述了应该始终遵循相同路径的简短对话片段。可以简单理解为是基于规则的对话模板
data/rules/clock.yml
这里拿第一个rule简单介绍一下什么意思,第一个rule是 query clock,是用户查询闹钟的逻辑,这个rule的意思是,当检测到用户的意图是query_clock(查询闹钟),执行对应的action为utter_query_clock
故事是一种训练数据,用于训练助理的对话管理模型。故事可以用来训练模型,使其能够归纳出看不见的对话路径。(上面说了rule可以理解为基于规则的对话,story刚好和他相反,story定义的是正常的对话逻辑,不是强制性的,让模型去学习,自己判断怎么根据用户的意图作出对应的回答,因为闹钟这个技能比较简单,所以就没有用到story数据)
domain定义了您的助手工作的范围。它指定了你的机器人应该知道的意图、实体、插槽、响应、表单和动作。它还定义了会话会话的配置。
domain/clock.yml
我们在NLU里定义的意图,实体,槽位,和自定义action,都需要写进domain文件里
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。