赞
踩
前不久,OPPO旗下的人工智能助手“小布助手”月度活跃用户数突破一亿,成为国内首个月活用户数破亿的手机语音助手。
经过2年多的成长,小布助手在能力上实现大幅升级,也融入了我们身边便捷的服务功能。小布团队亦克服了诸多技术难点,为用户带来了更智能的服务。为此,小布团队撰写了一系列文章,详细介绍小布助手背后的技术支撑,本文是揭秘小布背后技术的第四篇,主要介绍技能平台的实践与思考。
小布助手做为新兴交互入口,是OPPO万物互融战略的关键节点,通过小布可以为用户提供丰富的技能体验、全面又贴心的对话能力。
同时,由于现有技能&对话多数形态固定、技术相对通用且以量盖面的特点。迫切需要降低对话技能算法研发的门槛,支撑内外部开发者大量建设对话技能。小布助手团队于19年底开始布局技能平台,过程中也积累部分对于平台化的思考。
平台化的优势是:降低研发成本、加速上线、提升稳定性、加速能力扩散、统一数据资产、集团资源高效利用。
平台化潜在的风险:
因此,小布技能平台的构建思路是:
中台不是万能的,它仅仅适用于在高确定性和通用性的场景。
技能平台的定位:面向通用对话&技能,提供免代码、高效、低成本的技能及对话全流程研发能力,助力无处不在的小布助手技能生态建设。
首先我们看一下完整的对话流程,如上图所述,共分为8个环节。
技能平台主要负责其中右边3、4、5、6 的4个环节,而其中如何做到有效的数据流转、低成本能力建设就是我们所需要解决的核心问题。当然,其中也面临着不少的挑战。
对话系统 (Dialog System) 是“让机器理解并处理人类对话的系统”,核心是模仿及抽象人与人之间沟通的方式,将对话抽象成具体的任务模块:TTS(倾听)、NLU(理解)、Policy(记忆、见人说人话)、Action(组织语言)。
为了保证对话系统主体链路的稳定性及灵活性,小布的整体思路是“轻中控,重模块化”。目前的算法工作主要围绕NLU、Policy两个模块展开,其中 Policy 目前主要以规则及产品策略为主,因此下面重点介绍语义理解部分的一些算法事件经验。
语义理解主要是将Query 映射到具体的动作空间,并且提取动作执行所能识别的标准值,具体算法建模为意图理解和槽位解析。
小布技能平台覆盖了分类、语义匹配、文本匹配等三类意图理解方式,以及若干槽位解析能力,下面将展开详解。
文本分类:通过文本分类的方式进行意图理解,能够在有限域内完成更精细化的意图理解。其准召的天花板较高,业内及小布技能平均准召在反复迭代优化后普遍能够做到90%以上。
意图理解的文本分类,其本质是一个N+1 分类的多分类任务。
N:指域内需要理解的用户意图,如音乐领域包含:点播歌手的歌曲、随机播放歌曲、查询信息、点播类型音乐等等。
1:是指的域外的other意图,所有非该领域意图的query 都需要分类模型能够拒绝,避免无论用户说什么问题都会一定分类到域内意图。
由于“other”意图近乎无穷,因此意图理解分类同时也是一个严重样本不均衡任务。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。