赞
踩
智能语音指令解析集成了语音识别(ASR)与信息抽取(IE)等技术,广泛应用于智能语音填单、语音交互、手机APP语音唤醒等场景,提高人机交互效率。其中,智能语音填单可通过口述记录信息,并利用算法解析口述内容中的关键信息,完成自动信息录入。
针对以上场景,利用PaddleSpeech的语音识别技术和PaddleNLP的信息抽取技术,可以自动识别和抽取语音中的关键信息,帮助简化记录流程,提高工作效率和质量。
安装PaddleSpeech与PaddleNLP:
!pip install paddlespeech
!pip install paddlenlp
下载必要数据包与示例音频,并进行初始化设置。
通过PaddleSpeech调用语音识别方法简单易行:
from paddlespeech.cli.asr.infer import ASRExecutor
asr = ASRExecutor()
result = asr(audio_file="ie.wav", force_yes=True)
print(result)
利用PaddleNLP提供的信息抽取能力,直接调用Taskflow API进行预测:
from paddlenlp import Taskflow
schema = ["时间", "出发地", "目的地", "费用"]
ie = Taskflow("information_extraction", schema=schema, task_path="/home/aistudio/work")
ie_result = ie(result)
print(ie_result)
将语音识别与信息抽取功能进行串联,实现语音工单信息抽取的核心功能模块:
def audio_ie(audio_path):
asr_result = asr(audio_file=audio_path, force_yes=True)
ie_result = ie(asr_result)
return ie_result
audio_ie("ie.wav")
构建网页应用,通过前后端交互实现语音工单信息抽取的服务。
利用Vue框架,结合js-audio-recorder库实现网页前端的录音功能。
利用FastAPI框架搭建后端服务,核心功能为语音信息抽取函数。
在aistudio中,通过FastAPI搭建网页应用,模拟网页调用语音工单信息提取的后端服务。
启动FastAPI服务,提供后端服务支持。
通过requests库构造Post请求,模拟调用语音工单信息提取的后端服务。
通过以上步骤,你可以快速上手使用PaddleSpeech与PaddleNLP实现语音工单信息提取的应用,提高工作效率与质量。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。