当前位置:   article > 正文

遨博协作机器人ROS开发 - 麦克风阵列语音模块ROS驱动_阵列麦克风 语音识别模块

阵列麦克风 语音识别模块

目录

一、简介

二、环境版本

三、学习目标

四、知识储备

五、任务实施

六、任务拓展

七、课堂小结

八、课后练习


一、简介

大家好,欢迎关注遨博学院带来的系列技术分享文章(协作机器人ROS开发),在前面课程中我们讲解了Intel RealSense深度相机ROS驱动相关知识,接下来我们来学习机器感知中语音使用到的硬件(麦克风阵列语音模块)在ROS下的驱动。

麦克风阵列语音模块ROS驱动

二、环境版本

  • 主机系统版本:Windwos10 64位
  • 处理器型号:Intel-i7
  • 虚拟机版本:VMware Workstation 16 Pro
  • 虚拟机系统:Ubuntu 18.04.6 LTS
  • ROS版本:Melodic

三、学习目标

四、知识储备

下面开始介绍本节内容的知识点:

首先学习什么是麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。

智能扬声器设计中使用的典型麦克风模式分为如下两种。环形阵列和线性阵列设计。区别如下。

 

麦克风阵列有以下功能特点。

人机交互过程中的噪声可以分为以下几类:回声,混响,干扰和背景噪声。

相应的麦克风阵列具备这样的功能:回声控制,回声消除,回声抑制;波束形成,声源定位,语音增强;去混响,干扰抑制,盲源分离;噪声控制,主动噪声控制,降噪。

 

 接下来认识麦克风阵列语音模块。

五、任务实施

1.安装ROS驱动程序。

将本课程中使用的驱动包拷贝至遨博学院ROS工作空间src目录并解压。使用rosdep命令安装缺失的依赖项。 

安装respeaker ROS python依赖包。 

之后执行如下命令,初始化工作空间并构建respeaker ROS功能包。

2.对语音模块提供外部设备许可。 

3.运行respeaker程序功能包。 

在第三个Tab页面,执行如下命令查看topic列表。

 可以通过rostopic echo命令查看主题实时输出信息。例如查看声源定位方向,执行如下命令。

其中声源定位角度定义如图所示。

也可以通过rostopic pub命令控制LED灯状态,例如在刚才第三个Tab页面执行如下命令。

六、任务拓展

尝试使用开放式嵌入式试听系统ODAS进行声源方位可视化查看

开源地址如下。 

七、课堂小结

下面我们进行课堂小结:

1.简述麦克风阵列语音模块ROS驱动中发布的主题名称及含义。

2.在使用ROS驱动功能包前,需确保声学算法相应参数初始化完毕,否则无法正常使用。

八、课后练习

1.在遨博学院ROS虚拟机环境下完成麦克风阵列语音模块ROS驱动的部署与测试。

2.学习语音编程相关python库(语音识别、语音合成、自然语言处理等)的使用,为后续编写ROS应用打下基础。

在接下来的ROS课程中,我们会讲解机器人手眼标定原理,欢迎持续关注。  

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/602762
推荐阅读
相关标签
  

闽ICP备14008679号