结合Praat进行语音实验的步骤

作者：不正经 | 2024-02-28 16:08:47

踩

praat

[更新日期：2020年04月20日本站所有Praat脚本都不再提供更新，请大家移步https://github.com/feelins/Praat_Scripts下载最新的代码，可以采用git clone到本地的方法(具体操作要熟悉github相关操作)，也可以点击页面的Clone or download，然后选择Download Zip下载整个Praat脚本目录到本地直接打开使用。微信公众号：语音处理小站 ]

近期更新了几篇Praat脚本从标注的TextGrid里提取数据一些脚本，发现有一些朋友会问到更细节的问题，于是有一个想法把结合Praat进行一个语音学上常用的实验研究的步骤都整理出来，希望对需要的朋友有所帮助。其实从事语音研究的可能大部分是语言学专业，对一些软件，脚本的使用可能不如工科类学生掌握快，而如果是一个工科出身的如果掌握这类的软件，脚本，可能不屑于看太仔细的说明，本文是针对偏语言学专业，力求让大家在进行实验研究的时候，不会太纠结于如何使用，而能更快速的完成自己的实验。欢迎提问，我会随时更新，以便能够力求完善。以下是我列出的一些主要操作，或者需要的相关研究，如果有更多的需求，未能列出，欢迎指出。

准备：Praat的基本使用

Praat目前已经成为比较流行的语音处理的软件，它的使用也很方便，目前在网上有很多类似的教程，最有名的当属社科院语言所熊老师的教程，可以在语言所官方网站下载到（http://paslab.phonetics.org.cn/index.php/people/innovation_faculty/xiong_zi_yu/ ，在这个页面有一个熊子瑜，2004，《Praat 语音软件使用手册》），千万不要轻信个别网站的信息去购买这个教程。我在这里只提几个简单的操作，打开文件，标注文件，认识语谱图的几个主要特征，以及保存文件，其它操作如有兴趣可以下载熊老师的教程，仔细研读。

打开文件

1. 打开Praat---Open---Read from file...---找到对应的声音或者Textrid文件，打开即可

2. 打开到Praat窗口以后，创建一个空白的标注文件

Annotate---To TextGrid...

注意提前规划好你需要对这个声音文件标注几层信息，通常会标注音素信息，音节，或者字词信息，韵律信息，或者一些其它的信息，任意多层都可以设置，在这里只举例设置音素层和音节层。

3. 把声音文件和TextGrid文件都选择上，点击View & Edit，就可以进行标注了，标注时，根据听辨边界，以及查看语图的信息，确定音素或者音节的边界。具体的操作可参考熊老师的教程。

4. 认识语图上的几个主要特征，如果看不到基频线，共振峰线或者音强线，使用上面菜单上的show pitch, show formant, show intersity就可以了。

5. 保存文件

Praat---Save---Save as text file...---将这个标注文件保存为****.TextGrid即可。

第一步：录音阶段

语音学实验肯定是离不开录音，这里有很多选择，但是这一步不是本文的重点，因为可能每个人要求、条件不同，理论上我们建议所有人的录音都要高保真，即都要在专业的录音棚里，保证所有的声音在统一的条件下，几乎做到没有噪声控制的最低，这样的声音是最好的。但是未必大家都会有这样的条件，举例来说，如果一个人要做一个小方言的研究，可能这个方言的区域都是比较偏远的地区，这些地方甚至出行都比较困难，可能很难有这样专业的录音场所，而且由于录音对象的选择，也未必可能把所有录音人都请到专业录音棚里，所以这时候只能退而求其次，带着一些设备到他们身边，这也有一个专门的领域称为“田野语音学”。所以这时候，你可能只能保证自己所带的设备，尽量能够做到抗噪性较好。我不是对设备比较专业的人，这方面可能可以咨询一下记者类的工作人员，他们有一些便携的设备可以采用。另外也可以通过自己的笔记本，配置一个外置声卡，一个相对较专业的话筒，也足够了。

不管是采用什么方式，最终我们需要的是这些设备+软件采集到的声音文件，通常我们需要的是wav格式，尽量不要使用mp3之类的格式，这是经过压缩的。wav格式一般注意一下采样率在16K以上，具体的录音过程请搜索更专业的文章，如果是用个人电脑录音，推荐使用CoolEdit或者Adobe Audition录音。

另外在录音时还有一个细节，相信每个人的研究都不是简单的几个声音，而是成批的，比如上百个声音，或者上千个，每个声音单位可能是一个元音辅音，一个字，一个词，一个句子。。。这时候就要注意录音的方式了。一种方式是你每录完一个单位，比如录完一个词“开始”，然后停下录音，然后把这个声音保存为比如Test001_开始.wav，然后进行下一个词，如果这样录上千个声音，那被录音人可是受不了的！所以一般的情况，我们需要给一个列表，然后让录音人一直录下去，最后把这个大的声音要进行切分，切成这样小的单位。为什么要切分呢？因为不切分，无论是标注，还是提取数据，等都非常不方便，而且不利于检索。

这里就涉及到一个切分的方法问题，你可以再通过笨方法，用CoolEdit打开这个长声音，一个声音一个声音的选择上，然后分别保存为自己需要的名称，几千个文件下来，相信已经头晕眼花，而且容易出错。下一步就是推荐一个相对较灵巧的办法，当然是可选的。另外这个办法的前提你要保证录音中每个单位之间有较足够的停顿，而不是连接在一起的。以下给出一个例子，保持这样的方式，就是比较容易使用自动切分的。