赞
踩
Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发
我来宣传一下自己开发的用来处理语音数据的库。
PraatIO提供了读写praat格式文件的工具,它是一种跨平台的应用,主要为学术社区提供了可视化,抄录,编辑以及提取语音信息的功能。
这个库的主要功能在于读写转录,可用于提取语音数据的信息。这个库即可以与praat结合使用也可以脱离其使用。
https://github.com/timmahrt/praatIO
ProMo——Prosody Morph的简称——是一个可以对持续性或高音文件进行复杂处理的库。人们可以扩展不同的单词,比如说改变一个语句的单调。
https://github.com/timmahrt/ProMo
Pysle是python中针对Isle字典的一个接口——该字典是包含了英文中重音信息的发音字典。通过使用pysle,人们可以自动地标记出转录演讲中的重音。有一个函数可以使用PraatIO根据重音信息标记出textgrid。
https://github.com/timmahrt/pysle
PyAcousitics是我目前工作相关的内容。PraatIO和ProMo都是从pyAcoustics中分离出来的。它虽然有些杂乱,但是包含了许多有用的工具。当你需要从语音数据中提取或者修改信息时你会发现它很有用。
https://github.com/timmahrt/pyAcoustics
[备注:我忘记了pysle,现在把它加到列表中。
备注2:每一个库都包含了演示代码来展示相关的功能,另外在核心功能上也在文档中添加了readme文件。Windows中的二进制安装文件目前也可以使用了。ProMo中的readme文件也包含了图像示意图。
备注3:修改格式,抱歉,我对reddit还不太熟悉。
备注4:可参见 /r/Linguistics:https://www.reddit.com/r/linguistics/comments/4fsa0s/python_2x3x_libraries_for_working_with_speech/]
英文原文:https://www.reddit.com/r/Python/comments/4fmmt1/python_2x3x_libraries_for_working_with_speech_data/
译者:dlgao
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。