当前位置:   article > 正文

python如何实现音频转文本(使用百度语音转文本库)_phyton百度语音转文本

phyton百度语音转文本

1 pip install Baidu-Aip

2 在百度开放平台上注册账号,并在控制台中创建应用,选择短语音转文本应用,有几万次的免费配额,超过次数需要付费(价格贵),如图是我自己的

 

 注意事项:

1,音频文件不能是mp3文件,需要将mp3文件转为无损音乐格式:如flac,wav,pcm等等

2,音频文件需要控制在60s以内,如果大于60s,则会报文本超过限制的错误

  1. import os
  2. from aip import AipSpeech
  3. import time
  4. APP_ID = 'id'
  5. API_KEY = 'key'
  6. SECRET_KEY = 'scret'
  7. client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
  8. # 定义函数
  9. def get_file_content(file_path):
  10. with open(file_path, 'rb') as fp:
  11. return fp.read()
  12. def audio_to_text(file_path):
  13. print('converting: ' + file_path)
  14. start_time = time.time()
  15. res = client.asr(get_file_content(file_path), 'pcm', 16000, {
  16. 'dev_pid': 1737,
  17. })
  18. print(res)
  19. print("used time: {}s".format(round(time.time() - start_time, 2)))
  20. if res['result']:
  21. return res['result'][0]
  22. else:
  23. print(res)
  24. audio_to_text(r"path\example.pcm")

如果是批量转化,如下列子

首先安装第三方工具库:pip install generalkit,开源项目地址:https://github.com/jiawade/generalkit,该库包含了很多实用工具,如流式处理,文件处理,音频、视频的裁剪、合并、格式转化等等,请大家帮忙多多点赞支持哈

  1. from kit.stream import Stream
  2. from kit.file_utils import Files
  3. def convert_one_song(song_dir):
  4. files = Files.list_files(song_dir, 'pcm')#列出文件夹中符合pcm高保真的音频文件
  5. text = Stream(files).map(lambda x: audio_to_text(x)).join(', ')
  6. #将文件写入指定位置的文件夹中
  7. Files.write_string_to_file(os.path.join(r'C:\Users\{you_name}\Desktop','{}.txt'.format(Files.get_file_name(song_dir))), text, True)
  8. convert_one_song(r"/path/directory")

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/204943?site
推荐阅读
相关标签
  

闽ICP备14008679号