赞
踩
很高兴与大家分享 Azure AI 语音翻译产品套件的两个重大更新:
视频翻译和增强的实时语音翻译 API。
视频翻译(批量)
今天,我们宣布推出视频翻译预览版,这是一项突破性的服务,旨在改变企业本地化视频内容的方式。随着全球市场对可访问且引人入胜的视频内容的需求不断增长,视频翻译提供了一种无缝解决方案来克服语言障碍。此次发布包括 Azure Speech,客户可以使用自己的视频资产进行试用,并具有以下交钥匙功能:
相应的视频翻译API也即将推出,可以先联系马上获得API早期访问权。视频翻译的客户场景
视频翻译通过授权的视频内容为广泛的商业场景释放商业价值,例如:
视频翻译的语言覆盖范围
视频翻译支持下表中的语言对:
源语言 | 目标语言 |
印地语 | 英语 |
西班牙语 | 英语 |
中国人 | 英语 |
韩国人 | 英语 |
英语 | 印地语 |
英语 | 西班牙语 |
英语 | 中国人 |
英语 | 意大利语 |
英语 | 德语 |
英语 | 俄语 |
我们还计划在未来的版本中迅速扩大我们的语言覆盖范围。
多语言语音翻译(实时)
除了视频翻译之外,我们还很高兴地宣布推出自动多语言语音翻译,这是我们实时语音翻译 API的一项重大增强。此次发布包含一系列新功能,可实现以前无法实现的更高级别的翻译功能:
实时语音翻译的客户场景
以下是多语言语音翻译实现的一些以前不可能实现的新客户场景:
从上述场景可以看出,多语言语音翻译开辟了新的可能性,而这些可能性以前是繁琐、低效或完全不可能的。
多语言语音翻译的语言支持
在公开预览版中,多语言语音翻译将提供输入语言。这意味着这些是 API 将自动检测并从输入之间切换的语言。输出(目标)语言仍然可以是Azure 语音翻译服务支持的任何语言。40 种输入语言如下(以及语言代码):
在即将推出的版本中,我们计划支持语音翻译支持的所有输入语言。语言和区域设置支持将不断更新和扩展,以使我们的模型更易于所有人使用。
目前企业需要通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用Azure AI语音服务的可能,满足国内发票需求。
通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用ChatGPT的可能,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。
参考链接:
微软 Azure AI服务免费申请试用
第一步:注册账号进入官网:
https://azure.microsoft.com/zh-cn/products/ai-services/text-to-speech
点击“免费试用文本转语音”,新用户可获得使用额度,但很少,基本只够测试用
点击“免费开始使用”,这里需要使用微软账号进行登录。
然后进入添加个人信息资料的界面。
手机号验证勾选“其他电话号码”,地区选择中国,然后输入自己的手机号接收验证码即可:
填写完资料后,点击下一步进入信用卡验证,信用卡不会扣费,但要保证里面有1美金才能验证成功。
验证成功后会跳转到Azure主页,点击“转到Azure门户”进入Azure控制台:
第二步:部署语音服务展开左上角菜单栏,打开所有服务:
在所有服务下找到“AI+机器学习”类别,选择语音服务并创建:
创建界面的名称可以随便填,定价层选择“Free F0”,然后点击“审阅并创建”:
继续点击“创建”:
稍等十秒左右语音服务就部署完成了。
第三步:创建语音点击“转到资源”:
继续点击“转到Speech Studio”:
Speech Studio里有很多语音服务,比如“语音转文本”、“语音转字幕”等等,都可以直接使用。
下滑找到文本转语音服务的语音库,点击进入:
在这里我们就可以看到不同国家的各种声音模型,之后Microsoft Azure上新语音模型也会更新到这里。
每个声音模型也都配置了不同的对话场景和情绪,甚至还有各种方言,可以说是目前市面上最全的AI语音库了。
随便点击一个试听一下效果:
,时长00:22
效果虽然没法和开头展示的语音效果相媲美,但是已经非常接近真人声音了。
选择好想用的声音模型,点击转到有声内容创作。
把文本内容粘贴到文本框,点击播放按钮就可以进行语音合成。
右侧操作栏可以设置语言、声音模型和说话风格以及气口停顿等等功能,非常齐全。
语音制作完毕之后,点击保存并导出为本地文件,一份文本转语音文件就制作好了。
之后再制作有声读物、小说推文或者是其他有声内容时就可以直接使用Microsoft Azure。无论是声音模型的丰富度还是功能的易用性,Microsoft Azure基本上就相当于语音合成领域的OpenAI。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。