“人机耦合”变成“人机大战” AI同传离成熟还有多远

作者：凡人多烦事01 | 2024-05-26 14:15:48

踩

ai同声传译距离实现

640?wx_fmt=jpeg

来源：科学网

9月21日，一篇指责科大讯飞“AI同传造假”的文章引发了社会广泛关注，文中知乎用户、同传译员Bell Wang表示，在日前举行的2018创新与新兴产业发展国际会议上，科大讯飞在现场和直播中展示的“AI同传”，用的其实是自己现场同传翻译的内容。

当晚，科大讯飞在电话会议回应中称：应主办方要求提供语音识别技术，直接转写译员翻译结果在会场大屏呈现，主办方同时要求在直播中合成识别结果，展示最新语音合成技术。

早在2017年，“科大讯飞翻译机让同传下岗”的文章就刷爆各大平台，表示同声传译职业将直接消亡、被科大讯飞机器翻译技术完全替代。这次的事件再一次引发热烈讨论：机器翻译技术与同声传译之间到底还有多少差距？

事件回溯与科大讯飞回应

9月20日，Bell Wang发表文章称“要揭露一下所谓智能翻译的真相”，他表示在知领直播平台的“机器同传”，就是把同传译员的声音精确转录为文本，然后再语音合成为机器声音向听众播放。

文章称，“科大讯飞事前没有告知有语音识别的字幕，没有告知直播的同传是机器朗读同传经过识别出来的文稿，更没有征得同意就冒名使用了译员翻译成果。”

他的文章发出后，同传圈也“炸了锅”。微博博主“同声翻译樱桃羊”表示：“现在这种所谓的‘人机耦合’，实行之前和译员沟通过么？有没有调查过译员是否接受这种方式？纵观整件事，译员的意见在哪一个环节得到了尊重？” 当晚，针对Bell Wang的质疑，科大讯飞回应称：“科大讯飞目前翻译服务主要提供两种方案：一种是全自动翻译，现场机器翻译并同步展示在屏幕上，没有任何人工同传参与；另一种是人机耦合翻译模式，由机器提供语音转写和翻译结果给同传参考。”

机器同时提供转写和翻译服务时，文字展示区Logo显示为“讯飞听见—离线翻译系统”；机器仅提供转写服务时，文字展示区Logo显示为“讯飞听见”。

科大讯飞表示，“某位同传译员对于科大讯飞产生了误解，是对会议服务方面的分工沟通了解不清，也没有听到科大讯飞的说明。”

针对科大讯飞的回应，他表示不能接受采访。对科大讯飞提到的“应主办方要求展示最新语音合成技术”，他回应道：“只能无可奉告，我不能说啥”。

注意到，Bell Wang在知乎上的文章在9月21日晚上有修改痕迹，他在开头声明：对视频进行了修改。

机器翻译能否替代同传译员？

来自科大讯飞微信公众号的内容显示，目前机器翻译的主流方式叫“统计翻译”，其基本原理是：从语料库大量的翻译实例中自动学习翻译知识，然后利用这些翻译知识自动翻译其他句子。

那么随着机器翻译技术的进步，不少人会发出疑问：机器会抢同声传译的饭碗吗？

科大讯飞创始人、董事长刘庆峰表示：“我们希望用机器帮助顶尖同传更好地发展他的能力，机器和人未来必须是协同的。”

一位不愿具名的专家说：“讯飞的技术在国内语音行业积累较多，但目前的情况是，人工智能只是处在初级阶段，机器翻译的难点在于语音识别和语义识别。在语义识别上，现在全球做得都不是太好。”

“目前机器在字、词的识别速度上是快于人的，但人在语意理解和提炼上又优于机器。因此，各取所长、优势互补的人机耦合是一个重要发展方向。”一位讯飞听见工作人员在接受其他媒体采访时说。

9月21日，大讯飞执行总裁、消费者事业群总裁胡郁，他表示“要找市场部和公关部，本人不作回应”。但当天下午胡郁在微博发声：“目前整个行业机器同传处于风口浪尖之上，不同厂商之间的竞争日加激烈，主要原因还是动了谁的奶酪吧。”

上述不具名的专家认为，网络媒体对人工智能存在过度宣传和炒作。“受到利益驱使，一些企业利用媒体进行宣传，同时网络媒体也不会对内容和信息准确性进行核实，就造成了目前的状况。”

胡郁还在微博中表示：“我相信大家也都知道科大讯飞真正的机器同传和将同传人员的语音转换成文字贴出来便于大家理解是两个完全不同的事情。不管是前者还是后者，都经过了广大最终用户和同传从业人员的检验，我就不再多说了。”

专家表示AI同传还不是一项成熟技术

自1989年美国成功做出第一个语音翻译系统以来，众多科研机构和包括微软、百度在内的公司都在进行AI翻译的研究。得益于人工神经网络的深入研究，这些年，AI同传技术发展很快。

“但是，这仍然不是一项成熟的技术，AI同传仍然有很多技术难题需要攻克。”中国科学院自动化研究所研究员宗成庆说。

就目前AI同传技术水平而言，在某些简单的场景中，可以实现较准确的语言同步翻译，如问路。但是，在复杂、专业、严谨的场景中，AI无法实现精准翻译，做到“信”“达”“雅”。

出于语言本身的特点，词汇有多重含义，且经常出现有歧义、似是而非的语句。其次，口语的规范性不高，有很多省略、颠倒句式。此外，说话人的口音、语速、多种语言混合，场景其他声源的干扰，也会让AI同传“不知所措”。

“但最重要的一点是，机器无法精准把握说话人的意图。对语义的理解不够，是目前AI同传尚未解决的一大难题。因此，目前AI同传无法高水平地替代人工翻译。”宗成庆说。

宗成庆介绍，语音转文字技术主要的难点是同音字、词的处理，不同的字、词有相同的发音，需要结合上下文进行判断，如“保鲜”和“保先”、“反攻”和“返工”。

由于语音识别技术不需要太多的语言理解，在声源干扰不强烈的情况下，较标准的语音可以转换成准确率较高文本。“这比AI同传成熟得多、容易得多。”宗成庆表示。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能，互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）云脑研究计划，构建互联网（城市）云脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/凡人多烦事01/article/detail/627028