赞
踩
【2020-11-07】
我认领的是演讲《AI/ML如何加速小分子药物发现》的英文校验任务。演讲的分享者黄毅汪,是法国亚创生命科学部门Team Leader,也是算法工程师。
因为涉及机器学习和深度学习领域的术语,在加入的时候大家填过自己的英语水平和专业背景简介,可能比较合适吧,所以就领到了这个英文校验的任务。
我觉得这个任务说简单也简单,说难也难。
一是它需要有良好的英语听力能力,二是要有一点专业知识背景,三就是需要多一些细心和耐心了。
演讲者应该是个上海人或湖蓝人吧,至少很肯定是南方人。大部分还是听得懂的,但是有些词还是费了一些力气去听懂,尤其带N和L的词。口音很阔耐。2333
我拿到的不是裸的演讲视频,它是使用了Transflow经过了AI翻译,并且打上了时间轴的演讲视频。
从这里的流程图上可以清晰的看到它的整个翻译流程,共有5步:AI翻译--人工校验--AI翻译--人工翻译--完成。
我认领的就是第二个阶段人工校验的工作。
当然如果你熟悉语音识别和NLP的话,你就会意识到,其实我这是帮人家的语音识别算法做了人工校验的工作。【心塞,还是免费的。】
但我觉得Transflow这套工作流程很棒,工具也非常的简洁好用。
但这个工作要向快速高效的完成,也是需要一点技巧的。毕竟AI的翻译还是有很多问题的。
把长的英文句子断开,把AI错误断开的句子进行合并。
这样先把整体框架拆好了,同时又保证了时间轴是对的,免得后期字幕和视频对不上。
如果时间轴对不上,只能手动调整句子右侧对应的时间戳了。还是有点麻烦的。
当然不要求一遍就完成,如果实在听不清、不确定的单词可以先放下。
因为整个演讲是主题连贯的,在翻译后面的字母时,你可能会忽然明白前面作者没有发音清楚的那个词到底是啥。
翻译完一遍后,再进行第二遍第三遍的校验是肯定需要的。所以,不用急于一次做到完美。
当然,还是提醒下一定要及时保存。
虽然Transflow很友好的每隔两分钟会帮你自动保存一下,但还是在改了一些后记得保存一下。
我在改到一半的时候,因为操作了快捷键,Transflow意外退出了.还好之前的翻译都有保存。如果没有保存的话,真的是前功尽弃了。
如果没什么问题,那么工作就完成了,就可以点提交了。
如果到了最后还是有些单词实在没办法听清,那么就使用句子左侧的星星标记一下,方便留给后面流程的人工翻译的同学重点检查。
个人工作也是非常的忙,近期也开始了新的项目,还是需要自己探索的有点开放的题目。
但是能遇到这么有意思的翻译工作还是蛮开心的,比较好玩。
【2020-11-14】
因为上周个人工作比较顺利的开展,所以本周又认领了一份演讲视频的翻译校验工作。
这次我选了中文校验,还是想要多些不同的体验,同时演讲的主题也是我想去了解的。
我本以为中文校验比英文要简单一些,毕竟是母语。
但是事实狠狠地打了我一巴掌。
因为Transflow对英文的语音识别比中文好太多了,中文的识别简直就是灾难,准确率相当之低。
再加上中文的断句不是那么明显,经常就是一大段一大段的句子,很多都需要去断句。
而且演讲者用中文演讲时,会有有很多个人的口语习惯,比如语速很快、话很密集,
或者很多语气词,呃,这个,那个,啊,嘛,等等,简直让校验工作难上加难。
Transflow还有一点不好的地方就是中文校验文本界面操作极其不友好,经常一个空格打不出来,删除空格造成换行等。
这些都让中文校验工作很难顺利进行。
所以,我一个小时才校验了5分钟的视频,你就可想而知有多不友好了。
这个演讲视频时长是40分钟,我真的是欲哭无泪了。
从这个教训里让自己学会注意自己的演讲语速和语言。不可以这么多的语气词,语速也要适当。
毕竟很多场合都需要工作分享和当众讲话,听众还是需要舒服的感受的。
大约就是我认领的第一个视频演讲者的语速比较慢,时长也合适,让我对其他演讲者也抱着同样的感觉,就轻敌了。
原来并不是所有的演讲者都能做到语速合适、停顿合适的。
进入正题,还是分享下中文校验的经验。
除了与上面英文相同的步骤,先断句外,另外就是
如,这个、那个、呃、呢、啊等等
原句:我叫**,是作为这个谷歌开发的专家这个身份,然后来给大家这次来介绍一下TensorFlow2的一些最新的一个特性。
调整后:我叫**,作为谷歌开发者专家,为大家分享TensorFlow2的部分最新特性。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。