AI视频翻译有点“忙”

时间

——

　　熟悉的相声演员说着一口地道且流利的英语的视频火爆全网，吸引了80万次点赞。近日，“知名相声演员用英语说相声”“外国明星讲地道中文”等一批由AI翻译软件生成的视频在社交平台引发热议。这些“毫无违和感”的视频，翻译极为流畅，能够达到“以假乱真”的效果，再一次刷新了人们对AI应用边界的认知。AI视频翻译其实是AI换脸、AI换声等相对成熟的技术综合运用的结果。那么，其背后存在哪些风险？该如何看待它的未来发展？带着这些疑问，11月中旬，记者进行了采访。

视频翻译走红网络

　　“一键将视频翻译成29种语言，教程来了！”“快来听听我在直播间说的英文地道不地道？”“NBA球星用流利中文介绍新秀……”在日常生活中，您刷到过这样“轻松飙外语”的短视频吗？其实，这些都是由AI一键翻译视频实现的。
　　熟悉的明星、熟悉的声音、熟悉的语气……不同的是，他们却说着一口地道的外语。“要不是视频下方写着本视频由AI生成，我真以为这些明星的外语特别好呢！”太原市民张元告诉记者，“无论是从他们的声音还是口型，如此‘丝滑’的语音转化，让我感觉不出任何‘破绽’。现在的AI已经发展到这个程度了吗？是不是以后一半翻译专业的人都要失业了？”
　　随着AI技术的快速发展，AI视频智能翻译逐渐兴起并得到广泛应用。记者了解到，在AI视频翻译软件中，用户只需提交满足要求的初始视频，支付一定订阅费用，即可实现二十余种语言的“一键翻译”，呈现出自然的克隆声音和真实的说话风格。相较于之前版本，最新的AI智能翻译软件不仅能够实现“轻松换脸”，甚至连口型都能配合得“天衣无缝”。
　　大数据分析师徐嘉昱表示，AI视频翻译所需要的文字翻译、语音克隆、视频生成等模块在当前阶段的人工智能领域已经相对成熟。“举例来说，对于人物图像，大模型可以直接生成目标人物脸部和嘴部的运动序列，这就使得表情和口型更趋于逼真。”
　　北京外国语大学国际新闻与传播学院科研助理钟盼盼告诉记者，目前AI视频翻译的准确率很高，“几乎可以达到母语者水平”。正因于此，“在海外平台上，已经有不少国外视频博主采用AI视频翻译的方式更新多语种视频。这无疑也给了国际传播一些新思路，技术让优质内容不再受限于语言，能够更广泛触达海内外受众。”

换脸换声存担忧

　　事实上，运用AI实现“换脸”和“换声”的技术，早已“飞入寻常百姓家”。家住太原市迎泽区的王柯然告诉记者，“去年，我就将手机里的导航软件设置成了女儿的声音。女儿按照语音包的提示念了五到十分钟的文本内容，系统便生成了独属于我女儿的声音。”
　　如果说“AI换声”还需要朗读文本作为前提，那么“AI换脸”技术则更为方便快捷，应用也更为普遍。记者随机打开一个短视频软件，在“一键生成旅拍大片”的话题下，输入一张生活照，一秒钟后，生活照就变成了一张极具民族风格的照片。网友@张如意表示“这AI生成的照片，从头饰到妆容，处处彰显着精致。以后都不用去影楼拍艺术照了！”
　　然而，技术下放也让不少网友感到忧虑。在微博话题#AI视频翻译走红涉及哪些风险#的评论区，不少网友留言“看视频的时候挺快乐，可转念一想，现在被换脸的是公众人物，那下一个会不会是我？”“细思极恐！以前还能通过蹩脚的口音判断是不是骗子，现在口音都纯正了……”“连嘴型都能对上这事儿，我是不是可以理解为，以后就算跟人视频通话，也无法确定对方是不是骗子？”
　　记者注意到，越来越低的技术应用门槛也给不法分子提供了可乘之机。近期，#AI歌手翻唱或涉多项侵权行为#等话题登上热搜。无独有偶，多起宣称利用AI技术实施诈骗的案件也在网络上引发关注：通过AI换脸和拟声技术，10分钟骗430万元；AI虚拟人在聊天中筛选出受害者，人工接力实施诈骗……新技术在带来新体验的同时，也带来了全新的挑战。
　　“任何人都可能成为受害者。”德恒律师事务所马克律师表示，近年来，滥用AI技术实施各类侵犯个人信息的行为并不鲜见，“从法律层面来说，制作并发布AI翻译视频，可能侵害被模仿者的姓名权、肖像权、名誉权、表演者权等。此外，对声音进行修改和替换，或提取被模仿者的敏感信息，也有相应法律风险。”

多方合力筑防线

　　无论是AI视频翻译的地道准确，还是ChatGPT4.0版本流畅自如的语音对话体验，人工智能发展的脚步从未停歇，其背后的技术隐患也引发热议。
　　自“AI换脸”现象出现以来，相关部门加紧对涉及“AI换脸”违规违法现象进行整治，相关的法规政策也陆续出台。截至今年8月初，公安机关通过专项会战，侦破“AI换脸”案件79起，抓获犯罪嫌疑人515名。
　　针对“人脸”安全痛点，我国在立法层面有了明确规定和高规格的保护。目前《中华人民共和国民法典》《网络音视频信息服务管理规定》《网络信息内容生态治理规定》等多部法规均涉及深度合成应用的规范。去年1月，国家网信办最新公布的《互联网信息服务深度合成管理规定（征求意见稿）》对深度合成内容的用途、标记、使用范围以及滥用处罚作出具体规定，尤其对作为深度合成服务提供者的平台方进行审核、评估、监管等提出要求。
　　“在今天，从人的画像、身体、位置、行为、情绪与心理、各种关系到社会评价，每一个维度都有可能被数据化。”中国人民大学新闻学院教授彭兰坦言，“人脸、表情、身体动作、声音、指纹，因为各种不同的需要变成一个个‘元件’，不同的数据应用者、服务商从这些元件中各取所需。人的元件也进入各种数据的流水线上，被分析加工，或与其他人的元件重组。”
　　谈到未来人工智能领域发展的新面向，彭兰认为是“日益重视智能技术力量扩张背景下人的存在与价值。无论是从人与技术的互动中观察人机协同、人机信任或人机博弈，还是从人的日常智能传播活动中寻找其行为动机与情感轨迹，都是在以不同的视角关注人的存在”。无论如何，“在与机器的共处中，我们将有更多机会认识自己。”

本报记者李瑶

(责编：刘洋、candy)

今日热点