换脸 换声 换语种
AI视频翻译有点“忙”
换脸 换声 换语种
AI视频翻译有点“忙”
熟悉的相声演员说着一口地道且流利的英语的视频火爆全网,吸引了80万次点赞。近日,“知名相声演员用英语说相声”“外国明星讲地道中文”等一批由AI翻译软件生成的视频在社交平台引发热议。这些“毫无违和感”的视频,翻译极为流畅,能够达到“以假乱真”的效果,再一次刷新了人们对AI应用边界的认知。AI视频翻译其实是AI换脸、AI换声等相对成熟的技术综合运用的结果。那么,其背后存在哪些风险?该如何看待它的未来发展?带着这些疑问,11月中旬,记者进行了采访。
视频翻译走红网络
“一键将视频翻译成29种语言,教程来了!”“快来听听我在直播间说的英文地道不地道?”“NBA球星用流利中文介绍新秀……”在日常生活中,您刷到过这样“轻松飙外语”的短视频吗?其实,这些都是由AI一键翻译视频实现的。
熟悉的明星、熟悉的声音、熟悉的语气……不同的是,他们却说着一口地道的外语。“要不是视频下方写着本视频由AI生成,我真以为这些明星的外语特别好呢!”太原市民张元告诉记者,“无论是从他们的声音还是口型,如此‘丝滑’的语音转化,让我感觉不出任何‘破绽’。现在的AI已经发展到这个程度了吗?是不是以后一半翻译专业的人都要失业了?”
随着AI技术的快速发展,AI视频智能翻译逐渐兴起并得到广泛应用。记者了解到,在AI视频翻译软件中,用户只需提交满足要求的初始视频,支付一定订阅费用,即可实现二十余种语言的“一键翻译”,呈现出自然的克隆声音和真实的说话风格。相较于之前版本,最新的AI智能翻译软件不仅能够实现“轻松换脸”,甚至连口型都能配合得“天衣无缝”。
大数据分析师徐嘉昱表示,AI视频翻译所需要的文字翻译、语音克隆、视频生成等模块在当前阶段的人工智能领域已经相对成熟。“举例来说,对于人物图像,大模型可以直接生成目标人物脸部和嘴部的运动序列,这就使得表情和口型更趋于逼真。”
北京外国语大学国际新闻与传播学院科研助理钟盼盼告诉记者,目前AI视频翻译的准确率很高,“几乎可以达到母语者水平”。正因于此,“在海外平台上,已经有不少国外视频博主采用AI视频翻译的方式更新多语种视频。这无疑也给了国际传播一些新思路,技术让优质内容不再受限于语言,能够更广泛触达海内外受众。”
换脸换声存担忧
事实上,运用AI实现“换脸”和“换声”的技术,早已“飞入寻常百姓家”。家住太原市迎泽区的王柯然告诉记者,“去年,我就将手机里的导航软件设置成了女儿的声音。女儿按照语音包的提示念了五到十分钟的文本内容,系统便生成了独属于我女儿的声音。”
如果说“AI换声”还需要朗读文本作为前提,那么“AI换脸”技术则更为方便快捷,应用也更为普遍。记者随机打开一个短视频软件,在“一键生成旅拍大片”的话题下,输入一张生活照,一秒钟后,生活照就变成了一张极具民族风格的照片。网友@张如意表示“这AI生成的照片,从头饰到妆容,处处彰显着精致。以后都不用去影楼拍艺术照了!”
然而,技术下放也让不少网友感到忧虑。在微博话题#AI视频翻译走红涉及哪些风险#的评论区,不少网友留言“看视频的时候挺快乐,可转念一想,现在被换脸的是公众人物,那下一个会不会是我?”“细思极恐!以前还能通过蹩脚的口音判断是不是骗子,现在口音都纯正了……”“连嘴型都能对上这事儿,我是不是可以理解为,以后就算跟人视频通话,也无法确定对方是不是骗子?”
记者注意到,越来越低的技术应用门槛也给不法分子提供了可乘之机。近期,#AI歌手翻唱或涉多项侵权行为#等话题登上热搜。无独有偶,多起宣称利用AI技术实施诈骗的案件也在网络上引发关注:通过AI换脸和拟声技术,10分钟骗430万元;AI虚拟人在聊天中筛选出受害者,人工接力实施诈骗……新技术在带来新体验的同时,也带来了全新的挑战。
“任何人都可能成为受害者。”德恒律师事务所马克律师表示,近年来,滥用AI技术实施各类侵犯个人信息的行为并不鲜见,“从法律层面来说,制作并发布AI翻译视频,可能侵害被模仿者的姓名权、肖像权、名誉权、表演者权等。此外,对声音进行修改和替换,或提取被模仿者的敏感信息,也有相应法律风险。”
多方合力筑防线
无论是AI视频翻译的地道准确,还是ChatGPT4.0版本流畅自如的语音对话体验,人工智能发展的脚步从未停歇,其背后的技术隐患也引发热议。
自“AI换脸”现象出现以来,相关部门加紧对涉及“AI换脸”违规违法现象进行整治,相关的法规政策也陆续出台。截至今年8月初,公安机关通过专项会战,侦破“AI换脸”案件79起,抓获犯罪嫌疑人515名。
针对“人脸”安全痛点,我国在立法层面有了明确规定和高规格的保护。目前《中华人民共和国民法典》《网络音视频信息服务管理规定》《网络信息内容生态治理规定》等多部法规均涉及深度合成应用的规范。去年1月,国家网信办最新公布的《互联网信息服务深度合成管理规定(征求意见稿)》对深度合成内容的用途、标记、使用范围以及滥用处罚作出具体规定,尤其对作为深度合成服务提供者的平台方进行审核、评估、监管等提出要求。
“在今天,从人的画像、身体、位置、行为、情绪与心理、各种关系到社会评价,每一个维度都有可能被数据化。”中国人民大学新闻学院教授彭兰坦言,“人脸、表情、身体动作、声音、指纹,因为各种不同的需要变成一个个‘元件’,不同的数据应用者、服务商从这些元件中各取所需。人的元件也进入各种数据的流水线上,被分析加工,或与其他人的元件重组。”
谈到未来人工智能领域发展的新面向,彭兰认为是“日益重视智能技术力量扩张背景下人的存在与价值。无论是从人与技术的互动中观察人机协同、人机信任或人机博弈,还是从人的日常智能传播活动中寻找其行为动机与情感轨迹,都是在以不同的视角关注人的存在”。无论如何,“在与机器的共处中,我们将有更多机会认识自己。”
本报记者李瑶
山西日报、山西晚报、山西农民报、山西经济日报、山西法制报、山西市场导报所有自采新闻(含图片)独家授权山西新闻网发布,未经允许不得转载或镜像;授权转载务必注明来源,例:"山西新闻网-山西日报 "。
凡本网未注明"来源:山西新闻网(或山西新闻网——XXX报)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。