換臉 換聲 換語種

AI視頻翻譯有點“忙”

山西新聞網>>新聞頻道>>傳媒視點

時 間
/
分 享
評 論


  熟悉的相聲演員說著一口地道且流利的英語的視頻火爆全網,吸引了80萬次點贊。近日,“知名相聲演員用英語說相聲”“外國明星講地道中文”等一批由AI翻譯軟件生成的視頻在社交平台引發熱議。這些“毫無違和感”的視頻,翻譯極為流暢,能夠達到“以假亂真”的效果,再一次刷新了人們對AI應用邊界的認知。AI視頻翻譯其實是AI換臉、AI換聲等相對成熟的技術綜合運用的結果。那麼,其背后存在哪些風險?該如何看待它的未來發展?帶著這些疑問,11月中旬,記者進行了採訪。

視頻翻譯走紅網絡

  “一鍵將視頻翻譯成29種語言,教程來了!”“快來聽聽我在直播間說的英文地道不地道?”“NBA球星用流利中文介紹新秀……”在日常生活中,您刷到過這樣“輕鬆飆外語”的短視頻嗎?其實,這些都是由AI一鍵翻譯視頻實現的。
  熟悉的明星、熟悉的聲音、熟悉的語氣……不同的是,他們卻說著一口地道的外語。“要不是視頻下方寫著本視頻由AI生成,我真以為這些明星的外語特別好呢!”太原市民張元告訴記者,“無論是從他們的聲音還是口型,如此‘絲滑’的語音轉化,讓我感覺不出任何‘破綻’。現在的AI已經發展到這個程度了嗎?是不是以后一半翻譯專業的人都要失業了?”
  隨著AI技術的快速發展,AI視頻智能翻譯逐漸興起並得到廣泛應用。記者了解到,在AI視頻翻譯軟件中,用戶隻需提交滿足要求的初始視頻,支付一定訂閱費用,即可實現二十余種語言的“一鍵翻譯”,呈現出自然的克隆聲音和真實的說話風格。相較於之前版本,最新的AI智能翻譯軟件不僅能夠實現“輕鬆換臉”,甚至連口型都能配合得“天衣無縫”。
  大數據分析師徐嘉昱表示,AI視頻翻譯所需要的文字翻譯、語音克隆、視頻生成等模塊在當前階段的人工智能領域已經相對成熟。“舉例來說,對於人物圖像,大模型可以直接生成目標人物臉部和嘴部的運動序列,這就使得表情和口型更趨於逼真。”
  北京外國語大學國際新聞與傳播學院科研助理鐘盼盼告訴記者,目前AI視頻翻譯的准確率很高,“幾乎可以達到母語者水平”。正因於此,“在海外平台上,已經有不少國外視頻博主採用AI視頻翻譯的方式更新多語種視頻。這無疑也給了國際傳播一些新思路,技術讓優質內容不再受限於語言,能夠更廣泛觸達海內外受眾。”

換臉換聲存擔憂

  事實上,運用AI實現“換臉”和“換聲”的技術,早已“飛入尋常百姓家”。家住太原市迎澤區的王柯然告訴記者,“去年,我就將手機裡的導航軟件設置成了女兒的聲音。女兒按照語音包的提示念了五到十分鐘的文本內容,系統便生成了獨屬於我女兒的聲音。”
  如果說“AI換聲”還需要朗讀文本作為前提,那麼“AI換臉”技術則更為方便快捷,應用也更為普遍。記者隨機打開一個短視頻軟件,在“一鍵生成旅拍大片”的話題下,輸入一張生活照,一秒鐘后,生活照就變成了一張極具民族風格的照片。網友@張如意表示“這AI生成的照片,從頭飾到妝容,處處彰顯著精致。以后都不用去影樓拍藝術照了!”
  然而,技術下放也讓不少網友感到憂慮。在微博話題#AI視頻翻譯走紅涉及哪些風險#的評論區,不少網友留言“看視頻的時候挺快樂,可轉念一想,現在被換臉的是公眾人物,那下一個會不會是我?”“細思極恐!以前還能通過蹩腳的口音判斷是不是騙子,現在口音都純正了……”“連嘴型都能對上這事兒,我是不是可以理解為,以后就算跟人視頻通話,也無法確定對方是不是騙子?”
  記者注意到,越來越低的技術應用門檻也給不法分子提供了可乘之機。近期,#AI歌手翻唱或涉多項侵權行為#等話題登上熱搜。無獨有偶,多起宣稱利用AI技術實施詐騙的案件也在網絡上引發關注:通過AI換臉和擬聲技術,10分鐘騙430萬元﹔AI虛擬人在聊天中篩選出受害者,人工接力實施詐騙……新技術在帶來新體驗的同時,也帶來了全新的挑戰。
  “任何人都可能成為受害者。”德恆律師事務所馬克律師表示,近年來,濫用AI技術實施各類侵犯個人信息的行為並不鮮見,“從法律層面來說,制作並發布AI翻譯視頻,可能侵害被模仿者的姓名權、肖像權、名譽權、表演者權等。此外,對聲音進行修改和替換,或提取被模仿者的敏感信息,也有相應法律風險。”

多方合力筑防線

  無論是AI視頻翻譯的地道准確,還是ChatGPT4.0版本流暢自如的語音對話體驗,人工智能發展的腳步從未停歇,其背后的技術隱患也引發熱議。
  自“AI換臉”現象出現以來,相關部門加緊對涉及“AI換臉”違規違法現象進行整治,相關的法規政策也陸續出台。截至今年8月初,公安機關通過專項會戰,偵破“AI換臉”案件79起,抓獲犯罪嫌疑人515名。
  針對“人臉”安全痛點,我國在立法層面有了明確規定和高規格的保護。目前《中華人民共和國民法典》《網絡音視頻信息服務管理規定》《網絡信息內容生態治理規定》等多部法規均涉及深度合成應用的規范。去年1月,國家網信辦最新公布的《互聯網信息服務深度合成管理規定(征求意見稿)》對深度合成內容的用途、標記、使用范圍以及濫用處罰作出具體規定,尤其對作為深度合成服務提供者的平台方進行審核、評估、監管等提出要求。
  “在今天,從人的畫像、身體、位置、行為、情緒與心理、各種關系到社會評價,每一個維度都有可能被數據化。”中國人民大學新聞學院教授彭蘭坦言,“人臉、表情、身體動作、聲音、指紋,因為各種不同的需要變成一個個‘元件’,不同的數據應用者、服務商從這些元件中各取所需。人的元件也進入各種數據的流水線上,被分析加工,或與其他人的元件重組。”
  談到未來人工智能領域發展的新面向,彭蘭認為是“日益重視智能技術力量擴張背景下人的存在與價值。無論是從人與技術的互動中觀察人機協同、人機信任或人機博弈,還是從人的日常智能傳播活動中尋找其行為動機與情感軌跡,都是在以不同的視角關注人的存在”。無論如何,“在與機器的共處中,我們將有更多機會認識自己。”

本報記者李瑤

(責編:劉洋、candy)

山西日報、山西晚報、山西農民報、山西經濟日報、山西法制報、山西市場導報所有自採新聞(含圖片)獨家授權山西新聞網發布,未經允許不得轉載或鏡像﹔授權轉載務必注明來源,例:"山西新聞網-山西日報 "。

凡本網未注明"來源:山西新聞網(或山西新聞網——XXX報)"的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責。