【新智元導(dǎo)讀】王炸Sora發(fā)布后,想要分辨AI視頻和真實視頻變得更難了,各行各業(yè)都面臨新的挑戰(zhàn)與危機。
技術(shù)的發(fā)展總是伴隨著被濫用的風險,從ChatGPT到最近發(fā)布的文本轉(zhuǎn)視頻工具Sora,AI生成的內(nèi)容越是逼真,被濫用的風險也就越高。
僅僅一年前,大家還在嘲笑AI生成的「威爾史密斯吃意大利面」不自然,手部、嘴部、面條沒有一個真實的;但現(xiàn)在的頂級AI模型已經(jīng)可以生成「錄像級」的視頻了,達到了以假亂真的水平。
無論是普通用戶還是專業(yè)的研究人員,大多對AI的發(fā)展速度感到「震驚」,除了興奮外,大家也開始擔心生成的假視頻可能會危及2024年的全球政治,或是顛覆內(nèi)容創(chuàng)作領(lǐng)域。
最近,Nature上的一篇新聞文章總結(jié)了Sora等文本轉(zhuǎn)視頻工具對當下的「科學(xué)和社會」可能產(chǎn)生的影響,也是繼deepfake換臉后,大眾又要面臨的「分辨假視頻」考驗,而且這次的考驗更加嚴峻,連可供參考的原始視頻都沒有。
英國萊斯特德蒙福特大學(xué)的數(shù)字文化專家Tracy Harwood認為,錯誤信息是AI模型要面臨的主要挑戰(zhàn),「我們很快就會被淹沒在大量看似真實的信息中」。
Sora帶來社會恐懼
2月16日,OpenAI的Sora模型橫空出世,用戶只需要通過幾個簡短的文本提示就能創(chuàng)建逼真的視頻,比如「一個女人在東京一條燈光明亮的街道上行走」。
雖然此前也有類似的模型,如Runway發(fā)布的Gen-2,或是谷歌開發(fā)的Lumiere,但這些工具并沒有引起公眾的關(guān)注:模型呈現(xiàn)給出的內(nèi)容非常普通,并且需要非常具體的提示才能讓模型生成令人滿意的作品。
相比之下,Sora提高了作品的質(zhì)量,還拉低了AI作品的制作門檻。
與此同時,Sora也給即將到來的英國大選和11月的美國總統(tǒng)選舉帶來了新的問題,英國閱讀大學(xué)研究人工智能和電影制作的Dominic Lees表示,屆時將會有大量的假視頻和假音頻流傳出來,影響公眾的判斷。
2023年10月,英國工黨領(lǐng)袖Keir Starmer的假音頻被公開,今年1月,美國總統(tǒng)拜登鼓勵民主黨人不要投票的假音頻也被流傳出來。
目前可用的一種解決方案是要求文本到視頻的AI使用水印,可以是視頻中可見標記的形式,或是添加在視頻元數(shù)據(jù)中的人工簽名,但Dominic Lees對這種措施的有效性仍然保持懷疑:水印可以被刪掉,元數(shù)據(jù)簽名需要用戶特意查看視頻的真實性才行,要求世界各地的觀眾在觀看每個視頻時都查看元數(shù)據(jù)是不切實際的。
Sora也同樣影響到了影視創(chuàng)業(yè)行業(yè),好萊塢演員、電影制片人和工作室老板Tyler Perry在目睹了 Sora 的能力之后,迅速中止了12 個攝影棚的設(shè)計和建造等一系列的影視工作室擴建計劃。
Perry還表示,包括演員、場務(wù)、電工、交通協(xié)調(diào)、音效師和剪輯師這些行業(yè)人士都將受到影響,Sora 將觸及影視行業(yè)的每一個角落。
美國演員湯姆·漢克斯去年也表示,人工智能可以讓他在死后繼續(xù)出現(xiàn)在電影中,但如果你是一個雄心勃勃的年輕演員,在爭取機會的同時,卻被告知「對不起,湯姆漢克斯總是會扮演主角」,你會期待這樣的影視未來嗎?
文本到視頻的人工智能將會為社會帶來更廣泛的問題。
Harwood認為,我們必須學(xué)會重新評估看到的內(nèi)容,這些文本轉(zhuǎn)視頻工具讓每個人都有機會成為媒體內(nèi)容創(chuàng)作者,我們需要處理由此產(chǎn)生的后果,也代表著作品消費方式的根本轉(zhuǎn)變。
AI對社會的益處
不過AI技術(shù)也對社會的發(fā)展存在益處,Harwood認為文本轉(zhuǎn)視頻技術(shù)可以被用來「以一種更容易理解的格式」呈現(xiàn)較難理解的文本,比如把學(xué)術(shù)論文可視化等。
Harwood表示,文本轉(zhuǎn)視頻模型可以用來做的最重要的事情之一就是「向外行觀眾傳達專業(yè)的研究結(jié)果」,其能夠?qū)⑾喈攺?fù)雜的概念進行可視化。
另一個潛在的用途可能是在醫(yī)療保健領(lǐng)域,文本轉(zhuǎn)視頻AI能夠代替人類醫(yī)生與患者交談,但英國科學(xué)傳播顧問Claire Malone認為:雖然有些人可能會覺得這項技術(shù)不夠靠譜,但在用過之后,他們可能會發(fā)現(xiàn)如果他們想多次向醫(yī)療專業(yè)人士提問,就會非常方便。
Malone也認為,文本轉(zhuǎn)視頻的AI模型可以幫助研究人員獲取海量數(shù)據(jù),如由歐洲粒子物理實驗室歐洲核子研究中心在瑞士日內(nèi)瓦附近和其他大型科學(xué)項目產(chǎn)生的數(shù)據(jù)集。
生成式AI可以完成一些普通的研究任務(wù),如對代碼進行篩選等;也可以做更復(fù)雜的工作,例如輸入數(shù)據(jù)并要求模型做出預(yù)測。