近日,影視颶風(fēng)創(chuàng)始人Tim(潘天鴻)發(fā)布的一期視頻引發(fā)關(guān)注,他在視頻中聚焦了字節(jié)跳動(dòng)剛發(fā)布的AI視頻模型Seedance2.0。Tim一方面感慨Seedance2.0的出色能力,另一方面也直言其能力“恐怖”,到底怎么回事?
Seedance2.0表現(xiàn)出色,引發(fā)海內(nèi)外熱議
Tim在視頻中對(duì)Seedance2.0贊不絕口,稱其生成視頻的精細(xì)度、攝像機(jī)運(yùn)動(dòng)的流暢度、分鏡的連續(xù)性以及音畫的匹配度都極為出色,甚至直言這是“改變視頻行業(yè)的AI”。
在國(guó)內(nèi)社交平臺(tái)微博上,《黑神話:悟空》制作人馮驥評(píng)價(jià)Seedance2.0,領(lǐng)先,當(dāng)前地表最強(qiáng)的視頻生成模型,沒有之一;全能,AI理解多模態(tài)信息(文、畫、影、音)并整合的能力完成了一次飛躍,令人驚嘆。
Seedance2.0的出色表現(xiàn)已經(jīng)在海外社媒平臺(tái)上引發(fā)熱議,話題登上熱門趨勢(shì),多條帖子閱讀量過百萬。彭博社稱,Seedance2.0憑借出色的內(nèi)容創(chuàng)作效果令分析師印象深刻,帶動(dòng)傳媒及人工智能應(yīng)用類公司股價(jià)上漲。
開源社區(qū)Hugging Face亞太生態(tài)負(fù)責(zé)人Wang Tiezhen轉(zhuǎn)發(fā)Seedance2.0生成的演示視頻,稱效果看起來極棒,并詢問能否內(nèi)測(cè)。
YouTube上訂閱人數(shù)超過40萬的創(chuàng)作者看完demo視頻,稱Seedance2.0是真正的技術(shù)突破,市面上沒有能與之媲美的產(chǎn)品。
“恐怖”能力引發(fā)思考,專家稱不必過度擔(dān)心
在不少網(wǎng)友對(duì)Seedance2.0稱贊時(shí),Tim也談了自己的冷思考,他稱在體驗(yàn)Seedance2.0時(shí)偶然發(fā)現(xiàn),僅將他自己的人臉照片上傳至模型,系統(tǒng)就能自動(dòng)生成與他本人高度相似的聲音。
Tim創(chuàng)立的影視颶風(fēng)是影視/科技領(lǐng)域頂流視頻賬號(hào),生產(chǎn)的高質(zhì)量視頻在網(wǎng)絡(luò)大量流傳,影響力不亞于影視明星,其視頻素材早已成為公開數(shù)據(jù),很可能因此被用于大模型訓(xùn)練。
實(shí)際上,基于公開數(shù)據(jù)進(jìn)行大模型的訓(xùn)練與調(diào)優(yōu),是全球AI行業(yè)普遍采用的技術(shù)路徑。大部分生成模型也普遍遵循這一路徑,例如谷歌的Gemini多模態(tài)模型和Veo3視頻生成模型,使用了超過200億個(gè)YouTube視頻片段。
北京航空航天大學(xué)人工智能研究院教授沙磊表示,目前國(guó)內(nèi)外AI大模型,都在使用公開數(shù)據(jù)進(jìn)行訓(xùn)練。之前有媒體報(bào)道,谷歌Veo3模型推出時(shí),人們發(fā)現(xiàn)Veo3生成的視頻很像一些知名創(chuàng)作者的作品;OpenAI在最早推出Sora時(shí),外媒也測(cè)試到Sora能高度模仿一些經(jīng)典電影和劇集的片段。
沙磊認(rèn)為,Tim作為一個(gè)明星級(jí)的公眾人物,他的視頻素材進(jìn)入一些公開的數(shù)據(jù)集,是非常正常的現(xiàn)象,普通人無需過度擔(dān)心。
中國(guó)科學(xué)院軟件研究所研究員張立波也認(rèn)為,為了實(shí)現(xiàn)更好的模型效果,就需要更多的公開數(shù)據(jù)進(jìn)行訓(xùn)練,普通用戶無需過度焦慮。
張立波分析,基于公開數(shù)據(jù)進(jìn)行大模型的訓(xùn)練與調(diào)優(yōu),這一實(shí)踐在大語言模型時(shí)期就已存在,相比文字,聲音和視頻則具有更強(qiáng)的個(gè)人與場(chǎng)景特定性,因此當(dāng)前階段,數(shù)據(jù)使用的責(zé)任與邊界問題更加凸顯。訓(xùn)練過程中可能涉及的內(nèi)容借鑒、版權(quán)關(guān)聯(lián)等議題,也成為技術(shù)突破和行業(yè)發(fā)展必須面對(duì)的共性挑戰(zhàn)。
據(jù)了解,現(xiàn)在Seedance2.0還在小范圍內(nèi)測(cè)階段,字節(jié)對(duì)其也限制了一部分模型功能。例如只有在進(jìn)行活體認(rèn)證的情況下可以生成真人視頻,不支持輸入真人圖片/視頻做主體參考等,防止AI技術(shù)被濫用。
張立波強(qiáng)調(diào),“我們要清醒認(rèn)識(shí)到,如何在此過程中更好地保護(hù)公眾個(gè)人隱私,并確保生成內(nèi)容的安全可靠,是亟待社會(huì)各界共同推動(dòng)解決的重要課題?!?完)