作為龍年科技界的“第一把火”,OpenAI最新爆款文生視頻模型Sora的熱度正在以驚人的速度持續發酵。除震驚世界的AI視頻技術,其幕後主創團隊也來到聚光燈下。據OpenAI發佈的Sora技術報告,Sora作者團隊僅有13人,其中3名為華人。
相比去年GPT-4超長篇幅的作者名單,Sora的作者團隊顯然更加簡短。
這些參與者中,已知的核心成員包括研發負責人Tim Brooks、William(Bill)Peebles、系統負責人 Connor Holmes等。前兩人師出同門,均在2019年進入伯克利深造,直到2023年上半年才一前一後獲得博士學位,可以說是非常年輕。
值得註意的是,William(Bill)Peebles曾和現任紐約大學計算機科學助理教授謝賽寧一起發表過論文《Scalable Diffusion Models with Transformers》,該論文研究成果DiT模型被Sora引用,也是這次Sora背後的重要技術基礎之一。
因為論文的引用也傳出一則謠言,有網友認為謝賽寧是Sora作者之一,目前謝賽寧本人已在朋友圈親自辟謠。
根據謝賽寧的透露,Sora是William(Bill)Peebles等人在OpenAI的嘔心瀝血之作,每天基本不睡覺高強度工作一年。
要知道,William(Bill)Peebles在2023年3月入職OpenAI,距今剛好不到一年。這也從側面否定之前傳聞中的“Sora早就開發完成,隻是一直沒發”的言論。
未公測卻賣課,新型韭菜收割機?
而市場上圍繞著Sora的不僅僅有謠言,還有一系列巧立名目的騙局。
據知情人士透露,目前市面上一份Sora的課程售價為99元,一天時間就賣出2萬多份。也就是說,賣課者一天至少到手200萬元。而課程交付的內容卻極其簡陋,隻有Sora的介紹文檔,以及一句口號:“給自己一個機會”。
無獨有偶,甚至有人號稱手上有北美NASA工作人員的資源,已經拿到接口,把Sora打包到GPTs,做成軟件發佈上線。
除此之外,還有搜集各類Sora文章、專有名詞等資料,做成飛書文檔賣錢的,也有直接套用影視行業專業名詞包裝成Sora的提示詞,讓人付費進群領取的,諸如此類各式各樣打著Sora旗號收割韭菜的騙局。
更甚者還有人為吸引人付費,不擇手段地大力制造焦慮感,到處宣稱“Sora的風口最多3個月就消失”、“一步慢,步步慢”,“24小時之內上線一款連產品都沒有發佈的課程”。某電商平臺上,也有人售賣Sora教程,甚至連宣傳海報都是同一款,懶得另外重做。
這也直接迫使OpenAI的開發者關系負責人Logan發佈緊急聲明,稱Sora正處於內測階段,並未對外開放。即使開放,Sora能夠作為產品使用的時間也仍舊遙遙無期。
而在賣課之外,也有許多人在利用Sora的熱度瘋狂拉人頭,積攢私域流量。
例如在朋友圈散發二維碼拉人入群,熱衷宣揚“Sora首部AI電影共創劇本海選開始!”以及“我們都有機會成為第一代AI導演!”等言論。也有像地推人員一樣在AI群中通過私信加好友,以“改變命運”、“破圈”為噱頭,索要999元入群,聲稱共同踏上新世界之門。
更謹慎的則會借著Sora的理由,誇大作用將其吹捧成改變命運、實現財富自由的機會,以此為理由推銷《短視頻矩陣引流解決方案》等相關課程,聲稱隻有先學好這些,才能成為第一批通過Sora賺錢的人。
歸根結底,Sora帶來的AI割韭菜事件,和用小禮品吸引大媽買保健品一樣,本質上就是割韭菜,販賣焦慮賺信息差的錢。
真實視頻假冒Sora制作,已成流量密碼
除此之外,給真實視頻標註“該作品由人工智能Sora生成”,也成當下的流量密碼。
事情的起因還得從Sora公佈當天說起,X上有一位博主發佈一段由Sora生成的維多利亞鳳冠鳩視頻,註明產生它的指令。同時在開頭強調這樣一句話:該視頻由OpenAI的新模型Sora生成。
視頻不出意外得到數千轉發,登上熱門,一瞬便激起廣泛的討論。
隨後就有不少網友發現,網上除Sora公開的一小部分影片作品,突然多許多標註“該視頻由OpenAI的新模型Sora生成”的視頻,甚至發佈者還貼心地附上“生成指令”。
然而實際上,這些視頻幾乎都是用真實視頻假冒的Sora視頻,並非Sora生成。
比如最近,號稱“視頻生成界的圖靈測試”的威爾·史密斯吃意大利面的視頻又重出江湖。視頻畫面上半段顯示是一年以前的 AI 視頻,下半段則顯示現在的 AI 視頻。
要知道,一年前由AI生成的“威爾·史密斯吃意大利面”視頻效果並不理想,其中涉及到處理人物手勢、面條形狀以及進食動作等方面都面臨著巨大挑戰。相較之下,據稱由Sora生成的視頻效果卻出奇地出色,生成的手勢和面條都表現得非常逼真,似乎已經成功應對圖靈測試。
結合最近OpenAI展示的各種Sora生成結果,很多人開始相信:這是Sora生成的新視頻,顯示出現代視頻生成AI已經達到以假亂真的水平。
然而,實際情況卻是該視頻並非由Sora生成,而是由威爾·史密斯本人親自錄制。那Sora究竟能不能生成吃意大利面的場景呢?這個問題目前還沒有測試結果。
有網友調侃,現在怎麼分辨真的真視頻,假的真視頻,真的假視頻,假的假視頻,是一大難題。很顯然,視頻界的混淆矩陣已經出來。
關於這個問題,也引起很多專業人士的熱議。Keras之父François Chollet就表示,像Sora這樣的視頻生成模型確實嵌入物理模型,但問題是:這個物理模型是否準確?它能否泛化到新的情況,即那些不僅僅是訓練數據插值的情形?
簡單來說,就是François Chollet認為,Sora隻達到人類做夢的水平,但是邏輯能力依然不行。從Sora官方公佈的視頻中,也可以觀察到一些邏輯錯誤,進一步證實這個問題。
未來,Sora距離真正“以假亂真”還有一段很長的路要走。