最近,OpenAICTOMurati接受采訪時,對Sora訓練數據語焉不詳、支支吾吾的表現,已經成全網熱議的話題。畢竟,要是一個處理不好,OpenAI就又要陷入巨額賠償金的訴訟之中。
前幾天Murati接受華爾街日報采訪時,被問及Sora訓練數據的這段視頻,已經在全網爆火,引起網友熱議。
準備好,WSJ女記者要放大招——“Sora是用什麼數據訓練的?”
Murati接下來的表現,十分值得玩味。
她眨數次眼睛,目光閃爍,思考幾秒之後略帶遲疑地給出一個官方味十足的答案——
“我們使用的是公開可用的數據,以及經過許可的數據。”
記者繼續出招:“所以,你們是用YouTube上的視頻嗎?”
Murati的反應亮。她撇撇嘴,眼神茫然地望向空中,猶豫幾秒後隻得承認——
“關於這個情況,我不太確定。”
記者步步緊逼:“那Facebook和Instagram上的視頻呢?”
Murati的表情仿佛已經在崩潰的邊緣——
“你知道,如果這些數據可以公開使用……對……可以公開使用的話……可能是用這些數據,但我不確定,真的不太確定。”然後她無奈地伸開雙手,表示差不多得。
但記者還在發問:“Shutterstock呢?我知道你們公司和他們有合作。”
Murati搖搖頭,表示,“關於使用數據的細節,我是不會詳細說的,但我們用的數據肯定是公開的,或者許可使用的。”
倉促上陣的Murati肯定沒想到,記者會準備得如此充分,讓她幾乎直接掉在坑裡。如果處理不夠得當,OpenAI極有可能會繼續吃官司。
網友形容Murati的窘迫表現
有人預言:Murati的反應絕對會被做成表情包,全網熱轉。
訓練AI模型數據所面臨的巨大版權爭議,是這一年多全球相關人士討論最多的話題。
如今,ChatGPT讓OpenAI的估值暴漲到800億美元;而Sora又幾乎要顛覆動輒上百億票房的好萊塢影視行業 。
然而這些收益卻進OpenAI的腰包,而做出關鍵貢獻的數據所有者,卻分文無收,甚至反而被掀飯碗。
OpenAI被紐約時報起訴、ChatGPT被怒噴應當“銷毀”的故事,會再一次上演嗎?
網友:她的微表情在說謊
這段采訪的視頻一出,業內人士和網友都震驚。
有網友銳評道,這個采訪看起來很愚蠢,整個對話仿佛是下面這個樣子——
你是壞人嗎?
不是。
你是壞人吧?
呃……不是吧?不是。
你到底是壞人嗎?
聽著,我不是壞人。
還有網友展開微表情分析,認為Murati很有可能是在說謊。
科技專欄作傢Brian Merchant批評道,Murati的表現“要麼是對自己公司的產品驚人的無知,要麼就是在謊言——無論哪種可能,都非常可怕!”
的確,對於一個AI公司CTO來說,她的表現是完全不合格的。
那麼問題來,如果是後一種可能,Murati為什麼要撒謊呢?
如果她意識到自己需要撒謊來掩蓋某些事實,那就說明,她心裡明白OpenAI的做法是在違法的邊緣試探。
而在未來,當OpenAI被法官問話時,這很可能就會給OpenAI埋下一個大坑。
“看起來,OpenAI要面臨一場大型訴訟”
目前,OpenAI正面臨著好幾場由作傢和紐約時報發起的訴訟,後者聲稱,他們受版權保護的作品未經許可,就被OpenAI用來訓練ChatGPT等模型。
與此同時,外媒紛紛發表文章,嘲諷Murati在采訪中表現出的樣子太不專業。
CTO的這個表現,對官司纏身的OpenAI可真不算個好消息。
如果CTO都無法堅定地回答,現在公司旗下最熱門新模型的訓練數據來自哪裡,那也就證明,OpenAI高層甚至對這個問題根本就沒關註。
據WSJ報道,在采訪結束後,Murati證實,Shutterstock上的視頻確實包含在Sora的訓練集中。
不過,網上有海量的視頻內容,OpenAI從Shutterstock得到的,恐怕也隻是Sora訓練數據池中的一小滴水而已。
其實,這件事情之所以能引起軒然大波,也是因為它直接指向問題的本質——在公共領域的數據,所屬權到底屬於個人,還是完全共有?
從前,數據飛輪還沒能給LLM加速到日進鬥金的程度時,這個問題沒有放到臺面上討論過。而現在,它背後代表巨大的利益。
也有一些人為Murati和OpenAI辯護。
他們認為,既然你把東西發到網上,就應該默認它屬於公共資產。如果你不想公開,那就應該讓它們保持私密。
也就是說,一旦事情在公共場合發生,它就屬於整個人類。
這麼說來,我們在往網上發東西時,都得時刻小心翼翼。
一傢價值數十億美元的AI公司,很可能會把你隨手拍的傢人朋友的視頻,用作生成式AI模型的養料,獲得驚人的利潤。
對於這個數據監管的爭議,斯坦福教授Christopher Manning表示,目前最合適的AI監管辦法之一,就是要求模型廠商記錄下他們使用過的所有訓練數據。
歐洲議會剛剛通過的AI法案,也同樣強調這一點。
Sora最新一波演示出爐!
雖然在之前的采訪裡已經提到,Sora生成的視頻還有很多bug,但這些不斷被放出的演示,依然在不斷驚艷世人。
比如瓷器店裡的公牛。
扛著攝像機的女記者忽然變成機器人。(x
拿著手機的小美人魚,旁邊是她的蟹助手。
還拉著Runway對比一波,生成兩個鏡頭前的女記者。
Sora還在不斷掀起颶風
其實,Sora的傳奇故事,才剛剛揭開序幕。
一個月前,曾給《死侍2》做特效的44歲視覺藝術傢Greg Pilon,突然感覺:自己的行業似乎面臨著末日的鐘聲。
他見到Sora的第一眼,就有這種強烈的感覺。
無人機拍攝的海岸、一個男人在巴黎咖啡館深沉地思考人生的畫面、一個在迪斯科舞廳跳舞的袋鼠……這些驚艷的場景也令他恐懼。
Sora的先進程度,已經遠超任何視頻AI。
Pilon曾以為,粗糙的AI要威脅自己的生計,且得等幾年,但Sora卻表明:被淘汰的危機已經近在眼前。
“我現在覺得,兩年後,我可能就會被取代。”
雖然Sora還未發佈,但僅僅是一些demo,就已經引起好萊塢和遊戲界的巨大轟動。
團隊的三位負責人在最新的專訪中,對Sora進行一些介紹
電影
前段時間最刷屏的新聞之一,就是好萊塢大導Tyler Perry在Sora剛剛發佈一周後,取消8億美元工作室擴建計劃的消息。
對此,導演Scott Mann也認為,Sora將“給我們的行業帶來自電影攝影機發明以來最大的變革。”
2018年,Mann參與創立Flawless,來開發AI電影制作工具。
他們最受矚目的產品,能夠解決電影編輯中的配音問題——這不僅可以節省昂貴的重拍費用,還可以用AI調整演員的嘴型來與另一種語言同步,從而幫助電影順利地進入國際市場。
在最近的作品《Fall》中,他就利用Flawless對其中的30多處粗口進行配音處理。因此,電影達到PG-13級別,擴大受眾范圍。
在300萬美元的預算下,《Fall》的票房收入達到將近2200萬美元,回報近7倍。
不過,Flawless的工作,或許很快就能由Sora完成。
而給《權力的遊戲》和《吸血鬼日記》做特效的視覺工程師Pilon也發現,Sora很可能在幾分鐘內,完成他曾經要花費數月才能完成的工作。
“沒有人預料到它會進展得這麼快,”Pilon說。“我們曾認為可能還需十年的技術,現在看來僅需幾年。”
遊戲
視頻遊戲公司Midwest Games的創始人Ben Kvalo也表示,自己行業中的某些員工,的確會被AI淘汰。
與藝術傢們擅長的特定風格不同,生成式AI能夠創造出任何風格,或嘗試全新的風格。
而那些與視頻遊戲開發者合作,為遊戲初期角色和場景勾勒草圖的概念藝術傢,很可能會因此失去工作。
不過,小規模的開發團隊,卻可能從中受益。
他們本來請不起概念藝術傢,現在卻可以做出視覺上更高水平的遊戲項目,從而大賺一筆。
而有朝一日,生成式AI也將達到一個新高度——讓遊戲能夠搭載“有意識”的NPC。
現在的遊戲中,NPC還停留在說簡單臺詞、做基本動作的階段,如果AI能讓他們自發對話、即興行動,故事情節會更豐富。
廣告
而在廣告領域,許多業內人士也堅信,AI模型比大傢預料更早地淘汰員工。
不同於電影和遊戲制作中緩慢而獨具匠心的創作過程,廣告行業更看重迅速構思創意提案,盡可能多地采用不同視覺風格,以及根據客戶需求快速調整方向的能力。
(Add)ventures的高級副總裁Scott Maiocchi,已經用上Midjourney和Stable Diffusion。
商業影片導演Justin Poirier,也開始用生成式AI來創建情感氛圍板。
之前,當他需要向客戶展示動畫藝術潛在的樣子時,他需要花費數小時尋找靈感圖片。
他相信,未來品牌很可能會采用AI視頻作為輔助畫面,而無需去Getty或Shutterstock篩選海量的視頻。
畢竟,不少每個項目都有預算去用無人機航拍城市天際線的,一旦AI視頻成熟,這種畫面幾秒內就能得到。
3個月誕生10個類Sora應用
人們是不是對Sora有些恐慌過度?有這種可能。
雖然Sora的展示很驚艷,但它也是一次巧妙的營銷——對於OpenAI來說,不斷提升公司形象、吸引更多員工和資本,也是無可厚非的。
畢竟,運行Sora還會面臨巨大的成本問題,這會給它的顛覆性影響加個封印。
不過,現在市面上的玩傢可不僅僅是Sora一傢。
Runway和Pika Labs這樣的初創公司,也能做出15到16秒的AI視頻。而且它們已經分別獲得2.36億美元和5500萬美元的資金
以色列初創公司Lightricks,也發佈文本到視頻的全流程平臺LTX Studio。
前軟件工程師、哈佛大學AI與商業課程教授Mike Grandinetti預測道:“從現在開始到6月,我們將看到10個以上類Sora應用的發佈。”
AI在電影、遊戲、廣告這些行業還會掀起怎樣的颶風,讓我們拭目以待吧。