OpenAI的Sora會砸掉誰的飯碗?


不約而同,同日出招。兩個AI巨頭在同一天各自放出自己的AI新核武器,OpenAI的文生視頻模型Sora又一次贏得滿堂彩。Sora的驚艷亮相,不僅碾壓諸多AGI視頻同行,更有可能改變電影電視廣告遊戲行業的未來遊戲規則。


Google新模式性能完勝

周四,Google突然發佈新一代多模態大模型Gemini 1.5 Pro,在與OpenAI的大模型之戰中加速超越。這是業界迄今最強的大語言模型,最高可支持10,000K Token上下文,直接將性能提升到百萬級別,在性能上完全秒殺OpenAI的GPT-4 Turbo。

百萬級別Token意味著什麼?GoogleAI項目負責人傑夫·迪恩(Jeff Dean)解釋說,在Gemini 1.5 Pro百萬級別上下文窗口支持能力下,用戶可以完成復雜的內容交互,輕松解析整本圖書、電影、播客,理解非常長的文檔,甚至是數百個文件數十萬行的代碼庫。

Gemini 1.5 Pro的發佈,意味著Google在和OpenAI的軍備競賽中占據強大的性能優勢。相比之下,OpenAI的GPT-4 Turbo隻能處理128k Token,而且近期更是出現性能下滑的不利狀況,直到上個月發佈更新之後才有所改善。


然而,OpenAI並沒有讓Google獨美。就在同一天,他們發佈文本生成視頻的AI模型Sora,隻需文本就能自動生成視頻;繼文本模型ChatGPT和圖片模型Dall-E之後,OpenAI又開始顛覆視頻領域。

相比GoogleGemini 1.5 Pro基於數據性能的硬實力優勢,Sora基於視覺美學的驚艷表現,顯然更容易讓人印象深刻,迅速成為社交網站上的熱點。

以假亂真細節驚艷

Sora到底驚艷在哪裡?OpenAI展示多段Sora制作的視頻內容,光是這些片段,就已經足夠讓人大跌眼鏡。OpenAI在官方博客中寫道,Sora不僅可以理解用戶的需求,還知道這些事物在現實世界如何存在。

隻需要輸入一段文本,Sora就能自動生成最長一分鐘的高清視頻。令人難以置信的是,Sora不僅可以準確把握用戶文本中的復雜意思,並且還能分拆出不同的元素,將其轉換為有具體創意構思的視頻內容,看起來就像是專業導演、攝像和剪輯的作品。


一位戴著墨鏡、穿著皮衣的時尚女子走在雨後夜晚的東京市區街道上,抹鮮艷唇彩的唇角微微翹起,即便帶著墨鏡也能看到她的微笑,地面的積水映出她的身影和燈紅酒綠的霓虹燈;熱鬧非凡的唐人街正在進行舞龍表演,熙熙攘攘的人群目光都聚焦在躍動的彩龍身上,整個環境的喜慶氛圍仿佛令人身臨其境。

與此前的AI視頻存在明顯塑料感不同,此次Sora制作的視頻在逼真度和藝術感方面有著顯著差別:微微卷曲的人物頭發,女人臉上的黑痣粉刺,地面積水倒映的霓虹光影,街頭商販擺賣的諸多食品,天空飄落的櫻花細雪,細節的精細度幾乎已經做到以假亂真。


更令人驚訝的是,Sora視頻在構圖、色彩、創意和運鏡方面,都呈現出明顯的電影風格,無論是一鏡到底還是多機位都可以無縫切換,甚至還有“演員”的表情神態,這是此前的文生視頻產品所不具備的。OpenAI一出手就將整個AI視頻行業提升一個級別。

雖然Sora制作的視頻還沒有到完美的地步,仔細看還能看出“穿幫”之處,人物吃過的餅幹甚至會完好無損,但在影像畫質上已經較此前的AI視頻有質的飛躍,甚至有電影的質感。而且,僅僅根據一段抽象的文字就能制作類電影的多鏡頭視頻,這種語義理解和鏡頭運用能力更是接近人類導演、攝像與剪輯的水平。顯然,視頻領域的ChatGPT時刻已經到來。

AI進化速度令人震驚

Sora發佈之後,網絡一片驚嘆,幾乎搶盡Gemini的風頭。AI的進化速度實在令人震驚。要知道,此時距離OpenAI推出ChatGPT,開啟生成式AI時代,僅僅過去14個月時間。直到去年,我們才剛剛熟悉文本生成圖片的產品,而僅僅半年前,MidJourney創作的AI圖片裡還會出現六指人物。而現在,Sora的視頻就已經讓所有人開始感受到現實和虛擬的界限模糊。

雖然OpenAI的GPT-4 Turbo此前出現性能下滑和速度變慢的狀況,令人擔心生成式AI的增長遭遇瓶頸;但Sora的發佈無疑打消所有人的擔憂。雲計算公司Box創始人兼CEO列維(Aaron Levie)在Sora發佈之後感慨說,“如果有人還擔心AI進化速度會變慢的話,我們又一次看到完全相反的典范。”

目前Sora隻面向邀請的制作者和安全專傢開放測試,發現和解決可能的安全問題,還沒有宣佈正式的公測時間表。畢竟在虛假信息充斥的互聯網,DeepFake的道德問題也已經成為關註焦點,像Sora這樣以假亂真的視頻一旦被濫用,可能會引發災難性後果。

在發佈Sora的幾乎同一時間,OpenAI還完成一項要約售股交易,並不是融資用於公司用途,而是允許員工向以Thrive Capital牽頭的風投機構出售現有股份套現。值得一提的是,作為OpenAI董事會成員,奧特曼自己並不持有公司股票,估值飆升並不能給他帶來巨額財富。

此次交易對OpenAI的整體估值達到800億美元,較之去年年初的300億美元飆升兩倍多。按照投融資市場調研公司CB Insights統計,OpenAI已經成為全球估值最高的創業公司之一,僅次於字節跳動和SpaceX。

實際上,此次交易本應在去年11月完成,隻是因為奧特曼與董事會的沖突風波才被迫擱置。隨著奧特曼重新回到OpenAI CEO職位,投資者再次給這傢AI巨頭投出信任票。顯然,在Sora正式發佈之後,OpenAI的估值還會進一步飆升。

巨頭出手碾壓AGI同行

那麼,令人驚艷的文本生視頻Sora究竟會帶來哪些沖擊?


AGI視頻同行無疑是遭受最直接沖擊的。Sora發佈之後,AI視頻創業公司Runway CEO瓦倫祖拉(Cristóbal Valenzuela)在X平臺(此前的Twitter)上簡單發佈兩個字,“Game On.”(競爭開始)。幾個月前,Runway剛剛發佈Gen-2視頻模型。而另一傢AI視頻公司Stability的CEO莫斯塔克(Emad Mostaque)則直接感慨,“奧特曼真是個魔術師。”

Runway創辦已有五年時間,在AI視頻領域占據著先發優勢,已經得到好萊塢主流片場的使用。去年拿到七項奧斯卡大獎的年度影片《瞬息全宇宙》就使用Runway來制作AI視頻。在《瞬息全宇宙》大獲成功之後,Runway新一輪融資估值也水漲船高,達到15億美元,是一年之前估值的三倍。

文生視頻領域是目前最熱的創業領域。過去幾個月時間,隨著生成式AI熱潮湧動,也湧現出不少文本生視頻和圖片生視頻的創業公司。A16z的AI投資合夥人摩爾(Justin Moore)列出他所跟蹤的20多傢文生視頻創業團隊,其中不乏Pika、Zeroscope這樣一度引發網絡驚嘆的創業新貴。

去年年底,斯坦福華人畢業生創辦的Pika視頻一度引發中美互聯網的驚嘆。得益於AI視頻的驚艷表現,這傢僅有四人的創業公司,在不到半年時間就完成超過5500萬美元的三輪融資,估值飆升到2.5億美元。

但現在,AI巨頭OpenAI直接拋出Sora。無論是視頻時長,還是畫面精細度,還是細節完整性,或是多鏡頭拍攝,Sora都遠遠超越這些小創業公司的視頻,用碾壓來形容也並不為過。雖然AI視頻領域還有著巨大的提升和增長空間,但這些小公司的未來是否有能力與OpenAI競爭依然是個巨大的疑問。

左右好萊塢勞資談判

不過,Sora影響的不僅是其他AGI視頻創業公司的生存空間,更會改變整個好萊塢以及電影、電視、廣告、遊戲行業的未來遊戲規則。

好萊塢使用AI制作圖片和視頻,並不是什麼新鮮事,從CG(電腦動畫)、VR到AI,影視娛樂行業一直是高新技術的最先采用者。然而,與其他技術不同,AI工具始終是紮在好萊塢從業人員心中的一根刺。

除《瞬息全宇宙》使用Runway的AI視頻工具,去年21世紀福克斯已經與IBM沃森合作,用AI工具為關於AI主題的恐怖片《摩根》制作預告片;迪士尼旗下的漫威更完全用AI制作《秘密入侵》的開頭動畫。

當時正值好萊塢演員和編劇工會大罷工期間。而生成式AI在影視行業的應用也是雙方的爭議焦點之一。就在雙方談判的過程中,演員編劇們得知迪士尼漫威新一季的《秘密入侵》已經完全使用AI技術打造開場場景。這一消息讓雙方的談判再次擱淺。

為什麼影視行業使用AI工具引發這麼多的爭議?業內人士主要是擔心制片方使用現有素材進行AI訓練,未來頻繁使用AI工具生成內容,這不僅侵犯到創作者已有作品的版權,沒有給他們足夠的回報,更會影響到創作者未來的工作機會和空間。

雖然去年編劇和演員們不惜讓行業停擺和自己失業,換來制片方們的暫時讓步,對AI工具的使用制定更多的規范。但三年後的下一次勞資談判,面對性能必然大升級的AI,演員編劇們的處境可能會更加艱難。

電影電視TikTok化

隨著文生視頻模型Sora的驚艷亮相,或許整個好萊塢從業人員都會面臨著一個巨大的疑問:按照AI的指數級進化速度,或許不需要再等待多久,AI就可以生成一部完整劇情的短片甚至電影,從劇本到拍攝到表演到後期都可以完全搞定,那麼好萊塢的未來會變成什麼樣子?


拍攝《當她醒來》恐怖電影的好萊塢導演戴夫·克拉克(Dave Clark)已經在使用AI工具制作電影。在他看來,Sora等AI技術帶來的並不是威脅,創作者需要去擁抱AI技術,打造此前無法實現或是想象的內容。“這是改變遊戲規則的技術。你不應該去擔心自己的工作,而應該擔心是誰在使用這些工具。”

行業調查公司CVL Economics上個月發佈的一項對300位好萊塢行業領袖的調查顯示,擔憂情緒彌漫在整個好萊塢。36%的受訪者表示生成式AI已經減少他們公司的日常工作技能需求,72%的受訪公司都是生成式AI工具的最早采用者。

更為殘酷的現實是,75%的受訪者承認,生成式AI(工具、軟件、模型)已經促使他們業務部門削減與合並工作崗位。這些掌控著好萊塢行業秩序的人們預計,未來三年好萊塢總計會有超過20萬人的工作崗位會遭受AI沖擊,尤其是視覺特效、音效師、畫圖師等後期工作崗位。

電影《Shovel Buddies》的編劇海勒曼(Jason Hellerman)認為,隨著AI工具的逐漸完善,未來制片方當然可能會通過Sora這樣的工具生成視頻,而不再需要給一個制作團隊支付薪酬。AI生成的內容也可能會創造一個全新的類型,但如果任何人都可以用AI制作視頻和電影,成為“內容創作者”,這也不可避免會帶來專業水準的降低。

他預測,未來每個人都可以生成自己視頻,就像是現在每個人都在手機上拍攝和觀看TikTok短視頻。習慣短視頻的Z世代年輕人未來會逐漸摒棄電影和電視這樣的長內容。也許在AI生成視頻的未來,電影和電視也會變成類似TikTok短視頻這樣的形式。


相關推薦

2024-03-09

一些行業角色變得多餘。AI的沖擊正在繼續影響好萊塢,OpenAI 2 月份推出的 Sora 成為這場沖擊的新註目點。去年,大模型的快速發展引起一場好萊塢大編劇罷工,也讓更多行業感受到 AI 在創作領域帶來的沖擊和影響,而電影行業

2023-02-23

45至54歲的人群,隻有不到5% 的人這麼認為。此外,針對OpenAI正在開發的ChatGPT付費高級版本,根據Sortlist的調查,軟件和科技公司願意為ChatGPT Professional支付的費用最多,32%的公司願意每月支付超過250歐元,更52%的公司甚至願意為

2023-04-17

種新技術帶來前所未有的創作速度。最近,ChatGPT的東傢OpenAI公司調查發現,大約80%的美國上班族,他們工作中至少有一成將會受到GPT學習模型的影響,而大約19%的上班族,他們一半的工作將會受到GPT影響。崔麥克表示,今天的

2024-02-21

OpenAI首個視頻生成模型Sora近日刷屏科技圈,扔進去一段文字,分分鐘生成“大片”級別的視頻內容,時長可達到60秒。但同時這也衍生出新的問題:用別人的文案使用Sora文生視頻侵權嗎?生成的視頻版權算誰的?“全新創作不

2024-02-26

的扮演者首次公開自己的工資待遇,並懇請網友不要搶他的飯碗。據解,這個小乞丐是清明上河園裡的一位知名演員,因為其形象可愛、表演生動而備受遊客喜愛。然而,最近不少網友發現,這個小乞丐似乎吃胖不少,引發大傢

2024-03-16

最近,OpenAICTOMurati接受采訪時,對Sora訓練數據語焉不詳、支支吾吾的表現,已經成全網熱議的話題。畢竟,要是一個處理不好,OpenAI就又要陷入巨額賠償金的訴訟之中。前幾天Murati接受華爾街日報采訪時,被問及Sora訓練數據的

2024-02-22

,Sora 並未公測。放眼整個太陽系,能用上 Sora 的,隻有 OpenAI 內部員工、授權的藝術傢、紅隊測試人員。紅隊測試是為評估 AI 在關鍵領域的危害,隻有這些領域裡有資質的人才可能獲得測試資格。如果你有幸獲得資格,別說是

2024-02-22

,Sora 並未公測。放眼整個太陽系,能用上 Sora 的,隻有 OpenAI 內部員工、授權的藝術傢、紅隊測試人員。紅隊測試是為評估 AI 在關鍵領域的危害,隻有這些領域裡有資質的人才可能獲得測試資格。如果你有幸獲得資格,別說是

2024-02-23

,Sora 並未公測。放眼整個太陽系,能用上 Sora 的,隻有 OpenAI 內部員工、授權的藝術傢、紅隊測試人員。紅隊測試是為評估 AI 在關鍵領域的危害,隻有這些領域裡有資質的人才可能獲得測試資格。如果你有幸獲得資格,別說是

2024-02-23

,Sora 並未公測。放眼整個太陽系,能用上 Sora 的,隻有 OpenAI 內部員工、授權的藝術傢、紅隊測試人員。紅隊測試是為評估 AI 在關鍵領域的危害,隻有這些領域裡有資質的人才可能獲得測試資格。如果你有幸獲得資格,別說是

2023-02-13

像 J.P. 摩根這樣的公司願意為 Chatgpt 投入資金成本,從 OpenAI 這樣的人工智能公司購買企業版,給予 ChatGPT 等人工智能本地數據庫的權限,並加以訓練,大量的基礎工作將會被 Chatgpt 取代。但是,“ 蛋黃 ”也並不認為基礎工作

2024-07-23

引起關註,有不少人質疑百度智能駕駛是在搶出租車司機的飯碗”。對此,極越CEO夏一平發佈視頻回應此事,認為這個觀點十分離譜。夏一平稱,最近有個小朋友說百度自動駕駛是為搶出租車的飯碗,我覺得這個觀點有點離譜。

2024-02-21

全自己時,思考技術發展的正當性似乎成有價值的事情。OpenAI開年拋出Sora,讓全世界都倍感震撼。年前還在說大模型是茶葉蛋的周鴻禕,看到來勢洶洶的Sora,馬上改口:“AGI從10年的時間一下縮短到1年。”面對以天為單位不斷

2022-09-05

研究機器人的目的是啥?肯定有人說為人類進步,改變世界之類的。但是,在俗人眼裡,機器最實在的就是解放人力。想象一下,咱們辛苦摸魚一整天,回到傢裡肯定不想動彈。這個時候,對於女生來說,最麻煩的肯定是每天一