Sora一夜之間爆火全球。但奇怪的是,OpenAI聯合創始人兼首席科學傢伊爾亞·蘇茨克維(IlyaSutskever)卻在保持沉默,沒有轉發任何一條關於Sora的視頻或推文。Sora目前沒有公開測試權限,僅僅向公司內部負責安全風險評估的紅隊成員(RedTeamers),以及極少數視覺藝術傢、設計師和電影制作人提供訪問權限。因此模型發佈當天,OpenAICEO薩姆·奧爾特曼(SamAltman)在社
OpenAI 聯合創始人兼總裁格雷格·佈羅克曼(Greg Brockman)、CTO 米拉·穆拉蒂(Mira Murati)等人,也在積極為 Sora 宣傳。
但伊爾亞的最後一條推文,停留在 2023 年 12 月 15 日。
OpenAI 在其官網上的 Sora 的文章後面留下團隊成員的名字。在一串致謝名單中,我們看到薩姆·奧爾特曼、格雷格·佈羅克曼、米拉·穆拉蒂等人的名字,但唯獨沒有出現伊爾亞·蘇茨克維。
這不禁讓人懷疑,伊爾亞究竟是在埋頭研究 GPT-5,還是已經離開 OpenAI ?
值得一提的是,OpenAI 創始成員之一、AI 技術研究員安德烈·卡帕蒂(Andrej Karpathy)在Sora 發佈前夕離職。有網友大膽猜想:“如果 Andrej 和 Ilya 創辦一傢真正開放的人工智能公司怎麼辦?”
1.“我們終於知道伊爾亞看到什麼”
今天,OpenAI 最新發佈的 Sora 模型再次讓人們感受到人工智能的強大,強大到令人害怕。
Sora 不僅僅是一個視頻生成模型,它湧現出對物理世界的理解能力(盡管還存在局限),OpenAI 直接將其定義為“世界模擬器”(world simulators)——它打開一條通往模擬物理世界的有效路徑。不少人感慨,“現實不存在”,“物理學不存在”。
人們似乎在這一刻終於理解伊爾亞為什麼一直執著於人工智能的安全性研究。強大的 AI 模型對世界帶來的風險並非遙不可及。
有網友表示:“現在,我們知道伊爾亞看到什麼。”埃隆·馬斯克則在貼子裡留下一個笑哭的表情。
去年,隨著 GPT-4 以及後續一系列更強大的大語言模型的更新,以伊爾亞為代表的 OpenAI 成員越來越多地考慮 AI 的可控性問題。
為此,OpenAI 在 2023 年 7 月 5日宣佈成立一個新的團隊“超級對齊”(Superalignment),來研究引導和控制比人類聰明得多的 AI 系統。這一項目由伊爾亞與同事簡·萊克(Jan Leike)共同領導,並將 OpenAI 20% 的算力專門用於該項目的研究。
一般認為,去年 11 月鬧得沸沸揚揚的 OpenAI “宮鬥事件”的導火索,就是伊爾亞對於 AI 的發展理念與薩姆產生分歧,伊爾亞越來越擔憂 OpenAI 的技術可能造成極度危險的局面,他覺得薩姆對待 AI 應該更加謹慎。顯然,薩姆並沒有停下來。
在矽谷,對於 AI的不同態度把人群分成保守派與激進派。保守派也被稱為EA(Effective Altruism,有效利他主義),代表人物是“人工智能教父”傑弗裡·辛頓(Geoffrey Hinton),伊爾亞就是他的學生。
激進派被稱為“e/acc(有效加速主義)”,很多知名的科技大佬、AI 從業者都是 e/acc 主義的信徒。薩姆並未公開表達過自己的立場,但考慮到他帶領下的 OpenAI 一系列激進的產品發佈節奏,事實上他已經成為 e/acc 的代言人。
伊爾亞聯合董事會成員罷免薩姆。但在大股東微軟的斡旋與 OpenAI 全體員工請辭的壓力下,伊爾亞最終妥協讓步,薩姆在幾天後重新回到 OpenAI 並掌權,並重組董事會。
宮鬥事件結束後,伊爾亞並沒有立即離開 OpenAI,薩姆希望繼續他們之間的工作關系,並正在討論他如何繼續在 OpenAI 的工作。
薩姆表達對伊爾亞的謝意:“我尊重並熱愛著伊爾亞,我認為他是這個領域的指路明燈,也是人類的瑰寶。我對他的惡意為零。”
但去年外媒一篇報道曾指出,伊爾亞似乎處於一種“迷茫”的狀態,在 OpenAI 變得“隱形”。自薩姆回歸以來,伊爾亞就沒有出現在 OpenAI 舊金山的辦公室內。 馬斯克也向伊爾亞拋出橄欖枝,他表示伊爾亞應該加入特斯拉或他的 AI 公司 xAI。
伊爾亞對於人工智能安全的工作還在繼續。12 月 14 日,OpenAI 發佈超級對齊項目的最新研究論文:使用 GPT-2 級別的小模型來監督 GPT-4 級別的大模型,並獲得接近 GPT-3.5 級別的性能。同時,OpenAI 宣佈與 Eric Schmidt 合作,啟動一項 1000 萬美元的資助計劃支持技術研究,以確保超人類人工智能系統的一致性和安全性。
作為該論文核心作者之一的伊爾亞,也在 X 上轉發相關內容。但這是宮鬥事件至今,伊爾亞在 X上轉發的關於 OpenAI 進展的唯一內容。
我們暫時無法得知伊爾亞是否已經離開 OpenAI ,但他對於 Sora 的沉默態度似乎並不尋常。
伊爾亞在簽名上寫著:“朝著擁抱人性多樣化的通用人工智能發展。”
2.人才是 OpenAI 的核心競爭力
雖然伊爾亞並不在 Sora 的研究團隊中,但 Sora 仍然表現出壓倒性的性能優勢,可見人才密度是 OpenAI 領先的重要因素。
Sora 團隊整體非常年輕。核心成員有三位,分別是研究負責人Bill Peebles(比爾·皮佈爾斯)與 Tim Brooks(蒂姆·佈魯克斯)與系統主管 Connor Holmes。
Conner Holmes 曾是微軟研究員,在微軟工作時以外援形式參與 DALL·E 3 的推理優化工作,後來跳槽加入 OpenAI 。
Bill Peebles 本科就讀於 MIT,主修計算機科學,參加 GAN 和 text2video 的研究,還在英偉達深度學習與自動駕駛團隊實習,研究計算機視覺。畢業後正式開始讀博之前,他還參加 Adobe 的暑期實習,研究的依然是 GAN。
2022年5月,Bill 到 Meta 進行為期半年的實習,和謝賽寧( Bill 開始實習時還未離開 Meta)合作發表 DiT 模型,首次將 Transformer 與擴散模型(Diffusion Model)結合到一起。從加州大學伯克利分校博士畢業之後,Bill 加入 OpenAI。
Sora 的模型架構,就是參考 Bill 與 謝賽寧合作發表的 DiT 論文。值得一提的是,該論文主要聚焦在 DiT 架構在圖像生成領域的性能表現。有人推測,隨著 Bill 加入OpenAI ,他很可能把自己在視頻領域的研究成果,也帶到 OpenAI 的 Sora 項目中。
Sora 的另一個核心作者是 Tim Brooks,曾在 Google 負責 Pixel 手機攝像頭的機器學習工作,以及在英偉達負責視頻生成模型研究。
2023 年從加州大學伯克利分校博士畢業後,Tim 加入 OpenAI,參與 DALL·E 3 相關研究。
在其他幾位作者中,也包括兩位華人 Li Jing 與 Yufei Guo。
今天,上海交大校友、目前在紐約大學擔任助教的謝賽寧在朋友圈辟謠自己是 Sora 作者之一的消息。他表示,Sora 是 Bill 他們在 OpenAI 的嘔心瀝血之作,雖然不知道細節,但他們每天基本不睡覺高強度工作一年。
同時,謝賽寧也對 Sora 發表他的觀點:
第一,對於 Sora 這樣的復雜系統,人才第一,數據第二,算力第三,其他都沒有什麼是不可替代的;
第二,在問 Sora 為什麼沒出現在中國的同時,可能也得問問假設真的出現(可能很快),我們有沒有準備好?
如何能保證知識和創意的通暢準確傳播讓每個人擁有講述和傳播自己故事的“超能力”,做到某種意義上的信息平權。但是又不被惡意利用,變成某些人某些組織的謀利和操縱工具。oai 有一整套的 redteaming, safety guardrail 的研究部署,歐美有逐漸成熟的監管體系,我們準備好嗎?
這件事跟技術成熟前,生成點小打小鬧的漂亮圖片不是一個量級,真相捕捉和黑鏡裡講的故事,很有可能很快變成現實。
(封面圖來自 X,左邊為安德烈·卡帕蒂,右邊為伊爾亞·蘇茨克維)