下棋下哭柯潔的DeepMind 這次要讓生物界地震?


最近又被AI新聞給刷屏,當年開發出AlphaGo,下棋下哭柯潔的GoogleDeepMind公司,在Nature上公佈最他們新一代AlphaFold3模型。AlphaFold,這個聽起來有點像折疊屏手機型號的名字,是他傢專門預測蛋白質結構的新AI。

生物體內幾乎所有的分子結構,它都可以預測。這意味著生物醫學研究從此開真 · 上帝視角,任何生物分子作用機理都將從黑盒中打開,變成透視模式。

不少媒體和網友開始歡呼, 21 世紀,這下真要成生物的世紀……


要看懂這次新發佈的 AlphaFold 3 有多牛,咱們就得先知道, DeepMind 和它的 AlphaFold ,曾給分子生物圈多大的震撼……

我們在九年義務教育裡都學過,生物體內最多的物質就是蛋白質,而要搞清楚生物分子的底層原理,就必須知道每個蛋白質具體長啥樣。

這麼說吧,在 AlphaFold 之前,大夥們預測蛋白質結構主要兩種辦法,

一是用 X 光照蛋白質晶體,也就是先拍片子再分析片子,再來搞懂它長啥樣。二是核磁共振 ( NMR ) 光譜,拍出大體形狀輪廓,再推測它的結構。

這些傳統辦法不僅慢,適用范圍小,需要不斷試錯,還費錢,每拍一次片子就花好幾萬美金一輛小米 su7 。

這也是為啥蛋白質研究方向生物學傢,費錢且需要大量經驗……隻有那些經驗的老師傅,蛋白質仙人,才能更快猜到蛋白質的準確形狀,少拍點片子。


所以人們就琢磨,這種需要經驗總結的工作能不能靠 AI 解決呢?DeepMind 就來幹這事,為克服傳統拍片子的問題,第一代 AlphaFold 選擇技術路線的時候就攤牌:

不拍片子!

蛋白質既然由氨基酸構成,初代 AlphaFold 用的方法就是,利用來自各處公開的已知蛋白質結構,把這些蛋白質中每一對氨基酸的距離,鏈接角度,匯總起來做成一張圖, AI 用神經網絡消化完他們,再讓 AI 做出自己的預測。


而 2018 年第一代 AlphaFold 一經發佈,就技驚四座,力壓一眾實驗室老師傅,獲得第 13 屆蛋白質結構預測大賽 ( CASP ) 冠軍。

AI ,很神奇吧。

不過,初代 AlphaFold 有個問題,它更依賴局部數據的特征來訓練,它不太能提取到較遠元素之間的關系。就好像一個隻會寫短文,但學不會寫長篇小說的作傢。

問題是,很多蛋白質分子有長距離的依賴性,這讓初代 AlphaFold 的實力就有點捉襟見肘。

好在 2020 年發佈的 AlphaFold2.0 ,用上後來在 ChatGPT 上大火的 Transformer 模型。


Transformer 模型的註意力機制,則完美解決長距離氨基酸的問題,進步有多大呢?

2018 年蛋白質結構預測大賽裡 1.0 版本準確度得分不到 60 分,但是 2020 年大賽裡 2.0 版本拿到驚人的 92.4 分,它能生成的范圍已經涵蓋人類已知蛋白質的 98% ,更重要的是它完全開源


可以說, 2.0 版本已經基本解決單鏈蛋白質的預測問題,到 2021 年,基於 2.0 改版的 AlphaFold-Multimer 發佈,也支持上多鏈,準確度上也取得突破,蛋白質之間作用的預測準確率超過 70% 。

所以現在很多公司也用上它們,甚至助力國外一些新冠疫苗研發。


但在 DeepMind 看來,蛋白質結構預測上的勝利,還遠遠沒發揮完 AI 的潛力,因為生物體內的復雜分子結構不止有蛋白質,還有核酸,小分子配體等等,

這就好比你花十年時間學刻鑰匙開鎖技術,結果一出師,發現大傢用的都是指紋鎖密碼鎖,用傳統鑰匙的人太少!

所以這次 AlphaFold 3 ,他們更新一個更牛逼的全方位模型,不僅能預測蛋白質 DNA RNA 等各種小分子,還能揭示他們之間的互相作用。


那這是怎麼幹的呢?答案是,他們用 Diffusion 。

對,就是大名鼎鼎的擴散模型,在 AI 繪畫大火的時候,想必大傢就聽說過。它的原理就是把原圖像不斷打碼,再讓 AI 學會預測這些馬賽克的生成過程,然後反過來實現從馬賽克到圖像的生成。

不過,就像 AI 畫畫生成不好手指, Sora 椅子視頻會穿模一樣, Diffusion 加持下的 AlphaFold 3 也會預測錯誤,特別是在一些長得相似難以區分的結構上,比如各位高中有機化學裡學過的手性分子。


所以在這些容易出錯的地方, DeepMind 用一個叫做交叉蒸餾的操作,說白就是讓有 Transform 模型的 2 代版本先預測,再把預測數據添加到 AlphaFold 3 的訓練中,也就是相當於讓 2 代扮演教師,領著 3 代去做,這樣就能減少預測失誤。

生成的效果有多好?直接看官方圖吧

AlphaFold 3 對 7BBV - 酶 ( 存在於一種土壤真菌體內 ) 的預測,其中酶蛋白( 藍色 )、離子( 黃色球體 )和單糖( 黃色 )與真實結構( 灰色 )幾乎重合


AlphaFold 3 對感冒病毒刺突蛋白( 藍色 )與抗體( 綠松石色 )和單糖( 黃色 )相互作用時的結構預測,與真實結構準確匹配( 灰色的)


AlphaFold 3 對蛋白復合物的預測,其中蛋白質( 藍色 )與 DNA ( 粉色 )結合,預測模型與實驗測定的真實分子結構( 灰色 )近乎完美匹配


除生成質量相當哇塞,精度也是遙遙領先的原子級。在蛋白質與核酸配體的模擬上全面優於其他產品,抗原抗體的模擬也同樣優秀。

而操作 AlphaFold3 就更容易。用 ChatGPT ,咱還得想辦法提個好問題、寫好提示詞,而在 AlphaFold 3 ,你隻需要輸入一些分子列表,它就能預測出它們是如何組合在一起的。


試想一下,原先需要花大量時間精力和資金才能觀察到的現象,現在隻需要在網站輸入參數再單擊,幾分鐘後就能產生極高清晰度和準確度的生物大分子模型。

甚至細胞系統內部的生化過程,現象, DNA 如何發揮作用,藥物和激素的反應如何進行,也全都能在極短時間內被整明白。

這些遙遙領先的數據,和大傢的熱情好像都在說:這次發佈已經不是跨越式進步,而是革命性的突破,整個傳統生物醫療的科研方式,似乎都要被改變。

不過世超覺得,樂觀是好的,但是科學這玩意兒除樂觀,要的還得是中肯和嚴謹。

在各路媒體和網友都在 “ 炸裂 ” “ 顛覆 ” “ 改變世界 ” 的時候,圈內對的不少大佬,也發表些對 AlphaFold 3 的評價。

比如顏寧教授團隊就發現, 3.0 版本在一個糖蛋白預測中就翻車,表現甚至不如前代版本。

也有不少科學傢吐槽 3.0 相比 2.0 它還不開源,使用次數也有限制。


甚至,還有人質疑 DeepMind 的老板 Hassabis ,他自己就創立過一傢 “ 專註人工智能的藥物公司 ” ,號稱要 “ 利用人工智能重新定義藥物發現 ” ,但從 2021 年到,今天他們還沒有推出任何藥物。

當然這就有點在尬黑,畢竟藥物研發過程中,蛋白質結構問題隻是其中一小部分,這並不能對藥物研發進度產生決定性影響……


總之,世超覺得 AlphaFold 的三代產品確實喜人,但在生命科學的漫漫實踐長路上,它依舊有著不少難題需要去突破。不過說到底,進步總還是好事,希望 DeepMind 能再多搞點,搞快點吧。


相關推薦

2024-05-09

GoogleDeepMind正在推出其人工智能模型的改進版,該模型不僅能預測蛋白質的結構,還能預測"所有生命分子"的結構。新模型AlphaFold3的工作將幫助醫學、農業、材料科學和藥物開發領域的研究人員測試潛在的發

2022-07-29

去年,Alphabet的DeepMind發佈一個開源數據庫,其中包含數十萬種蛋白質的3D結構,包括人體中所有的2萬種已知蛋白質。現在,這個AlphaFold蛋白質結構數據庫已經擴展到2億個,包括科學上已知的幾乎所有蛋白質。蛋白質是細胞的重

2023-03-03

公佈的等級分排行榜,28歲的李軒豪以2714.2分躍居榜首,柯潔以2709.2分退居第二。早在2015年10月,還不滿18歲的柯潔就登頂中國圍棋等級分第一,中間隻被羋昱廷短暫超越過。從2018年的11月起,柯潔就一直占據榜首位置。資料顯

2022-06-27

董事長R.C. Bhargava表示,考慮到印度約75%的電力來自不清潔的煤炭,該公司認為,混合技術、天然氣和生物燃料驅動的汽車比電動汽車更能帶來清潔的未來。R.C. Bhargava表示:“隻談論電動汽車而不考慮該國發電是否綠色環保,

2023-02-25

10 萬年裡,富士山兩翼巖漿已累積多達 500 立方千米,聖潔的錐形山體由此和諧成型。公元 1707 年,即中國的清康熙年間,是富士山最後一次大規模噴發。火口噴發出高達 3000 米的濃煙可上抵平流層,在相距 100 千米的東京堆積

2022-08-09

其首個傢庭消費級人工智能產品——“元蘿卜SenseRobot”AI下棋機器人。“元蘿卜SenseRobot”包含AI學棋、殘局挑戰、棋力闖關、巔峰挑戰等多種模式,可以從“0基礎”為孩子介紹和講解象棋的文化、規則及每個棋子的使用技巧,

2022-10-08

過程中與外部聯系的懷疑聲,尼曼甚至宣佈自己可以全裸下棋來證明清白。當然,尼曼也有自己的支持者。特級大師阿倫尼安(Levon Aronian)出來打圓場,“年輕選手表現異常出色的情況也是經常發生的。我們同行們都有點神經

2023-09-19

消息,據媒體報道,9月18日21時21分在東海海域發生6.4級地震,震源深度170公裡,震中位於北緯26.45度,東經125.35度,福建、浙江沿海等地有震感。據悉,海洋地震可造成海底斷層,很多時候不產生海嘯。由於海水不能傳播橫波,

2023-11-02

稱,“今天的大型神經網絡可能具有輕微的意識”(GoogleDeepMind首席科學傢、倫敦帝國理工學院教授、電影《機械姬》的科學顧問Murray Shanahan在下面回復到“你這好像是在說,這一大片麥田裡已經有輕微的蘭州拉面”)。解決一

2023-08-03

8月2日消息,近日,菲律賓火山地震研究所發佈消息稱,從7月31日5時到8月1日5時,馬榮火山間歇性地噴出火山灰,在此24小時內,共計錄得258次火山地震、100次落石事件。自今年6月以來,馬榮火山持續出現活動異常,已持續8周

2022-09-18

17日晚間9時41分至深夜11點33分,臺東蓮花縣接連發生20起地震,都是淺層地震,震級最高為6.6級。18日下午2點44分,臺東地區再度發生6.9級地震。據介紹,此次的6.9級地震,震中在臺東池上,震源深度7千米,臺東池上震度達到6強

2023-04-25

報告這一發現,其作者駁斥一些AlphaFold愛好者的說法,即DeepMind的人工智能已經掌握終極蛋白質物理學,是結構生物信息學的終點。結構生物信息學是一個科學分支,探索蛋白質、RNA、DNA的結構以及它們與其他分子的相互作用。

2022-10-06

DeepMind碾壓人類高手的AI圍棋大師AlphaZero,下一個目標是數學算法!現已發現50年以來最快的矩陣乘法算法。下圍棋碾壓人類的AlphaZero,開始搞數學算法,先從矩陣乘法開始!在昨天DeepMind團隊發表在Nature上的論文中,介紹 AlphaTens

2023-06-14

推出專為學習圍棋的青少年而設計的“元蘿卜SenseRobot”AI下棋機器人圍棋版。作為“元蘿卜”傢族的新成員,該產品融合商湯領先的AI和機械臂技術,可在真實棋盤上實現圍棋練習和對弈。即日起,“元蘿卜SenseRobot”AI下棋機器