我們為什麼需要AGI?很多人可能沒有仔細思考過這個問題,隻看到結果。部分人認為,科技進步就應該無條件推進。至於原因為何,可能並沒有加以深思。也許追問到最後,也隻是得出一個讓我們的生活更加便利的結論。而究竟在哪些方面提供何種便捷,可能也沒法說那麼完善。事實上這種思路也不能說錯。
畢竟,有些事是先有動力驅使,再去逐漸實現。有些事是先做到,再看看能幫我們什麼。
今天我們給大傢提供一個現實語境下的切入點,來看看AGI究竟能幫到我們什麼。
最全面的醫生
首先我們來介紹一個人,Greg Brockman。
熟悉AI圈的朋友應該對他都不陌生,他是OpenAI的聯合創始人+總裁。
2010年到2015年,他在Stripe任職CTO。之後到今天,他一直是OpenAI的總裁。
不過今天要講的是他的妻子,Anna Brockman。
2019年,他們二人結婚,美滿的婚姻背後,是他妻子不可忽視的身體狀況。
在最近的一篇推文中,Greg寫道:“在經歷長達五年的身體多系統疼痛之後,我的妻子最近被診斷出患有一種名為過度活動型埃勒斯-當洛斯綜合征(hEDS)的遺傳性疾病。”
要知道,hEDS是一種遺傳性結締組織疾病,會導致全身關節過度活動、關節不穩定和慢性疼痛。
同時hEDS還伴有各種其他癥狀和相關病癥,影響身體的許多不同部位。
而Greg的妻子是之前當快六年的演員,目前的職業還是名健身教練。可想而知這個病會給她帶來多麼大的痛苦。
從這個病的介紹來看,這是一個綜合性的疾病。涉及到全身很多系統,比如骨科、心臟科、神經科、腸胃科、皮膚科等等。
Greg在Twitter中表示,目前的醫療體系都是針對各個專科建立的。hEDS要看的醫生可太多。
“五年來,我們看比Anna之前一生還要多的醫生和各種專科醫生。大部分醫生隻聚焦於自己所熟悉的領域,而並沒有能把這些碎片化的信息整合在一起。”
後來,Anna的一位專精過敏的大夫細致聽取她的所有癥狀和存在的問題,把有關她身體狀況的細節都拼湊在一起。
Greg表示,隨著人類醫學的進步,我們似乎有一種趨勢,那就是以犧牲廣度為代價來增加醫生的深度。但對於病人來說,我們需要的是足夠的廣度和足夠的深度,二者缺一不可。
最理想的情況就是,未來我們可以把這種全面的醫療服務變得口袋化,就好像一個集結眾多科室的醫生組成的專傢小組,共同為我們的身體健康保駕護航。
而這正是需要AGI出場的地方。
Greg最後在Twitter中表示,雖然在技術方面還有很長的路要走,AGI要學習如何在像醫療這樣的高風險領域將其與人類專傢的監督結合起來,如何一起部署,但前景已經越來越明朗。
通過技術開發人員、醫療保健提供商、政府和社會的通力合作,未來人們有希望為所有傢庭成員提供更好的醫療保健服務。
不少網友也是跟帖發表自己的看法。
Bacarella表示,如果醫療AI哪怕能像平均水平的醫生那樣聰明,同時又像GPT4那樣有耐心、專註,還懂得多,那估計行,未來將會有很大的改變。
Paul也認為,AI發展到一定階段,就一定可以把醫學上的新診療手段推而廣之,讓普羅大眾都能接觸到各種醫療技術。
而這可能是AI最應該投身的領域。
Google的嘗試
要知道,Greg的想法此前曾被Google印證過。
美國哈佛大學、斯坦福大學、耶魯醫學院、加拿大多倫多大學等多所頂尖高校、醫療機構的研究人員在Nature上聯合提出一種全新的醫學人工智能范式,即“全科醫學人工智能”,可以靈活地編碼、整合和大規模解釋醫學領域的多模態數據,比如文本、成像、基因組學等。
而GoogleResearch和GoogleDeepMind也曾共同發佈論文,對全科醫學人工智能概念進行實現、驗證。
研究人員首先策劃一個全新的多模態生物醫學基準數據集MultiMedBench,包含100多萬條樣本,涉及14個任務,如醫療問題回答、乳腺和皮膚科圖像解讀、放射學報告生成和總結以及基因組變異識別。 然後提出一個新模型Med-PaLM Multimodal(Med-PaLM M),驗證通用生物醫學人工智能系統的可實現性。
這是一個大型多模態生成模型,僅用一組模型權重就可以靈活地編碼和解釋生物醫學數據,包括臨床語言、成像和基因組學數據。在所有MultiMedBench任務中,Med-PaLM M的性能都與最先進的技術相差無幾,在部分任務上甚至還超越專用的SOTA模型。
文中還報告該模型在零樣本學習下可以泛化到新的醫學概念和任務、跨任務遷移學習以及湧現出的零樣本醫學推理能力。
文中還進一步探究Med-PaLM M的能力和局限性,研究人員對比模型生成的及人類編寫的胸部X光報告進行放射科醫師評估,在246份病例中,臨床醫生認為Med-PaLM M的報告在40.5%的樣本中比放射科醫生編寫的要更好,也表明Med-PaLM M具有潛在的臨床實用性。
為訓練和評估大模型在執行各種臨床相關任務的能力,Google的研究人員收集一個多任務、多模態的全科醫療基準數據集MultiMedBench。
該基準由12個開源數據集以及14個獨立任務組成,包含100多萬條樣本,涵蓋醫療問答、放射學報告、病理學、皮膚病學、胸部X光、乳房X光和基因組學等多個領域。
而之後沒過多久,Google又繼續推出Med-PaLM 2,第二代產品。
它是Med-PaLM的繼任者,它要比其前身更加強大,在USMLE樣式的問題上達到 86.5% 的準確率,提高19%。
Med-PaLM 2是在海量醫學文本和代碼數據集(包括醫學期刊、臨床試驗和教科書)上進行訓練的。這使它能以高準確度理解和生成醫學語言。
不僅如此,Med-PaLM 2還能根據醫學知識進行推理和推斷。
有專傢分析,Med-PaLM 2有可能在多個方面徹底改變醫療保健。比如說:
·提高診斷的準確性:Med-PaLM 2可以幫助醫生綜合考慮患者的所有醫療信息,包括癥狀、病史和檢查結果,為患者確定正確的診斷。
·提高效率:Med-PaLM 2可以幫助醫生自動完成總結病歷和從研究論文中查找相關信息等任務。這可以讓醫生騰出更多時間與病人溝通。
·改善溝通:Med-PaLM 2可以幫助醫生以通俗易懂的方式向病人傳達復雜的醫療信息。這可以幫助病人對自己的治療做出明智的決定。
·降低成本:Med-PaLM 2可以通過自動化任務和提高效率來降低醫療成本。
目前,Google的Med-PaLM 2仍在開發中,但它有可能對醫療保健行業產生重大影響。
不過,說到Google還是得再提一句前兩天剛剛出爐的醫學對話AI——AMIE,而且還直接通過圖靈測試!?
到現在為止,Google還在積極地進行測試,努力使它在未來得到更廣泛的應用。
不知道像Google的這類產品,以及未來可能出現的其它醫療AI,甚至醫療AGI,能不能解決Greg的問題呢。