OpenAI的模型在評估眼疾方面幾乎與醫生不相上下


根據研究,OpenAI最新的人工智能模型在分析眼部狀況方面幾乎與專傢醫生不相上下,這凸顯該技術在醫學領域的潛力。本周三發表的一篇論文顯示,微軟支持的新創公司的GPT-4模型在評估眼部問題和提出治療建議方面,除得分最高的專科醫生外,其他所有醫生都超過或達到相同的分數。

skynews-arun-thirunavukarasu_6524436.jpg

眼科一直是將人工智能應用於臨床並解決其應用障礙的工作重點,例如模型通過虛構數據產生"幻覺"的傾向。"這項工作表明,這些大型語言模型在眼健康方面的知識和推理能力現在幾乎與專傢無異,"發表在《PLOS 數字健康》雜志上的一篇論文的主要作者 Arun Thirunavukarasu 說。

他補充說:"我們看到回答相當復雜問題的能力。研究使用 87 種不同的病人情況來測試 GPT-4 在非專業初級醫生、見習眼科醫師和專傢眼科醫師中的表現。論文稱,該模型的表現優於初級醫生,並取得與許多專傢相似的結果。

研究人員說,這項研究之所以引人註目,是因為它將人工智能模型的能力與執業醫生的能力進行比較,而不是與檢查結果進行比較。它還運用生成式人工智能的廣泛能力,而不是之前一些人工智能醫學研究中測試的狹窄能力,如通過病人掃描診斷癌癥風險。該模型在需要一階記憶的問題和需要高階推理的問題(如插值、解釋和處理信息的能力)上表現同樣出色。

Thirunavukarasu 在劍橋大學臨床醫學院學習期間開展這項研究,他目前在牛津大學工作,他認為可以通過擴大數據集(包括管理算法、去身份化的病人筆記和教科書)對模型進行訓練,從而進一步完善模型。這就要求在擴大信息來源的數量和性質的同時,確保信息保持良好的質量,在兩者之間取得"棘手的平衡"。

潛在的臨床用途可能是對病人進行分流,或在專業醫護人員有限的情況下使用。有證據表明,人工智能有助於診斷,例如能發現可能被醫生遺漏的早期乳腺癌,因此在臨床環境中部署人工智能的興趣大增。與此同時,考慮到錯誤診斷可能對患者造成的傷害,研究人員也在努力解決如何控制嚴重風險的問題。

倫敦大學學院人工醫學智能教授皮爾斯-基恩(Pearse Keane)說,這項最新研究"令人興奮",其利用人工智能為專傢的表現設定基準的想法"超級有趣"。基恩也是倫敦莫菲爾德眼科醫院的成員,他也認為,在將這些技術引入臨床之前,還需要做更多的工作。

他列舉自己去年研究中的一個例子:向一個大型語言模型詢問有關眼部黃斑變性的問題,結果該模型在回答中給出根本是"杜撰"出來的參考資料。"我們必須在對這項技術的興奮和潛在的巨大利益之間取得平衡.....至少要有謹慎和懷疑。"他說。


相關推薦

2024-02-02

根據OpenAI的一項自行研究,在研究生物武器方面,OpenAI的GPT-4隻比普通互聯網搜索工具略勝一籌。據彭博社報道,這項研究是由OpenAI的新準備團隊進行的,該團隊於去年秋天成立,目的是評估該公司前沿人工智能模型的風險和潛

2023-03-18

始於Google,發跡於OpenAI,這是很多GPT-4貢獻者的職業軌跡。這個星期,OpenAI大模型GPT-4的發佈讓全球科技圈的技術競爭進入白熱化。幾天之內,ChatGPT、必應搜索和Microsoft365相繼接入GPT-4,微軟的AI應用瞬間比競爭對手拉開一個身位

2023-11-28

OpenAI員工曾在Altman被解雇的前一天發帖:AI正在自己編程!這一帖子被挖出後,更多內幕文件被曝出,表示Q*已經破解加密,AGI即將到來。Q*項目,又傳出炸裂消息——在人類看不見的角落裡,AI竟然自己在偷偷編程?傳言稱,Q-St

2024-03-20

年度健康活動“TheCheckUp”中發佈一系列將人工智能(AI)模型應用於醫療保健行業的新舉措。谷歌表示,其旗下的兩個部門,GoogleResearch和Fitbit正在開發一項新的AI功能,該功能將能從運動腕帶中提取用戶數據,讓用戶解他們的

2024-02-13

人,Greg Brockman。熟悉AI圈的朋友應該對他都不陌生,他是OpenAI的聯合創始人+總裁。2010年到2015年,他在Stripe任職CTO。之後到今天,他一直是OpenAI的總裁。不過今天要講的是他的妻子,Anna Brockman。2019年,他們二人結婚,美滿的婚

2023-03-15

很多學者都提到多模態,我們並沒有等太久。今天凌晨,OpenAI發佈多模態預訓練大模型GPT-4。GPT-4 實現以下幾個方面的飛躍式提升:強大的識圖能力;文字輸入限制提升至 2.5 萬字;回答準確性顯著提高;能夠生成歌詞、創意文

2023-03-16

人工智能研究機構OpenAI3月14日發佈備受期待的文本生成AI模型GPT-4。GPT-4在關鍵方面對其前代GPT-3進行改進,例如提供更符合事實的陳述,並允許開發人員更輕松地規定其風格和行為。它是多模態的模型,可以理解圖像內容。但是

2023-03-16

3月16日消息,人工智能研究公司OpenAI於昨日發佈備受期待的文本生成AI模型GPT-4。OpenAI聯合創始人兼總裁格雷格·佈羅克曼(GregBrockman)在接受采訪時表示,GPT-4並不完美,但卻絕對與眾不同。GPT-4在其前身GPT-3的基礎上,在許多關

2023-02-25

優於175B的GPT-3);2. LLaMA-65B與更大的Chinchilla70B和PaLM-540B不相上下。最後,LeCun表示,Meta致力於開放研究,並預備在GPL v3許可證下,向科研界開源所有模型。LLaMA:參數規模小,訓練數據多,效果拔群Meta推出的LLaMA是一組基礎語言

2023-03-15

3月15日消息,當地時間周二,人工智能研究實驗室OpenAI發佈最新版的大型語言模型GPT-4。這一讓人期待已久的高級工具不僅可以自動生成文字,還可以描述分析圖像內容;不僅推高人工智能浪潮的技術水平,也讓技術開發的道德

2024-05-06

新情況,請觀看《AI Explained》從 13:38 開始的視頻。新的 OpenAI 模型即將誕生,人工智能的賭註又提高(還有 Med Gemini、GPT 2 聊天機器人和 Scale AI)與 Med-Gemini 對話在一次實際應用測試中,Med-Gemini 收到一位患者用戶關於皮膚腫塊

2024-03-06

帶來的沖擊還未平靜,Claude3又來。3月4日晚,被稱之為是OpenAI最強競爭對手的Anthropic發佈其最新大模型系列Claude3。該系列包含三個模型,能力由強至弱分別是Claude3Opus(著作)、Claude3Sonnet(十四行詩)和Claude3Haiku(俳句)。Anthr

2024-02-23

OpenAI日前推出的視頻生成模型Sora持續引爆相關概念,被視為視頻生成服務的重大突破。然而,來自競爭對手的科學傢卻潑一盆冷水。Sora因其視頻穩定性和清晰度而受到市場青睞,但還有一些人對其給予更高厚望,認為其或許有

2024-04-19

費的足夠好用,為什麼還要花錢呢?更重要的是,如果連OpenAI、Google和Anthropic神秘的工具箱都不再高不可攀,那做一個比不上開源最強水平的閉源模型的意義何在呢。最後還是不得不問一句:GPT-5,你到底在哪裡呢?