ChatGPT幾乎有能力通過美國醫學執照考試


不久之後,列出ChatGPT不能完成的任務將比它能完成的任務更容易。我們已經分享關於ChatGPT通過法學院和商學院考試的報告,現在一項新的研究顯示,人工智能聊天機器人也能通過美國醫學執照考試(USMLE),盡管其分數並不特別令人印象深刻。

來自醫療保健創業公司Ansible Health的研究人員於2月9日在《PLOS數字健康》雜志上分享他們的研究結果。他們發現ChatGPT能夠在執照考試中取得"大約60%的通過門檻"。

正如該網站所解釋的,USMLE是美國醫生獲得醫療執照所必須參加的三步考試。除測試未來醫生的技能和醫學知識外,該考試還評估他們的價值觀和態度。

在排除基於圖像的問題後,研究人員向ChatGPT提供2022年6月USMLE考試中376個問題中的350個。在這三次考試中,ChatGPT的得分在52.4%和75%之間。在大多數年份,通過門檻約為60%。ChatGPT的得分也超過PubMedGPT--一種專門針對生物醫學文獻進行訓練的模型--其得分為50.8%。

作者說。"達到這個眾所周知的困難的專傢考試的合格分數,並且在沒有任何人類強化的情況下做到這一點,標志著臨床人工智能成熟的一個值得註意的裡程碑。"

在這項研究發表後不久,各州醫學委員會聯合會和國傢醫學考試委員會,這兩個USMLE的共同發起人,分享他們自己的一份聲明。他們指出,最近的兩項研究使用考試準備材料和練習題,而不是實際的USMLE考試題,因此,ChatGPT的成就隻能帶有一個星號。

......需要註意的是,ChatGPT所使用的練習題並不能代表考生所經歷的USMLE考試內容的全部深度和廣度。例如,某些問題類型沒有包括在研究中,如那些使用圖片、心音和基於計算機的臨床技能模擬。這意味著其他關鍵的考試結構在研究中沒有得到完整的體現。

"盡管目前沒有足夠的證據支持人工智能可以通過USMLE步驟考試的說法,但隨著技術的發展,我們不會驚訝地看到人工智能模型大幅提高其性能,如果利用得當,這些工具可以對評估的構建方式和學生的學習方式產生積極影響。"


相關推薦

2023-05-11

歌首個從頭開始構建的多模態模型,具有不同規模的高度能力,並能有效地與其他工具和API集成。同時,在邏輯和推理方面,PaLM 2模型更加強大。據說,PaLM 2在超過100多種語言的多語言文本上進行訓練。PaLM 2的日語水平達到A級

2023-02-06

2月6日消息,人工智能研究公司OpenAI開發的聊天機器人ChatGPT當下火爆全網。該公司首席技術官米拉·穆拉蒂(MiraMurati)在接受美國《時代》雜志采訪時表示,沒想到自己的“孩子”一經發佈就能受到如此熱烈的歡迎。穆拉蒂補充

2023-01-26

文中使用人工智能寫作工具的政策。該公司本周宣佈,像ChatGPT這樣的軟件在其數千種期刊上發表的論文中不能被記為作者身份。然而,斯普林格公司表示,他們對科學傢使用人工智能來幫助寫作或產生研究想法沒有異議,隻要

2023-02-08

2月8日消息,最近幾周ChatGPT火爆全網,但不少回答引起許多人的擔心。社交媒體推特首席執行官埃隆·馬斯克(ElonMusk)也是其中之一。馬斯克是ChatGPT背後人工智能技術公司OpenAI的創始人之一。最近他批評聊天機器人ChatGPT回答的幾

2023-01-04

ChatGPT的下一個新身份——做題傢!這不,它已經在人類各個考試中開“卷”。律師、醫生、註會什麼的,它都開始紛紛展露身手。比如,全球考生都頭疼的司法考試,現在ChatGPT在兩項試題達到合格率,其中一項還跟人類水平持

2024-04-19

準包含要求醫學推理和理解的選擇題和開放式問題,借鑒美國和印度醫學執照考試和大學生物試題庫等材料。Hugging Face在一篇博文中寫道:"[開放醫學-LLM]使研究人員和從業人員能夠識別不同方法的優缺點,推動該領域的進一

2024-05-06

USMLE)的多選題,旨在測試不同場景下的醫學知識和推理能力。Med-Gemini 如何使用自我培訓和網絡搜索工具不過,Google也為他們的模型開發兩個新的數據集。第一個是 MedQA-R(推理),它通過合成生成的推理解釋(稱為"思維鏈

2023-02-01

作為全新的人工智能(AI)語言模型,ChatGPT誕生於2022年11月30日。目前,雖然其尚處於試運行階段,但已經產生極為震撼的影響。對此,我已在本專欄發表文章《ChatGPT沖擊波已來,高等教育應做好準備》(2023年1月10日第3版),

2023-05-11

上,Google還宣佈一個重磅消息。那就是,Bard未來也能像ChatGPT一樣,接入網絡,實時搜索網頁。這次,Bard上新不少功能,比如支持兩種新的語言——日語和韓語,用戶目前可以更簡便地把生成的文本導出到Google文檔和Gmail,可視

2024-03-12

據央視新聞客戶端,當地時間12日,韓國醫科大學教授協會發佈一份聲明稱,如果實習和住院醫生以及醫科大學的學生遭受損失,醫科大學教授們將堅決追究政府的責任,采取行動解決問題。首爾大學醫學院教授協會緊急對策委

2024-03-12

醫需求。醫生“辭職潮”讓韓國社會對於醫療體系的承載能力以及病患生命健康的擔憂等不安情緒持續增加,輿論擔心,如果韓國政府和醫生群體間關於醫學院擴招等醫改政策的分歧得不到盡快彌合,未來醫生罷工的情況可能會

2024-02-28

潮。韓國保健福祉部周二已向警方提起刑事訴訟,指控韓國醫學會遊說團體中的五名成員涉嫌違反醫療法和政府的復工命令,這可能導致這五名醫生被吊銷醫療執照。這也是韓國政府第一次對參與抗議的醫生采取法律行動,這加

2023-02-27

工業機器人已經取代大批體力勞動者,而ChatGPT似乎要取代一大批腦力腦洞者。ChatGPT此前通過美國部分高校的法律、醫學考試,並順利通過谷歌軟件工程師入職測試,崗位年薪18萬美元。關於ChatGPT的未來,有人說,這玩意兒可以

2023-02-27

工業機器人已經取代大批體力勞動者,而ChatGPT似乎要取代一大批腦力腦洞者。ChatGPT此前通過美國部分高校的法律、醫學考試,並順利通過谷歌軟件工程師入職測試,崗位年薪18萬美元。關於ChatGPT的未來,有人說,這玩意兒可以