ChatGPT幾乎有能力通過美國醫學執照考試

2023-02-15 發表於業界精選

不久之後，列出ChatGPT不能完成的任務將比它能完成的任務更容易。我們已經分享關於ChatGPT通過法學院和商學院考試的報告，現在一項新的研究顯示，人工智能聊天機器人也能通過美國醫學執照考試（USMLE），盡管其分數並不特別令人印象深刻。

來自醫療保健創業公司Ansible Health的研究人員於2月9日在《PLOS數字健康》雜志上分享他們的研究結果。他們發現ChatGPT能夠在執照考試中取得"大約60%的通過門檻"。

正如該網站所解釋的，USMLE是美國醫生獲得醫療執照所必須參加的三步考試。除測試未來醫生的技能和醫學知識外，該考試還評估他們的價值觀和態度。

在排除基於圖像的問題後，研究人員向ChatGPT提供2022年6月USMLE考試中376個問題中的350個。在這三次考試中，ChatGPT的得分在52.4%和75%之間。在大多數年份，通過門檻約為60%。ChatGPT的得分也超過PubMedGPT--一種專門針對生物醫學文獻進行訓練的模型--其得分為50.8%。

作者說。"達到這個眾所周知的困難的專傢考試的合格分數，並且在沒有任何人類強化的情況下做到這一點，標志著臨床人工智能成熟的一個值得註意的裡程碑。"

在這項研究發表後不久，各州醫學委員會聯合會和國傢醫學考試委員會，這兩個USMLE的共同發起人，分享他們自己的一份聲明。他們指出，最近的兩項研究使用考試準備材料和練習題，而不是實際的USMLE考試題，因此，ChatGPT的成就隻能帶有一個星號。

......需要註意的是，ChatGPT所使用的練習題並不能代表考生所經歷的USMLE考試內容的全部深度和廣度。例如，某些問題類型沒有包括在研究中，如那些使用圖片、心音和基於計算機的臨床技能模擬。這意味著其他關鍵的考試結構在研究中沒有得到完整的體現。
"盡管目前沒有足夠的證據支持人工智能可以通過USMLE步驟考試的說法，但隨著技術的發展，我們不會驚訝地看到人工智能模型大幅提高其性能，如果利用得當，這些工具可以對評估的構建方式和學生的學習方式產生積極影響。"

ChatGPT幾乎有能力通過美國醫學執照考試

相關推薦

王炸更新！谷歌發佈PaLM 2大模型：支持100種語言

OpenAI首席技術官：ChatGPT可能會被“壞人”利用應受到監管

世界上最大的學術出版商認為ChatGPT不能被標記為作者

馬斯克認為ChatGPT的一些回應是“令人擔憂的”

ChatGPT大戰司法考試：無需微調，一類試題達到人類水平

Hugging Face發佈生成式AI健康任務測試基準

Google的Med-Gemini醫療人工智能模型被證明表現不輸人類醫生

2023，我們不得不面對ChatGPT引發的混亂

谷歌一雪前恥全新PaLM 2反超GPT-4 Bard史詩進化

1.2萬名實習和住院醫生離崗首爾大學醫學院教授或將集體辭職

韓國醫生“辭職潮”：離崗率超9成醫療系統危機加劇

韓國政府對五名醫生提起刑訴公眾卻一邊倒地支持政府行動

擔心的事兒發生？已有企業在用ChatGPT取代員工

擔心的事兒發生？已有企業在用ChatGPT取代員工