AI這麼強?ChatGPT可以通過法律和商業研究生考試


有很多人擔心OpenAI的ChatGPT會幫助學生在考試中作弊,但如果你讓它寫一份研究生水平的考試,這個聊天機器人的表現會如何?它會通過的--如果隻是通過的話。在一項新發表的研究中,明尼蘇達大學的法學教授們讓ChatGPT為他們學校的四門課程的研究生考試提供答案。

人工智能通過所有四門課程,但平均成績為C+。在最近的另一篇論文中,沃頓商學院教授克裡斯蒂安-特維什(Christian Terwiesch)發現,ChatGPT以B到B-的成績通過一次商業管理考試。那麼,你不會想用這種技術來打動學術界。

ai-chatbots-mba-exam-pass-poses-test-for-business-schools-homepage.webp

研究小組發現人工智能並不穩定,可以說是很溫和。明尼蘇達大學的研究小組指出,ChatGPT擅長處理"基本法律規則"和總結學說,但在試圖確定與案件有關的問題時卻陷入困境。Terwiesch說,該生成器在處理簡單的運營管理和流程分析問題時"令人驚訝",但無法處理高級流程問題。它甚至在處理六年級水平的數學問題時也會出錯。

還有改進的餘地。明尼蘇達州的教授們說,他們沒有根據具體課程或問題調整文本生成器的提示,並認為學生可以通過定制獲得更好的結果。在沃頓商學院,Terwiesch說,機器人善於根據人類的指導來改變答案。ChatGPT本身可能無法在考試或論文中取得好成績,但作弊者可以讓系統生成粗略的答案並對其進行完善。

兩個陣營都警告說,學校應該限制技術的使用,以防止基於ChatGPT的作弊。他們還建議改變問題,以阻止人工智能的使用(如專註於分析而不是背誦規則),或增加對那些倚重人工智能的人的挑戰。明尼蘇達大學說,學生仍然需要學習"基本技能",而不是依靠機器人的幫助。

這些研究小組仍然認為ChatGPT可以在課堂上占有一席之地。教授可以教學生如何在工作場所依賴人工智能,甚至用它來編寫和評分考試。Terwiesch解釋說,這項技術最終可以節省時間,這些時間可以花在學生身上,比如更多的學生會議和新的課程材料。


相關推薦

2023-05-11

大型語言模型與人類認知相關性能的理想選擇。具體包括研究生入學考試(GRE),學術評估考試(SAT)和中國高考(Gaokao),可以評估尋求進入高等教育機構的學生的一般能力和特定學科知識。數據集中收集與中國高考8個科目

2023-01-28

自打橫空出世以來,ChatGPT出盡風頭:這個由OpenAI推出的一種新型AI聊天機器人工具,可以根據用戶的要求快速生成文章、故事和歌詞甚至代碼,回答各類疑問等等。它在推出之際,就因為回答裡驚人的信息量和完成度,遭遇人們

2023-02-15

不久之後,列出ChatGPT不能完成的任務將比它能完成的任務更容易。我們已經分享關於ChatGPT通過法學院和商學院考試的報告,現在一項新的研究顯示,人工智能聊天機器人也能通過美國醫學執照考試(USMLE),盡管其分數並不特

2023-01-04

ChatGPT的下一個新身份——做題傢!這不,它已經在人類各個考試中開“卷”。律師、醫生、註會什麼的,它都開始紛紛展露身手。比如,全球考生都頭疼的司法考試,現在ChatGPT在兩項試題達到合格率,其中一項還跟人類水平持

2023-02-07

現在科技圈沒啥比ChatGPT更火,當我們還在熱烈討論的時候,已經有人玩出各種新花樣,甚至已經開始以此賺錢。1會修bug能寫程序 還能拿到谷歌百萬年薪offer當然僅僅把ChatGPT當成聊天機器人就有點大材小用。近日,ChatGPT通過谷

2023-03-16

urkey表示,蘋果語音助手Siri不可能像OpenAI旗下聊天機器人ChatGPT那樣強大。John說,Siri能夠通過從數據庫中提取內容來回答天氣、播放歌曲等簡單的問題或指令,但能理解的請求數量有限,要想豐富內容必須要往數據庫添加新詞語

2023-02-15

(SamAltman)今日安撫外界的擔憂,稱人工智能聊天機器人ChatGPT不會成為人類的“就業殺手”。ChatGPT是由OpenAI研發的一款人工智能聊天機器人,一經推出就迅速成為全球關註的焦點。在短短兩個多月的時間裡,積累1億多用戶。

2023-03-15

,GPT-3.5能達到後31%水平分位,GPT-4可達到前1%水平分位;研究生入學考試 (GRE) 、SAT數學考試成績中,也有大幅提升,擊敗80%以上的人類答題水平,而醫學知識自測考試準確率達75%。第二個測試是與其他英文機器學習模型的技術能

2023-11-09

對外宣傳的工但奇怪的是,用戶在體驗後發現,號稱超越ChatGPT的一些大模型產品,實際表現不盡如人意。各種不同的統計排名口徑,更是讓人感到迷惑。以至於“第一”太多,榜單都快不夠用。比如最近,昆侖萬維開源‘天工

2023-04-07

引擎中添加對話式人工智能功能,這將引導公司應對來自ChatGPT等聊天機器人的競爭和更廣泛的業務壓力。”谷歌首席執行官SundarPichai在近日的一次采訪中表示,AI並不會對谷歌的搜索業務構成威脅,相反,人工智能的進步會增強

2024-04-02

大到通過司法考試,它都能做到。沃頓商學院教授發現,ChatGPT在MBA課程運營管理中的考試成績超過不少學生。而能力更強的GPT4,剛發佈時,就以平均分75的成績通過美國法考,超過90%的人類考生。面對擁有超能力的AI,大傢也是

2023-04-25

領導者之一,因其最近投資OpenAI——生成式AI聊天機器人ChatGPT的開發商。但目前美國在先進AI領域的另一個主要參與者Google並非BSA的成員之一。就在BSA推動AI監管之際,包括美國參議院多數黨領袖、紐約州民主黨人查克·舒默在內

2023-01-29

1月29日消息,人工智能聊天機器人ChatGPT自從發佈以來,已經引發一番熱潮。房地產行業用它來自動生成房屋描述、回答客戶問題或計算還款額度。很多房地產中介甚至表示,他們現在無法想象沒有ChatGPT的工作。房地產中介在網

2023-03-12

信息泄露和其他問題,軟銀、日立等日本公司已開始限制ChatGPT等交互式人工智能服務在商業運作中的使用。軟銀上月就使用ChatGPT和其他商業應用警告員工稱:“不要輸入公司身份信息或機密數據。”盡管軟銀已經出臺使用交互