563支AI隊伍做薑萍同一份數學試卷: 結果最高分僅34


快科技6月16日消息,在最近舉辦的阿裡巴巴全球數學競賽中,來自江蘇省漣水中等專業學校的17歲女生薑萍不僅成功入圍決賽,還以全球排名12的成績成為賽事歷史上首個進入決賽的中專生。

不僅如此,今年的阿裡數賽還首次開放AI大模型挑戰賽,共有563支由全球知名高校院所和企業組建的AI隊伍與薑萍解答同一份試卷。

最終AI隊伍的平均分為18分,這一成績已經接近人類選手的平均水平。但最高得分卻僅為34分,與人類選手的最高分113分相差甚遠,並且AI隊伍在決賽中無一入圍。

AI隊伍中最高分由上海建平中學的塗津豪個人推出的AI方案獲得,他采用一種讓多個大模型進行自問自答自驗證”的方法,以尋求問題的最優解。

而西南交通大學的特工宇宙團隊和中國人民大學的SuperCarryMan團隊分別以27分的成績位列AI挑戰賽的亞軍和季軍。

盡管AI在數學競賽中的表現顯示出一定的潛力,但專傢分析指出,現有的大語言模型在完成復雜推理和嚴謹思考方面仍存在局限。

AI在邏輯推理能力和證明題的得分上表現不佳,這表明在深層次邏輯推理和創新思維方面,人類選手依然保持著明顯的優勢。


相關推薦

2023-06-08

6月7日下午,2023年數學高考結束。作為每年高考僅次於作文題目的第二熱話題,數學難度再次引發熱議。去年的數學高考試卷難度相當高,讓大量考生欲哭無淚,至今都記憶猶新,甚至比2023年的考生更急著看到新的數學試卷。

2024-06-19

的阿裡巴巴全球數學競賽中,一位年僅17歲的中專在讀生薑萍,以她驚人的數學才華和出色的表現,成功闖入競賽的12強,成為社交平臺上熱議的焦點。薑萍的成就不僅僅在於她以93分的高分進入決賽階段,更在於她以一名中專生

2024-06-17

快科技6月17日消息,據媒體報道,年僅17歲的中專女生薑萍在全球數學競賽中脫穎而出,成功闖入前12強,這一喜訊迅速在網絡上引起廣泛關註。而在這一成就的背後,她的數學老師王閏秋也受到大傢的矚目。不少網友紛紛點贊

2024-06-18

6月17日消息,據國內多傢媒體報道,近日,天才少女薑萍入圍全球數學競賽決賽,引發關註。薑萍初三老師回憶道,薑萍非常勤奮認真,也很沉得住氣,成績也不錯,她數學不是班上最好,但她對數學比較有興趣。薑萍中考成績

2024-06-15

全球數學競賽的江蘇省漣水中等專業學校的數學天才少女薑萍,一夜之間爆火。網友發現,薑萍的數學老師王閏秋也入圍數學競賽並排名在125位。對此,王閏秋說,青出於藍勝於藍的學生很多,對老師來說沒什麼,不用宣傳我。

2024-06-22

6月21日消息,據國內多傢媒體報道,近日,中專生薑萍參加數學競賽取得優異成績引發關註。2024年6月13日,2024阿裡巴巴全球數學競賽公佈進入決賽的名單,薑萍以93分榮獲全球排名第12位的成績,入圍數學競賽決賽,是該比賽舉

2024-06-16

快科技6月16日消息,近日,17歲女孩薑萍參加阿裡巴巴達摩院全球數學競賽,以93分、全球排名12的成績晉級決賽,成為阿裡數賽舉辦以來首位打進決賽的中專在讀生,也是前30名裡唯一的女生。作為一位中專生,薑萍為什麼能和

2022-07-01

:不止數學,我們的AI甚至在整個理工科上,都已經拿到最高分啦!看來在培養“AI做題傢”這件事上,科技巨頭們已經卷出瞭新高度。Google這個最新AI做題傢,參加瞭四門考試。數學競賽考試MATH,以往隻有三屆IMO金牌得主才拿

2023-05-11

方案的能力。6. 國內公務員考試可以評估尋求進入公務員隊伍的個人的能力和技能,考試內容包括評估一般知識、推理能力、語言技能,以及與中國各種公務員職位的角色和職責有關的特定科目的專業知識,可以衡量語言模型在

2024-06-13

劍橋等頂尖高校。值得一提的是,本次比賽中,一位名叫薑萍的17歲中專女生引起廣泛關註。盡管來自江蘇省漣水中等專業學校,專業為服裝設計,但她對數學充滿熱情,通過兩年的自學,成功掌握偏微分方程知識,並在比賽中

2022-08-29

的,該情況被定義為非同源,愛麗絲和鮑勃的交換密鑰從同一個點開始,沿著各自的圖表上的隨機邊線跳躍,跟蹤從一個點到另一個點的路徑,之後愛麗絲和鮑勃都公佈密鑰的結束位置,但對相關路徑保密。現在愛麗絲和鮑勃交

2024-04-26

CPC是全球最具影響力的程序設計頂級賽事,規則要求每支隊伍使用1臺電腦,在5個小時內使用C/C++、Java、Kotlin和Python3中的一種編程語言解決10個左右的問題。程序完成之後提交評測機運行,運行結果會判定為正確或錯誤,如若錯

2023-05-06

根據finder.com實驗的最新結果,由人工智能聊天機器人ChatGPT在挑選股票標的方面明顯要比一些投資基金表現好得多。八周前,這傢個人財務比較網站依據ChatGPT推薦的38支高質量企業股票創建一個股票投資組合,“出於實驗的目的

2023-03-16

隻能超過 10% 的人類考生,妥妥學渣學霸的區別。在 GRE 數學和語文( 閱讀與填空 )考試中 ,GPT-4 的考試成績已經是哈佛、麻省理工、斯坦福大學生的水平。不僅自己回答問題能力變強,GPT-4 還會人格扮演。比如你提出一個問