遙遙領先!阿裡Qwen-2成全球開源大模型排行榜第一


快科技6月27日消息,全球知名的開源平臺Hugging Face的聯合創始人兼首席執行官Clem在社交平臺激動宣佈,阿裡巴巴最新開源的Qwen2-72B指令微調版本在開源模型排行榜上榮登榜首。

為打造一個更為公正和準確的開源大模型排名,Clem及其團隊利用300塊H100高性能硬件,對全球100多個主流開源大模型,包括Qwen2、Llama-3、Mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等嚴格的基準測試集上進行全面而深入的評估。

這次重新評估的初衷在於,許多開發者過於追求排行榜的名次,導致在模型訓練過程中過度依賴評估集數據,並且過去的評估標準對於模型而言顯得過於簡單。因此,本次評估提高難度標準,以檢驗這些模型在更高挑戰下的真實性能。

令人矚目的是,阿裡巴巴開源的Qwen-2 72B模型在激烈競爭中脫穎而出,不僅超越科技巨頭Meta的Llama-3,還超越法國知名大模型平臺Mistralai的Mixtral,成為新的行業領軍者。這一成績充分展示中國在全球開源大模型領域的領導地位。

針對這一排名結果,Stability AI的研究總監、早年在19歲便獲得博士學位的Tanishq表示,他早前就預測中國在開源大模型領域具有強大的競爭力。除Qwen2,還有零一萬物、InternLM、Deepsseek等眾多優秀的中國開源模型,都在國際舞臺上嶄露頭角。

Tanishq進一步強調,任何關於中國在開源大模型領域落後的觀點都是站不住腳的。相反,中國在這一領域正逐漸展現出領導者的姿態,引領著全球開源模型的發展潮流。


相關推薦

2024-04-19

大模型力度最大的一傢,但還遠沒有達到一傢獨大或者“遙遙領先”的地步。比如月之暗面Kimi等新手的突襲,總能給先入局者一個“大驚喜”。李彥宏還在“著急”事實上,李彥宏潑出這兩盆冷水,是他內心“著急”的外露。

2024-09-18

B更是在發佈後短短兩個小時,就沖上Huggingface開源大模型排行榜之首,隨後又衛冕全球最權威的開源模型測試榜單之首。而阿裡最新季度業績披露,通義千問開源模型下載量已突破2000萬。通義大模型的開源之舉,打破海外閉源

2024-07-07

源模型相當於一種智商稅”。他堅持認為閉源模型將保持領先,並強調即使是規模較小的閉源模型,其效果也優於同等規模的開源模型。李彥宏認為,閉源模型能夠根據客戶需求提供多樣化的解決方案,更好地平衡效果、速度和

2024-04-18

Belle-Eval測試集上錄得高分。Ruozhiba來源的數據集訓練效果遙遙領先於其他數據源。圖片截自論文要指出的是,除“弱智吧”之外,知乎、小紅書、豆瓣、百科等來源的數據,研究團隊並沒有借助GPT-4去生成回答,而是采用嚴格的

2023-12-23

型最優成績,並力壓Llama2登頂海外最具權威性的HuggingFace排行榜。此後又登上國內上海人工智能實驗室OpenCompass榜首,成為業界公認的性能最強開源大模型。目前,通義千問APP可在蘋果和安卓各大應用商店中下載體驗,提供文本

2023-05-15

銷車型特斯拉Model Y/3銷量分別達到279700輛和132470輛,分列排行榜第一和第三。其中,Model Y的銷量幾乎達到排名第二的比亞迪宋傢族的兩倍。並且該車在3月份創下145306輛的新銷量紀錄,擊敗豐田卡羅拉和RAV4等車型,成為當月全球

2023-03-01

根據AccessNow的最新報告,各國政府主動關閉互聯網的情況正在增加。報告顯示,在2022年,35個國傢有187次互聯網關閉。這些關閉不是因為有人砍斷互聯網電纜,而是因為政府和其他行為者決定限制訪問。在互聯網關閉次數最多的

2023-02-08

對話。在Al、大模型等ChatGPT所需底層技術上,達摩院具備領先的技術能力,此前曾先後推出全球首個10萬億參數規模M6大模型、AI模型開源社區“魔搭”等,相關研究成果一直處於國際領先。除阿裡之外,百度也透露旗下對標ChatGP

2023-11-17

中獲得總分157分,不僅超越前代,還成為DXOMARK全球影像排行榜新榜首。從排名來看,華為Mate60Pro+領先自傢P60Pro1分、領先iPhone15ProMax3分,在DXO影像榜中遙遙領先。DXO表示,華為Mate 60 Pro+相較前代在影像表現方面更進一步,在曝光

2024-03-28

程和數學技能等關鍵領域的基準測試中,其性能超過其他領先的開源人工智能模型,包括Meta的Llama2-70B和法國初創企業MixtralAI的模型。雖然DBRX在某些原始功能上還無法與OpenAI的GPT-4相比,但Databricks高管表示,DBRX無疑是一個功能

2024-04-01

代勝者的關鍵作用。然而,想要全面評估這一領域的早期領先優勢,還需要考慮到另一個重要因素。中國正在努力自主研發芯片或向英偉達增加采購量,但在其眾多科技巨頭和初創企業中,還沒有出現能與OpenAI相匹敵的主流人工

2023-11-10

2023年世界互聯網大會烏鎮峰會互聯網企業傢論壇”上,阿裡巴巴集團CEO吳泳銘發表講話。吳泳銘表示,阿裡巴巴即將開源720億參數大模型,這將是國內參數規模最大的開源大模型。這已經不是阿裡首次開源大模型,在今年8月份

2023-02-09

對話。在Al、大模型等ChatGPT所需底層技術上,達摩院具備領先的技術能力,此前曾先後推出全球首個10萬億參數規模M6大模型、AI模型開源社區魔搭”等,相關研究成果一直處於國際領先。除阿裡之外,百度也透露旗下對標ChatGPT

2024-04-03

華為已於1月20日撤回“遙遙領先”商標申請,當前為無效狀態,申請人為華為技術有限公司。華為技術有限公司於2023年9月申請註冊兩個“遙遙領先”商標,國際分類分別為科學儀器、運輸工具,但在2024年1月10日,華為提出撤回