微軟入股、數值碾壓Meta AI新貴Mistral發佈旗艦大模型


北京時間周一深夜,創業未滿一年已成歐洲人工智能龍頭的MistralAI連發數條消息——發佈最新大模型MistralLarge、推出首個聊天機器人產品LeChat,以及與微軟達成更加深入的合作協議。

Mistral AI正式成立於2023年5月。在去年這個時候,創辦這傢公司的三個法國年輕人還分別在谷歌DeepMind、Facebook上班。

到去年12月,隨著英偉達、賽富時以及一眾華爾街資本揮舞支票,趕忙參與公司價值超4.5億歐元(接近4.9億美元)的融資,Mistral AI的市值已然超過20億美元


(Mistral AI的三位創始人Guillaume Lample, Arthur Mensch, Timothée Lacroix都隻有30多歲)

發佈最新大模型&首個聊天機器人

Mistral AI周一宣佈,正式推出最新旗艦模型Mistral Large。公司聲稱該模型具有“頂級的推理能力”,能用於處理復雜的多語言推理任務,包括文本理解、轉換和代碼生成。

在AI理解能力測試基準MMLU的對比中,Mistral Large的得分僅次於GPT-4,略好於Anthropic開發的Claude 2。至於谷歌的Gemini Pro以及Meta的LLaMA 2 70B模型,則被甩開一個身位。

(來源:Mistral AI)
(來源:Mistral AI)

據悉,這個模型擁有3.2萬tokens的上下文窗口。按照一個token約等於0.75個英文單詞的慣用算法,Mistral Large能夠一次性從接近2.4萬個英文單詞的文檔中精確提取信息。

公司介紹稱,該模型對英語、法語、西班牙語、德語和意大利語具有母語級流利程度,並對語法和文化背景有細致的理解。不過與一眾大模型一樣,實測下來中文也是能用的(後面有測試案例)。

當然,最重要的是Mistral AI的開源屬性——除使用雲服務部署外,還能直接下載部署到本地。與封閉AI模型的龍頭OpenAI不同,Mistral AI的大模型可以在“抱抱臉”等代碼平臺上下載,不過目前還沒看到Large模型的文檔。

(來源:公司官網)
(來源:公司官網)

公司也在周一發佈首個聊天機器人LE CHAT,可以選用剛剛發佈的Large模型,以及對延遲、成本進行優化的Mistral Small,還有一個名為Next的下一代原型模型。總而言之,提供一個試用的窗口。

從短暫的上手實測來看,這個模型哪怕使用中文,回答簡單的推理題完全沒有問題。

(來源:LE CHAT)
(來源:LE CHAT)

對於美國歷史和法國歷史,這個模型也能答得上來。


不過在追加測試中,這個模型對中國文化歷史的解可以說是....慘不忍睹,不過Mistral本身也沒說這個模型懂中國歷史。這也是國外開源AI模型存在的通病。


(來源:LE CHAT、文心一言)
(來源:LE CHAT、文心一言)

微軟收購公司部分股權

同樣在周一,Mistral AI與微軟宣佈達成一項新的合作夥伴關系。從公告上來看,雙方的合作主要包含三個方面:1、微軟向Mistral AI提供開發和運營模型所需的算力;2、Mistral AI的大模型上架微軟雲服務,供全球用戶部署;3、雙方將探索合作,為特定客戶制作特定模型。


除提供算力和雲服務客戶外,這份合作協議也使得微軟持有Mistral AI“一小部分股權”

值得一提的是,Mistral這個法文單詞的原意指的是“法國吹來的強風”,公司創立的願景是搞AI其實不需要那麼多錢,許多公司白白浪費非常多的資金。創始人兼首席執行官Arthur Mensch直言,公司要做AI世界裡資本效率最高的。

Mensch透露,周一發佈的Large模型,整個開發成本低於2000萬歐元。作為對比,奧爾特曼去年提到過GPT-4的開發成本可能要超過1億美元。

對於微軟而言,不管是代表封閉生態的OpenAI,還是開源社區的Mistral或Meta跑贏,公司都將是AI賽道的大贏傢。這三傢的AI模型都已經上架Azure的雲服務,現在美股“股王”還持有前兩傢公司的股權。


相關推薦

2024-02-28

東微軟(MSFT.US)宣佈投資來自歐洲的人工智能初創公司MistralAI僅一天不到的時間,但歐盟的反壟斷監管機構已經計劃對這一合作進行全面審查和分析。周一,這傢總部位於巴黎的AI初創公司表示,將其研發的名為“MistralLarge”的

2024-02-22

18個基準測評中平均成績擊敗目前的主流開源模型Llama 2和Mistral,特別是在數學、代碼能力上表現突出,還直接登頂Hugging Face開源大模型排行榜。Gemma登頂Hugging Face開源大模型排行榜(圖源:X)Google同步放出技術報告,通過深度

2024-03-09

開源是大勢所趨,我認為Meta正在引領這一趨勢,其次是Mistral AI、HuggingFace等規模較小的公司。” Julian Togelius告訴《每日經濟新聞》記者。盡管Mistral AI最初推出開源模型,隨著規模的擴大,其作風似乎越來越像OpenAI靠近,采取閉

2024-03-25

剛剛,MistralAI的模型又更新。這次開源一如既往的“突然”,是在一個叫做CerebralValley的黑客松活動上公佈的。PPT一翻頁,全場都舉起手機拍照:這次開源的 Mistral 7B v0.2 Base Model ,是 Mistral-7B-Instruct-v0.2 背後的原始預訓練模型,

2024-05-09

知情人士今日稱,法國AI初創企業MistralAI即將達成一筆約6億美元的融資協議,使其估值增加近兩倍,達到60億美元。另外,MistralAI當前的投資者,包括GeneralCatalyst和LightfastVenturePartners等,可能成為新一輪融資的主要投資者。今年2

2024-04-19

MMLU、GPQA、HumanEval 等測試的得分遠超 Google Gemma 7B 以及 Mistral 7B Instruct。用紮克伯格的話來說,最小的 Llama 3 基本上與最大的 Llama 2 一樣強大。Llama 3 70B 則躋身於頂尖 AI 模型的行列,整體表現全面碾壓 Claude 3 大杯,與 Gemini 1.5 Pr

2024-03-05

微軟與法國人工智能公司Mistral簽訂的多年協議表明,該公司希望在這一領域長期發展。該公司向Mistral投資20億歐元(21億美元),並宣佈將把Mistral最新的人工智能模型MistralLarge引入Azure。但對主要開發開源人工智能模型的Mistral

2024-02-27

微軟宣佈與法國人工智能初創公司Mistral建立新的多年合作關系。據《金融時報》報道,微軟將在這傢成立10個月的人工智能公司中持有少量股份,而這距離微軟向其OpenAI合作夥伴關系投資100多億美元僅一年多一點時間,該公司估

2024-04-19

在至少九項基準測試中,Llama 3 8B 優於其他開源模型,如 Mistral 的Mistral 7B和 Google 的Gemma 7B,這兩個模型都包含 70 億個參數:這些基準包括:MMLU、ARC、DROP、GPQA(一組生物、物理和化學相關問題)、HumanEval(代碼生成測試)、GSM-

2024-02-27

成立僅9個月,法國MistralAI拿出僅次於GPT-4的大模型。在所有已能通過API訪問的大模型中排第二,全班唯二在MMLU考試中拿80分以上的。一舉獲得微軟青睞,簽署多年合作協議。也就是說,微軟不再獨寵OpenAI。同時推出在線聊天機器

2024-02-27

T-4,用Gemma腳踢Llama 2!網友們也是看熱鬧不嫌事大,召喚Mistral AI和OpenAI今晚趕快來點大動作,別讓谷歌真的搶頭條。(手動狗頭)可以看到,Gemma-7B模型在涵蓋一般語言理解、推理、數學和編碼的8項基準測試中,性能已經超越Ll

2024-03-05

IBM宣佈在其watsonx人工智能和數據平臺上提供由MistralAI開發的流行開源Mixtral-8x7B大型語言模型(LLM),以繼續擴展功能,幫助客戶利用IBM自身的基礎模型和一系列開源提供商的模型。IBM提供Mixtral-8x7B的優化版本,在內部測試中,與普

2024-03-18

那些有潛力追趕上它的競爭對手,比如Google和Anthropic。而Mistral作為一股新興力量,估計也正在被列入其中。如果非要排列一個打壓鏈條,那可以歸結為:OpenAI→Google &Anthropic &Mistral→ Meta→其它大模型公司。可以說,無論

2023-10-26

微軟作為傳統科技巨頭,通過僅130億美元的投資,與最具潛力、實力最強的AI初創公司技術和所有權的雙重深度綁定,五年時間將最先進的AI技術融入幾乎所有產品中,不費吹灰之力走在時代的最前端並取得統治地位,足以被載