微軟入股、數值碾壓Meta AI新貴Mistral發佈旗艦大模型

2024-02-27 來自財聯社發表於業界精選

北京時間周一深夜，創業未滿一年已成歐洲人工智能龍頭的MistralAI連發數條消息——發佈最新大模型MistralLarge、推出首個聊天機器人產品LeChat，以及與微軟達成更加深入的合作協議。

Mistral AI正式成立於2023年5月。在去年這個時候，創辦這傢公司的三個法國年輕人還分別在谷歌DeepMind、Facebook上班。

到去年12月，隨著英偉達、賽富時以及一眾華爾街資本揮舞支票，趕忙參與公司價值超4.5億歐元（接近4.9億美元）的融資，Mistral AI的市值已然超過20億美元。

（Mistral AI的三位創始人Guillaume Lample， Arthur Mensch， Timothée Lacroix都隻有30多歲）

發佈最新大模型&首個聊天機器人

Mistral AI周一宣佈，正式推出最新旗艦模型Mistral Large。公司聲稱該模型具有“頂級的推理能力”，能用於處理復雜的多語言推理任務，包括文本理解、轉換和代碼生成。

在AI理解能力測試基準MMLU的對比中，Mistral Large的得分僅次於GPT-4，略好於Anthropic開發的Claude 2。至於谷歌的Gemini Pro以及Meta的LLaMA 2 70B模型，則被甩開一個身位。

（來源：Mistral AI）

據悉，這個模型擁有3.2萬tokens的上下文窗口。按照一個token約等於0.75個英文單詞的慣用算法，Mistral Large能夠一次性從接近2.4萬個英文單詞的文檔中精確提取信息。

公司介紹稱，該模型對英語、法語、西班牙語、德語和意大利語具有母語級流利程度，並對語法和文化背景有細致的理解。不過與一眾大模型一樣，實測下來中文也是能用的（後面有測試案例）。

當然，最重要的是Mistral AI的開源屬性——除使用雲服務部署外，還能直接下載部署到本地。與封閉AI模型的龍頭OpenAI不同，Mistral AI的大模型可以在“抱抱臉”等代碼平臺上下載，不過目前還沒看到Large模型的文檔。

（來源：公司官網）

公司也在周一發佈首個聊天機器人LE CHAT，可以選用剛剛發佈的Large模型，以及對延遲、成本進行優化的Mistral Small，還有一個名為Next的下一代原型模型。總而言之，提供一個試用的窗口。

從短暫的上手實測來看，這個模型哪怕使用中文，回答簡單的推理題完全沒有問題。

（來源：LE CHAT）

對於美國歷史和法國歷史，這個模型也能答得上來。

不過在追加測試中，這個模型對中國文化歷史的解可以說是．．．．慘不忍睹，不過Mistral本身也沒說這個模型懂中國歷史。這也是國外開源AI模型存在的通病。

（來源：LE CHAT、文心一言）

微軟收購公司部分股權

同樣在周一，Mistral AI與微軟宣佈達成一項新的合作夥伴關系。從公告上來看，雙方的合作主要包含三個方面：1、微軟向Mistral AI提供開發和運營模型所需的算力；2、Mistral AI的大模型上架微軟雲服務，供全球用戶部署；3、雙方將探索合作，為特定客戶制作特定模型。

除提供算力和雲服務客戶外，這份合作協議也使得微軟持有Mistral AI“一小部分股權”。

值得一提的是，Mistral這個法文單詞的原意指的是“法國吹來的強風”，公司創立的願景是搞AI其實不需要那麼多錢，許多公司白白浪費非常多的資金。創始人兼首席執行官Arthur Mensch直言，公司要做AI世界裡資本效率最高的。

Mensch透露，周一發佈的Large模型，整個開發成本低於2000萬歐元。作為對比，奧爾特曼去年提到過GPT-4的開發成本可能要超過1億美元。

對於微軟而言，不管是代表封閉生態的OpenAI，還是開源社區的Mistral或Meta跑贏，公司都將是AI賽道的大贏傢。這三傢的AI模型都已經上架Azure的雲服務，現在美股“股王”還持有前兩傢公司的股權。

相關推薦