北京時間周一深夜,創業未滿一年已成歐洲人工智能龍頭的MistralAI連發數條消息——發佈最新大模型MistralLarge、推出首個聊天機器人產品LeChat,以及與微軟達成更加深入的合作協議。
Mistral AI正式成立於2023年5月。在去年這個時候,創辦這傢公司的三個法國年輕人還分別在谷歌DeepMind、Facebook上班。
到去年12月,隨著英偉達、賽富時以及一眾華爾街資本揮舞支票,趕忙參與公司價值超4.5億歐元(接近4.9億美元)的融資,Mistral AI的市值已然超過20億美元。
(Mistral AI的三位創始人Guillaume Lample, Arthur Mensch, Timothée Lacroix都隻有30多歲)
發佈最新大模型&首個聊天機器人
Mistral AI周一宣佈,正式推出最新旗艦模型Mistral Large。公司聲稱該模型具有“頂級的推理能力”,能用於處理復雜的多語言推理任務,包括文本理解、轉換和代碼生成。
在AI理解能力測試基準MMLU的對比中,Mistral Large的得分僅次於GPT-4,略好於Anthropic開發的Claude 2。至於谷歌的Gemini Pro以及Meta的LLaMA 2 70B模型,則被甩開一個身位。
(來源:Mistral AI)
據悉,這個模型擁有3.2萬tokens的上下文窗口。按照一個token約等於0.75個英文單詞的慣用算法,Mistral Large能夠一次性從接近2.4萬個英文單詞的文檔中精確提取信息。
公司介紹稱,該模型對英語、法語、西班牙語、德語和意大利語具有母語級流利程度,並對語法和文化背景有細致的理解。不過與一眾大模型一樣,實測下來中文也是能用的(後面有測試案例)。
當然,最重要的是Mistral AI的開源屬性——除使用雲服務部署外,還能直接下載部署到本地。與封閉AI模型的龍頭OpenAI不同,Mistral AI的大模型可以在“抱抱臉”等代碼平臺上下載,不過目前還沒看到Large模型的文檔。
(來源:公司官網)
公司也在周一發佈首個聊天機器人LE CHAT,可以選用剛剛發佈的Large模型,以及對延遲、成本進行優化的Mistral Small,還有一個名為Next的下一代原型模型。總而言之,提供一個試用的窗口。
從短暫的上手實測來看,這個模型哪怕使用中文,回答簡單的推理題完全沒有問題。
(來源:LE CHAT)
對於美國歷史和法國歷史,這個模型也能答得上來。
不過在追加測試中,這個模型對中國文化歷史的解可以說是....慘不忍睹,不過Mistral本身也沒說這個模型懂中國歷史。這也是國外開源AI模型存在的通病。
(來源:LE CHAT、文心一言)
微軟收購公司部分股權
同樣在周一,Mistral AI與微軟宣佈達成一項新的合作夥伴關系。從公告上來看,雙方的合作主要包含三個方面:1、微軟向Mistral AI提供開發和運營模型所需的算力;2、Mistral AI的大模型上架微軟雲服務,供全球用戶部署;3、雙方將探索合作,為特定客戶制作特定模型。
除提供算力和雲服務客戶外,這份合作協議也使得微軟持有Mistral AI“一小部分股權”。
值得一提的是,Mistral這個法文單詞的原意指的是“法國吹來的強風”,公司創立的願景是搞AI其實不需要那麼多錢,許多公司白白浪費非常多的資金。創始人兼首席執行官Arthur Mensch直言,公司要做AI世界裡資本效率最高的。
Mensch透露,周一發佈的Large模型,整個開發成本低於2000萬歐元。作為對比,奧爾特曼去年提到過GPT-4的開發成本可能要超過1億美元。
對於微軟而言,不管是代表封閉生態的OpenAI,還是開源社區的Mistral或Meta跑贏,公司都將是AI賽道的大贏傢。這三傢的AI模型都已經上架Azure的雲服務,現在美股“股王”還持有前兩傢公司的股權。