一年狂攬73億美元投資 Anthropic點燃矽谷大模型“戰火”

2024-03-06 來自第一財經發表於業界精選

ora給科技圈帶來的沖擊還未平靜，Claude3又來。3月4日晚，被稱之為是OpenAI最強競爭對手的Anthropic發佈其最新大模型系列Claude3。該系列包含三個模型，能力由強至弱分別是Claude3Opus（著作）、Claude3Sonnet（十四行詩）和Claude3Haiku（俳句）。

Anthropic發佈的跑分顯示，Opus在多項基準測試中得分都超過GPT-4 和Gemini 1.0 Ultra，擁有接近人類本科生水平的知識，“在數學、編程、多語言理解、視覺等多個維度樹立新的行業基準”。

自去年3月GPT-4發佈後，其一直是行業的最高標準以及追趕目標，此次Claude 3的出現，意味著其Top 1地位可能不保，不少人發出“GPT-4時代已過”的感嘆。

不過，天使投資人、資深人工智能專傢郭濤對第一財經表示，這可能是一種過於過激的說法，GPT-4在許多應用中可能會比 Claude 3 更適合。開源大模型生態社區OpenCSG的創始人陳冉也並不認可“時代已過”，他表示，這是一個層級和另外一個層級比，畢竟GPT-4已經出來很長一段時間。

Claude 3之後，大傢自然地將目光投向OpenAI，GPT-5或許已經不遠，這是“暴風雨前的寧靜”。

全面超越GPT-4?

據Anthropic官方發佈的跑分結果，Claude 3 Opus在本科級別專業知識（MMLU）、研究生級別專傢推理（GPQA）、基礎數學（GSM8K）等領域都超過GPT-4在內的領先模型。

事實真的如此嗎？在Claude 3發佈後，陳冉進行試用和測評，在用他自己的一套方法測試Opus的邏輯推理、代碼等能力後，他認為，Claude 3的整體性能相比GPT-4平均提升50%以上，包括“幻覺”、正確率和非正確率方面的表現等。

從大模型胡亂回答問題的“幻覺”這一項來看，Claude3相比GPT-4要好很多，另外，在 GPT-4中，有些問題不會被回答，但在Claude 3中其回答的正確率提高。在代碼能力和推理上，陳冉測試貪吃蛇遊戲、撲克遊戲等，他對第一財經表示，在這些方面GPT-4都失敗，但Claude 3 Opus做到。

在陳冉看來，此次Anthropic的發佈策略很好，一次性推出三個不同性能的大模型，最出色的大模型打分都比GPT-4高，較小的模型打分也不低，而在成本上相對輕量的兩個模型會比GPT-4便宜。

Anthropic此次發佈的Opus、Sonnet和Haiku分別針對不同的性能需求和成本效益。據官方介紹，Opus是最智能的模型，可以處理復雜的分析、具有多個步驟的較長任務以及高階數學和編碼任務；Sonnet是性能和速度的最佳組合，可實現高效、大體量的任務；Haiku是最快且最具成本效益的模型，可以執行輕量級操作，具有行業領先的速度。

在成本上，能力最好的Claude 3 Opus比 GPT-4 Turbo 還要貴得多：GPT-4 Turbo 每百萬token的輸入/輸出費用為 10/30 美元，而 Claude 3 Opus為 15/75 美元。不過，也有更具性價比的選擇，Claude 3系列中，Sonnet的輸入/輸出定價是3 美元/15 美元，Haiku是0.25 美元/1.25 美元。

值得一提的是，此次發佈的Claude 3系列模型都支持 200k的上下文窗口， Anthropic還特別表示，在這個基礎上，所有三個模型都能夠接受超過 100 萬tokens的輸入，會提供給有特定需要的客戶。

作為對比，2023年更新的GPT-4窗口文本容量限制是32k，而2023年11月更新的GPT-4 turbo版能夠接收128k的輸入，相當於10萬字的小說長度。

對大模型來說，上下文窗口的文本長度越大，意味著其能更好地理解長篇文章或對話。此前，上海人工智能實驗室領軍科學傢林達華對第一財經介紹，有長語境交互，大模型能夠讀幾百頁的財報，將裡面一些非常細致的信息精準提取出來形成摘要，或者聽一場幾個小時的會議轉錄，並將會議的關鍵信息摘取出來，對於大模型的落地很有用。

基於Claude 3在多項能力上超越GPT-4，行業這兩天也出現“GPT4時代已過”的聲音，不過，郭濤認為，Claude 3 在某些基準測試中超過 GPT-4，並不意味著 GPT-4 的時代已經過去，一方面基準測試並不能全面反映一個模型的全部能力，例如創造性寫作、情感理解或特定領域知識方面的表現；另一方面，GPT-4在許多應用中可能會比 Claude 3 更適合，“而OpenAI也在不斷研發新的技術和模型，很難說 GPT-4 的時代已經過去。”

能與OpenAI一較高下嗎

對於Claude3這次的超越，在驚嘆其表現之餘，業界沒有太多的意外，Anthropic過去一直被視為OpenAI最大的競爭對手之一。

Anthropic的核心團隊來自OpenAI，其創始人達裡奧·阿莫迪（Dario Amodei）曾是OpenAI的研究副總裁，也是一位與高效利他主義社區有聯系的研究員，因對OpenAI的未來方向有一些分歧而離開，並在2021年成立Anthropic，計劃以可信、安全可控的方式發展AI。

Anthropic是目前除OpenAI外最被看好的大模型初創公司之一。在過去一年，Anthropic狂攬約73億美元的投資，其中，亞馬遜、Google作為最主要的投資者，分別投資40億美元和20億美元，韓國電信巨頭SK下註約1億美元。就在過去一個月，Anthropic再次獲得7.5億美元的投資，來自矽谷風投機構Menlo Ventures。

在未來與OpenAI的競爭中，陳冉認為Anthropic的勝面不小，一方面，其團隊在算法上與OpenAI幾乎沒有差距，且Anthropic背後有亞馬遜、Google這樣的靠山，算力方面也並不缺，其次，作為背後投資者亞馬遜擁有許多生態和場景，相應也能提供很多高質量的數據。陳冉認為，現在大模型競爭最關鍵的是數據，數據的質量越高越能訓練好模型。

“最終Claude有可能會贏。因為特色是合規和安全。”在Claude3發佈後次日，陳冉在朋友圈表示。相比GPT-4等模型，Claude對安全的強調尤為明顯。

在技術文檔中，Anthropic表示，Claude在訓練過程中重點是有幫助、無害和誠實，Anthropic通過給模型一個想法來做到這一點，即一套倫理和行為原則，模型使用這些原則來指導其輸出，以避免性別歧視、種族主義和有害的產出，以及避免幫助人類從事非法或不道德的活動。此外，Anthropic還會有安全評估，信任和安全團隊會監控違反原則的有害、惡意用例的提示和輸出。

對於Anthropic未來是否能和 OpenAI 一較高下，郭濤認為這主要取決於幾方面的因素。一方面，持續的研發和創新是保持競爭力的關鍵。如果 Anthropic 能夠持續推出先進的技術和改進，它有可能在市場上與 OpenAI 競爭。另一方面，AI 大模型的成功不僅取決於核心技術，還取決於能夠建立廣泛的生態系統和合作夥伴關系，他認為，OpenAI 在這方面有著較強的影響力和網絡效應。此外，如何在商業模式和市場策略上進行創新和調整，也是決定未來競爭格局的重要因素。

“大傢有共識目前Claude 3已經在部分能力上超越GPT-4，但具體未來能不能比GPT系列好，拭目以待。”陳冉說。

Claude 3出現，GPT-5還會遠嗎？在Claude 3發佈後不久，英偉達高級科學傢Jim Fan就在X上發文調侃，“正在等待幾個小時後精心安排的GPT-5的發佈”。

Jim Fan隨後表示，“我喜歡Claude在GPT和Gemini主導的競技場上掀起熱度。但請記住，GPT-4V這個每個人都迫切想要超越的高水位線，是在2022年完成訓練的。這是暴風雨前的寧靜。”

一年狂攬73億美元投資 Anthropic點燃矽谷大模型“戰火”

相關推薦

亞馬遜向人工智能初創公司Anthropic追加投資27.5億美元

OpenAI強敵出手：Inflection-2.5 訓練計算量僅40%、性能直逼GPT-4

傳谷歌同意向OpenAI競爭對手Anthropic至多投資20億美元

OpenAI“黑幫”，中國能復制嗎？

人工智能初創公司Anthropic推出聊天機器人Claude 3新模型

不要神化ChatGPT

制衡OpenAI，Claude 3給AI創企吃顆定心丸

SK電訊將向美國人工智能企業Anthropic追加投資1億美元

知情人士：AI初創公司Anthropic洽談融資7.5億美元估值184億美元

“逃離”OpenAI 36人出走，已拿600億融資

法官批準 FTX 出售 Anthropic 股份的提議

一年前ChatGPT低調發佈的時候命運的齒輪轉動

AI人才爭奪戰華爾街入局豪擲百萬美元年薪搶人

近300億，又一傢超級獨角獸誕生