OpenAI強敵出手:Inflection-2.5 訓練計算量僅40%、性能直逼GPT-4


又一傢生成式AI獨角獸推出性能匹敵GPT-4的大模型,而且訓練計算量隻用GPT-4的40%!這是美國AI獨角獸企業InflectionAI最新發佈的Inflection-2.5大語言模型,兼具高智商與高情商,支持聯網查詢內容,登錄Pi聊天機器人的網頁、iOS、Android和桌面端app均可免費體驗。



讓Pi聊天機器人比較Inflection-2.5與GPT-4

試用直通車:https://pi.ai/talk

一個月之內,GPT-4連迎三個強勁的新競爭對手:Gemini 1.5 Pro、Claude 3 Opus,以及最新登場的Infection-2.5。這意味著GPT-4獨霸時代已經過去,大模型王者之戰還有很多可能。

在這場激烈的戰事中,Inflection AI既年輕又鋒芒畢露,成立剛滿兩年,由前DeepMind首席科學傢Karén Simonyan、LinkedIn聯合創始人Reid Hoffman、DeepMind聯合創始人Mustafa Suleyman共同創辦,2023年6月獲得英偉達、微軟等參投的13億美元融資,估值達40億美元(折合約287億人民幣),是當前全球第四大生成式AI獨角獸

它是OpenAI的大語言模型勁敵之一,以“為每個人創造一個個性化的AI”為使命,2023年5月推出一款具有同理心、樂於助人和安全的個性化AI聊天助手Pi,11月推出基礎模型Inflection-2。與此同時,Inflection AI正在構建由22000萬塊H100 GPU組成的世界最大AI計算集群

現在,Inflection AI進一步給Pi加料——新升級的Inflection-2.5有“世界級的智商”、“獨特的善良”、“好奇的個性”,並具備4個主要亮點:

1、在關鍵基準測試中與GPT-4並駕齊驅,並且使用40%的計算量來訓練,與其他頂級基礎模型相比訓練效率優勢顯著。

2、在編程、數學等STEM(科學、技術、工程、數學)領域進步顯著。

3、“世界級”實時網絡搜索功能:確保用戶能獲得高質量、最新的新聞和信息,增強用戶體驗和交互的即時性。

4、廣泛可用性+顯著滿意度:對所有Pi用戶開放,支持多平臺訪問,對用戶情緒、參與度和留存率產生顯著影響,加速有機用戶增長。

繼Anthropic後,又一傢初創公司推出性能強大、能與GPT-4一較高下的大語言模型,並在優化模型訓練方法上大秀肌肉。 這展現創業團隊在大模型競賽中的潛力和沖勁,隨著大模型性能不斷升級,如何用更少計算資源訓出更強模型,將是接下來產學界都重點探索的方向。

01.

用40%的計算量,

訓練出接近GPT-4的性能

Inflection-1用GPT-4訓練FLOPs的約4%,在不同的智商導向任務中,平均性能達到GPT-4水平的大約72%。Inflection-2.5用GPT-4訓練FLOPs的40%,在不同的智商導向任務中,平均性能達到GPT-4的94%以上。


Inflection-2.5在MMLU基準測試上的成績相較Inflection-1進步明顯,略低於GPT-4。


MMLU基準測試衡量從高中到專業難度的各種任務的性能。Inflection AI還根據GPQA鉆石基準進行評估,這是一個極難的專傢級基準。

其測試還包括兩種不同的STEM(科學、技術、工程、數學)考試的結果:匈牙利數學考試和物理GRE(物理研究生入學考試)的表現。


在BIG-Bench-Hard(大語言模型難以解決的BIG-Bench問題的子集)上,Inflection-2.5性能比Inflection-1提高10%以上,接近GPT-4。


在MT-Bench上評估模型後,Inflection AI意識到,在推理、數學、編程類別中,有很大一部分(接近25%)的示例具有不正確的參考解決方案或具有錯誤前提的問題。因此Inflection AI更正這些示例,並發佈該版本的數據集。


在評估這兩個子集時,Inflection AI發現在正確修正的版本中,其模型更符合他們基於其他基準的期望。


與Inflection-1相比,Inflection-2.5在數學和編程性能方面有顯著進步。下表是在MBPP+和HumanEval+兩個編程基準上的評測結果對比。


在HellaSwag和ARC-C常識和科學基準測試上進行評估,Inflection-2.5同樣表現強勁。


02.

特別致謝微軟Azure和CoreWeave,

正構建世界最大AI集群

上面所有的評估都是用現在為Pi提供動力的模型Inflection-2.5完成的,但是Inflection AI註意到,受web檢索的影響(沒有使用web檢索的基準測試),少量提示詞的結構以及其他生產端差異,用戶體驗可能會略有不同。

這傢獨角獸企業還專門致謝為其提供算力資源的合作夥伴AzureCoreWeave

Azure是微軟雲計算服務,CoreWeave則是去年憑借英偉達的支持坐擁數萬塊芯片狂攬算力大單的GPU雲服務黑馬。

2023年初,CoreWeave找到Inflection並為其提供幾千張H100 GPU。英偉達看中這個組合的巨大潛力,先後向兩傢公司投資數億美元,抬高Coreweave的H100供貨優先級。

2023年6月,Inflection AI宣佈與將與合作夥伴CoreWeave、英偉達一起,構建世界上最大的AI集群,包含22000個H100 GPU


CoreWeave-Infection AI超算的信息推測(圖源:The Next Platform)

就在宣佈最大AI集群的一個月前,Inflection AI推出Pi聊天機器人,向OpenAI正式下戰書。

不同於ChatGPT等產品的“生產力工具”定位,Pi想做“個人AI”,成為用戶24小時在線的數字朋友,更註重為用戶帶來友好、豐富的社交互動體驗。Pi能記住與跨平臺登錄用戶的100次對話,支持網頁、APP、短信、社交平臺等設備交互。

相比其他AI聊天機器人,Pi可能在文本生成、代碼生成等能力上不算出眾,但在安全、同理心等特性上獨樹一幟。

這也是為什麼這傢創企剛創辦就從微軟等公司處籌集2.25億美元,一年後又拿到微軟、英偉達、微軟聯合創始人比爾·蓋茨、Alphabet前CEO Eric Schmidt等的13億美元融資,飛速成為全球最大的生成式AI獨角獸之一。

截至2023年年底,Inflection AI估值約為40億美元,是全球第四大生成式AI獨角獸,僅次於OpenAI、Anthropic、Character.AI。

03.

聯創團隊有錢有技術:

曾創辦DeepMind,曾投資OpenAI

2022年3月成立的年輕AI團隊,能贏得微軟和英偉達兩大巨頭的青睞,與其創始團隊密不可分。

Inflection AI聯合創始人Reid Hoffman被稱作“矽谷人脈王”,是矽谷最有名的天使投資人之一,他是全球最大專業社交網站LinkedIn的聯合創始人,以及風險投資機構Greylock Partners的合夥人,曾是OpenAI的創始投資者。

截至2023年5月,Reid Hoffman和Greylock Partners已投資至少37傢AI公司。


左為Mustafa Suleyman,右為Reid Hoffman(圖源:福佈斯、Business Insider)

另一位聯合創始人Mustafa Suleyman,2009年與幾位合夥人共同創立DeepMind,並將研究重點放到AI在醫療健康和氣候變化中的應用,但連年虧損壓得Suleyman喘不過氣。2014年,Google拋出橄欖枝,6億美元將DeepMind收入麾下。

背靠金主的DeepMind終於可以沒有資金之憂地繼續從事前沿研究,然而5年後,Suleyman卻選擇離開DeepMind,加入Google並擔任AI產品管理和AI政策副總裁。背後原因,據說是由於一些同事曾抱怨他在工作上騷擾和欺凌同事。

Suleyman也曾坦言,作為DeepMind聯合創始人,他對員工的要求過於苛刻,有時他的管理風格並不具有建設性。2022年,他離開Google,創辦Inflection AI並擔任CEO,“希望與有遠見和無所畏懼的創始人在一起”。

第三位聯合創始人是前DeepMind首席科學傢Karén Simonyan,現任Inflection AI首席科學傢。他是同代中成就突出的深度學習研究者之一,其出版物(包括5篇在學術頂級期刊Nature和Science上的論文)吸引超過18萬次引用。


Karén Simonyan部分高引用量學術成果

Karén Simonyan在牛津大學完成博士學位和博士後學位,期間設計VGGNet圖像處理框架並在贏得知名的ImageNet挑戰賽。隨後他創辦Vision Factory AI公司,將VGGNet商業化。這傢公司很快就被DeepMind收購,karsamyn的身份則變成DeepMind首席科學傢。

任職DeepMind首席科學傢期間,karsamyn建立並領導大規模深度學習團隊,開發基於真實世界數據的大型AI模型。他在AlphaZero、AlphaFold、WaveNet、BigGAN和Flamingo等AI突破中均發揮關鍵作用。

04.

結語:團隊不到50人,

Pi每日聊天消息數超40億

據外媒Axios援引Suleyman的話,當前Inflection AI團隊擁有70名員工。

據Inflection AI透露,其100萬日活躍用戶和600萬月活躍用戶與Pi聊天機器人往來超過40億條消息。與Pi的平均談話時間為33分鐘,每天有1/10的談話時間超過1小時。在任何一周與Pi交談的用戶中,約有60%的人會在接下來的一周返回,其月粘性高於主要競爭對手。


Inflection AI認為,新推出的Inflection-2.5保持Pi的獨特、平易近人的個性和出色的安全標準,同時成為一個更有用的模型。這個“智商”更加接近GPT-4的模型,將讓Pi在更具人性溫度的同時,成為能夠提供更好建議的個人AI朋友。


相關推薦

2024-03-08

一個不太為人所知、但同樣令人印象深刻的LLM叫做Inflection,它為Pi提供支持,Pi是一款面向個人涉及的人工智能應用程序,可在多種平臺上使用。在本周四發佈Inflection-2.5之前,InflectionAI的重點是讓它的LLM具有同理心,但新的更

2023-03-15

很多學者都提到多模態,我們並沒有等太久。今天凌晨,OpenAI發佈多模態預訓練大模型GPT-4。GPT-4 實現以下幾個方面的飛躍式提升:強大的識圖能力;文字輸入限制提升至 2.5 萬字;回答準確性顯著提高;能夠生成歌詞、創意文

2024-04-19

願景——致力於打造 AGI(通用人工智能)。與不 open 的 OpenAI 形成鮮明對比,Meta 則沿著 open 的開源路線朝 AGI 的聖杯發起沖鋒。正如紮克伯格所說,堅定開源的 Meta 在這條充滿挑戰的征途中也並非毫無收獲:我通常非常傾向於

2024-04-19

費的足夠好用,為什麼還要花錢呢?更重要的是,如果連OpenAI、Google和Anthropic神秘的工具箱都不再高不可攀,那做一個比不上開源最強水平的閉源模型的意義何在呢。最後還是不得不問一句:GPT-5,你到底在哪裡呢?

2024-03-19

ell GB200:單個機架的計算能力超過1 Exaflop。黃仁勛交付給OpenAI的第一臺DGX是0.17 Petaflops。GPT-4的1.8T參數可在2000個Blackwell上完成90天的訓練。還有網友感嘆:1000倍成就達成!Blackwell標志著在短短8年內,NVIDIA AI 芯片的計算能力實現

2023-02-11

先回答幾個最基礎的問題:ChatGPT和過去的AI有什麼不同?OpenAI是如何戰勝Google的?OpenAI的成功花多少錢?ChatGPT爆火之後,誰是最後贏傢?一、ChatGPT,生成式AI的王炸剛剛過去的2022年,從矽谷到國內的科技公司,上上下下都蔓延

2023-03-18

始於Google,發跡於OpenAI,這是很多GPT-4貢獻者的職業軌跡。這個星期,OpenAI大模型GPT-4的發佈讓全球科技圈的技術競爭進入白熱化。幾天之內,ChatGPT、必應搜索和Microsoft365相繼接入GPT-4,微軟的AI應用瞬間比競爭對手拉開一個身位

2023-02-27

代,“ChatGPT”之父SamAltman提出新版摩爾定律。SamAltman是OpenAI公司CEO,被稱為“ChatGPT”之父,他在社交媒體上發文提出新版摩爾定律要來,稱全球人工智能運算量每隔18個月翻一番。1965年,時任仙童半導體工程師、後來創立Intel

2023-02-27

代,ChatGPT”之父Sam Altman提出新版摩爾定律。Sam Altman 是OpenAI公司CEO,被稱為ChatGPT”之父,他在社交媒體上發文提出新版摩爾定律要來,稱全球人工智能運算量每隔18個月翻一番。1965年,時任仙童半導體工程師、後來創立Intel的

2023-03-16

3月14日,OpenAI推發佈GPT-4。向科技界再次扔下一枚“核彈”。根據OpenAI的演示,我們知道GPT-4擁有著比GPT-3.5更強大的力量:總結文章、寫代碼、報稅、寫詩等等。但如果我們深入OpenAI所發佈的技術報告,我們或許還能發現有關GPT-

2023-07-16

內的寒武紀等等。2022年,AIGC 技術迎來應用大爆發,從 OpenAI 文本生成圖像系統 Dall-E2到 AI 繪畫神器 Stable Diffusion,AIGC 迅速火成“頂流”。戴金權表示,AIGC 技術主要涵蓋兩類模型:一類是像 Stable Diffusion 這樣的擴散模型,它可以

2024-02-18

密時空Patches,竟是來自GoogleDeepMind和謝賽寧的論文成果。OpenAI,永遠快別人一步!像ChatGPT成功搶Claude的頭條一樣,這一次,Google核彈級大殺器Gemini1.5才推出沒幾個小時,全世界的目光就被OpenAI的Sora搶去。100萬token的上下文,僅

2023-10-15

t也不是能白嫖的,會員每月還得交10美元使用費”而就拿OpenAI來看,它也早已走上大模型付費之路。對於C端用戶,提供訂閱模式的ChatGPT Plus,每月收費20美元(合人民幣140元),可訪問基於GPT-4的完全不同的服務,速度更快,訪

2023-03-29

我不同意這個前提。”另外,簽名中還出現一個所謂的“OpenAi CEO”,但根據馬庫斯和一眾網友的推測,應該不是本人簽的名。整件事非常撲朔迷離。截止發稿前,他還特地@一下Sam Altman確認消息。大佬聯名:叫停比GPT-4強的AI公