埃隆-馬斯克(ElonMusk)的人工智能初創公司X.ai公佈其最新的生成式人工智能模型Grok-1.5。Grok-1.5將在不遠的將來("在未來幾天內",X.ai在一篇博客文章中寫道)為社交網絡X的Grok聊天機器人提供支持,它似乎比其前身Grok-1有明顯的升級--至少從X公佈的基準測試結果和規格來看是這樣。
X.ai表示,Grok-1.5得益於"改進的推理能力",尤其是在編碼和數學相關任務方面。在流行的數學基準測試 MATH 中,該模型的得分比 Grok-1 高出一倍多,在 HumanEval 編程語言生成和問題解決能力測試中,該模型的得分比 Grok-1 高出十多個百分點。
當然,我們很難預測這些結果在實際使用中的轉化情況,因為常用的人工智能基準衡量的是研究生水平的化學考試題的成績等深奧的東西,並不能很好地捕捉普通人今天是如何與模型進行交互的。
與 Grok-1 相比,Grok-1.5 能接受的上下文數量是一項可觀察到的改進。
Grok-1.5 的上下文有 128,000 個標記--"標記"指的是原始文本的比特(例如,單詞"fantastic"分為"fan"、"tas"和"tic")。上下文或上下文窗口指的是模型在生成輸出(更多文本)之前要考慮的輸入數據(這裡指文本)。上下文窗口較小的模型往往會遺忘甚至是最近的對話內容,而上下文較大的模型則可以避免這一缺陷,而且還能更好地掌握所接收的數據流。
X.ai在上述博文中寫道:"[Grok-1.5]可以利用更長文檔中的信息。此外,該模型還能處理更長、更復雜的提示,同時隨著上下文窗口的擴大,仍能保持其指令跟蹤能力"。
歷史上,X.ai 的 Grok 模型與其他生成式人工智能模型的不同之處在於,它們回答的問題涉及其他模型通常無法回答的話題,如陰謀論和更具爭議性的政治觀點。正如馬斯克所描述的那樣,這些模型在回答問題時還帶有"反叛傾向",如果被要求這樣做,它們會直接使用粗魯的語言。
目前還不清楚 Grok-1.5 在這些方面會帶來哪些變化(如果有的話)。X.ai 在博文中也沒有提及這一點。
X.ai表示,Grok-1.5很快就會在X平臺上向早期測試者開放,同時還會推出"幾項新功能"。馬斯克此前曾暗示,Grok-1.5 將總結主題和回復,並為帖子內容提供建議;我們將拭目以待。
Grok-1.5是在X.ai開源Grok-1之後宣佈的,盡管沒有對其進行微調或進一步訓練所需的代碼。最近,馬斯克表示,更多的 X 用戶,特別是那些支付每月 8 美元的 X Premium 計劃的用戶,將獲得 Grok 聊天機器人的使用權,以前隻有 X Premium+ 用戶(每月支付 16 美元)才能使用該聊天機器人。
解更多:
https://x.ai/blog/grok-1.5