馬斯克突然出手截胡,搶在OpenAI開發者大會前發佈大模型Grok。與其他ChatGPT類產品不同,Grok可以實時從推文中獲取最新知識,比如馬斯克剛剛與JoeRogan的最新訪談。
巨量、實時且獨特的數據構成Grok的最大護城河,早在7月馬斯克就已禁止其他組織使用這些數據訓練AI。
個性上Grok也不是那種一板一眼的AI助手,說出的話多少沾點諷刺和幽默。
哦,我親愛的人類啊,我這兒有些勁爆的新聞要告訴你!我們的朋友Sam Bankman-Fried,那位前加密貨幣大亨,竟然在他的欺詐案審判中被判有罪。你能相信嗎?
xAI創始團隊不算老馬隻有11人,做到這一切,僅僅用幾個月。
創始成員中的楊格感嘆,“過去的幾周是我人生中最棒的日子”。
當一小群有幹勁的世界級人才齊心協力時,打出的合力遠遠超出自身的重量……現在隻有天空,不,宇宙,才是我們的極限。
最好的聊天機器人UI
除零星試玩截圖,xAI創始成員Toby Polen發佈對界面和功能的詳細介紹。
首先,Grok支持多個對話同時輸出,一邊寫代碼一邊問其他問題也不在話下。
在回答不滿意重新生成後,可以展開時間線,直觀導航到不同版本的回答。
甚至可以使用內置的markdown編輯器,手動修改AI的回答後繼續進行對話。
另外還可以在“常規模式”和“幽默模式”中切換。
Pohlen展示的還不是Grok的全部功能,還留有更多彩蛋等大傢自己探索。
那麼如何才能玩到呢?目前有兩個渠道:
第一個,有藍勾認證的賬號,現在可以到xAI官網登錄排隊。
第二個,訂閱16美元/月的 Premium+服務,內測結束後會開放使用。
評分超GPT-3.5
用xAI團隊自己的話說,Grok是一款模仿《銀河系漫遊指南》的人工智能(AI modeled after the Hitchhiker’s Guide to the Galaxy)。
Grok用“一點點的智慧”來回答問題,還有著“一點點的叛逆”,在通告中,開發者特別提示:
如果你不喜歡幽默,千萬不要用Grok!
正經地說,它可以回答人類提出的幾乎任何問題——即使沒得問,Grok也能提出一些建議的問題。
最大的亮點是,利用中的海量信息,Grok可以提供真實世界中的實時情況。
而在背後提供支持的模型也叫Grok,目前基於的是Grok-1版本,它的原型Grok-0在xAI宣佈成立後開始訓練。
Grok-0的性能接近Llama2-70B,但參數量隻有不到一半——33B。
而在過去的兩個月時間裡,xAI加強Grok的推理和編碼能力,得到現在的Grok-1。
測試結果顯示,Grok-1在數學(GSM8k、MATH)、代碼(HumanEval)和多學科知識(MMLU)評測中不僅相比Grok-0有顯著提升,還超過GPT-3.5。
為排除模型無意間在網絡數據中看過這些標準測試數據的內容,團隊還使用最新的2023匈牙利高中數學考試題做手動測試。
Grok-1取得的成績也超過GPT-3.5,在Claude 2與GPT-4之間。
工程架構方面,畢竟是馬斯克出手,不會走尋常路。
在Grok系統中找不到大傢熟悉的PyTorch或Tensorflow,甚至連Python成分也沒有。
而是選用Rust編程語言以及深度學習框架新秀JAX。
背後原因,xAI認為大模型訓練過程就像一列呼嘯而過的貨運火車,如果其中一節脫軌就很難恢復。
為此團隊打造專門的分佈式系統,確保立即識別並自動處理每種類型的故障。
在這之中,Rust語言被證明是構建可擴展、可靠且可維護的基礎設施的理想選擇。
此外,對於實時查詢和存儲數據的RAG系統,向量數據庫供應商Qdrant也跑出來認領一波功勞。
未來將進軍多模態
在通告中,xAI還透露接下來的幾個重點研究方向。
功能方面,包括比較熱門的長文本理解和多模態。
性能方面,則包括可擴展監督、安全性和對抗魯棒性等。
而除聊天機器人Grok,xAI被傳還在打造另外一款產品——提示詞工作站PromptIDE。
不過相比於已經圈粉無數的Grok,PromptIDE更具幾分神秘色彩。
xAI一同註冊Grok和PromptIDE的商標,還有網友在賬戶設置中發現有關PromptIDE的內容……
在一則網友的爆料中,馬斯克回復一個
的表情,你品,你細品。
但無論是官方還是小道消息,都沒有透露關於PromptIDE的更多細節。
你認為馬斯克xAI會成為OpenAI的有力競爭對手嗎?