早前有消息稱Google下一代人工智能模型雙子座發佈時間被延遲到明年年初,原因是在非英語上的表現不太好,但現在Google還是推出雙子座1.0版,而且可能確實非英語水平不太好,因為初期僅支持英語。
按照Google的說法雙子座人工智能模型在性能上拉滿,在一大堆基準測試中名列前茅,而且最重要的是雙子座同時支持服務器、PC 和智能手機,也就是在智能手機上也可以調用本地硬件進行計算。
當然受限於移動設備的算力,雙子座有幾種版本,其中面向手機的是 Gemini Nano 版,其性能與 Ultra 版還是有差距的。
雙子座 1.0 版提供三種模型:
Gemini Ultra 版:最大、能力最好的模型,適用於高度復雜的任務
Gemini Pro 版:可以進行各類任務擴展的最佳模型
Gemini Nano 版:在設備端運行的最高效的模型
雙子座的一些亮點介紹:
性能方面:
從自然圖像、音頻和視頻理解到數學推理,Gemini Ultra 版在各類學術基準測試中名列前茅,甚至超過 OPENAI GPT-4。
例如在 MMLU (大規模多任務語言理解) 基準測試中超越人類專傢的模型,該模型結合數學、物理、歷史、法律、醫學和倫理學等 57 個學科來測試知識和解決問題的能力。
在圖像基準測試中在無需借助 OCR 光學識別系統的基礎上,也由於其他典型模型。
有關此方面有興趣的用戶可以閱讀Google發佈的學術報告:https://goo.gle/GeminiPaper
下一代性能:
目前多模態模型主要是將不同模態的模型拼接到一起,Google認為這些模型有時候擅長處理某些任務例如描述圖像,但難以處理更概念性和復雜的推理。
雙子座模型則是原生多模態,從一開始就針對不同模式進行訓練,然後再使用額外的多模態數據進行微調,從而有效提高其性能。
這有助於雙子座模型從頭開始無縫理解和推理各種輸入,其性能遠遠優於現有的多模態模型,並且功能幾乎在每個領域都是最先進的。
復雜的推理:
雙子座 1.0 版復雜的多模態推理功能可以幫助理解更復雜的書面和數學信息,這使得它在發現大量數據中難以辨別的知識方面具有獨特的能力。
雙子座可以從數十萬份文檔中閱讀、過濾、理解和提取信息,這有助於從科學到金融等許多領域實現以數字速度實現新的突破。
理解文本、圖像和音頻等:
雙子座 1.0 版經過訓練可以同時識別和理解文本、圖像和音頻等,因此它可以更好地理解某些微妙的信息,並可以回答與復雜主題相關的問題,這使得雙子座特別擅長解釋數學和物理等復雜學科的推理。
高級編程功能:
雙子座 1.0 版還可以理解、解釋和生成流行編程語言例如 Python、Java、C++ 和 Go 等的高質量代碼,它的跨語言工作和推理復雜信息的能力使其成為世界領先的編程基礎模型之一。
Gemini Ultra 版在許多編程基準測試中表現出色,還可以用作更高級編程系統的引擎。
Google還基於 Gemini Ultra 創建 AlphaCode 2,該模型擅長解決超出編程范圍、涉及復雜數學和理論計算機科學的競爭性編程問題。
首發版本為 Gemini Pro 版:
從今天開始 Google Bard 將使用 Gemini Pro 的微調版本來進行更高級的推理、計劃和理解等,它將在 170 多個國傢或地區提供英語版本,Google計劃在不久後擴展到不同模型、支持更多語言。
Pixel 8 Pro 引入 Gemini Nano 版:
Google還將雙子座引入 Pixel 8 Pro,在錄音機等應用中提供總結。後續 WhatsApp、Gboard 等也會集成 Gemini Nano。
接下來幾個月裡Google還會將雙子座集成到更多產品裡,包括搜索、廣告、Chrome 和 Duet AI 等。