Google推出新人工智能模型雙子座(Gemini)1.0版 性能甚至超越GPT-4


早前有消息稱Google下一代人工智能模型雙子座發佈時間被延遲到明年年初,原因是在非英語上的表現不太好,但現在Google還是推出雙子座1.0版,而且可能確實非英語水平不太好,因為初期僅支持英語。

按照Google的說法雙子座人工智能模型在性能上拉滿,在一大堆基準測試中名列前茅,而且最重要的是雙子座同時支持服務器、PC 和智能手機,也就是在智能手機上也可以調用本地硬件進行計算。

當然受限於移動設備的算力,雙子座有幾種版本,其中面向手機的是 Gemini Nano 版,其性能與 Ultra 版還是有差距的。

Gemini.jpeg

雙子座 1.0 版提供三種模型:

Gemini Ultra 版:最大、能力最好的模型,適用於高度復雜的任務

Gemini Pro 版:可以進行各類任務擴展的最佳模型

Gemini Nano 版:在設備端運行的最高效的模型

雙子座的一些亮點介紹:

性能方面:

從自然圖像、音頻和視頻理解到數學推理,Gemini Ultra 版在各類學術基準測試中名列前茅,甚至超過 OPENAI GPT-4。

例如在 MMLU (大規模多任務語言理解) 基準測試中超越人類專傢的模型,該模型結合數學、物理、歷史、法律、醫學和倫理學等 57 個學科來測試知識和解決問題的能力。

在圖像基準測試中在無需借助 OCR 光學識別系統的基礎上,也由於其他典型模型。

有關此方面有興趣的用戶可以閱讀Google發佈的學術報告:https://goo.gle/GeminiPaper

Google-Gemini-1188x1456.jpgMultimodal-985x1456.gif

下一代性能:

目前多模態模型主要是將不同模態的模型拼接到一起,Google認為這些模型有時候擅長處理某些任務例如描述圖像,但難以處理更概念性和復雜的推理。

雙子座模型則是原生多模態,從一開始就針對不同模式進行訓練,然後再使用額外的多模態數據進行微調,從而有效提高其性能。

這有助於雙子座模型從頭開始無縫理解和推理各種輸入,其性能遠遠優於現有的多模態模型,並且功能幾乎在每個領域都是最先進的。

復雜的推理:

雙子座 1.0 版復雜的多模態推理功能可以幫助理解更復雜的書面和數學信息,這使得它在發現大量數據中難以辨別的知識方面具有獨特的能力。

雙子座可以從數十萬份文檔中閱讀、過濾、理解和提取信息,這有助於從科學到金融等許多領域實現以數字速度實現新的突破。

理解文本、圖像和音頻等:

雙子座 1.0 版經過訓練可以同時識別和理解文本、圖像和音頻等,因此它可以更好地理解某些微妙的信息,並可以回答與復雜主題相關的問題,這使得雙子座特別擅長解釋數學和物理等復雜學科的推理。

高級編程功能:

雙子座 1.0 版還可以理解、解釋和生成流行編程語言例如 Python、Java、C++ 和 Go 等的高質量代碼,它的跨語言工作和推理復雜信息的能力使其成為世界領先的編程基礎模型之一。

Gemini Ultra 版在許多編程基準測試中表現出色,還可以用作更高級編程系統的引擎。

Google還基於 Gemini Ultra 創建 AlphaCode 2,該模型擅長解決超出編程范圍、涉及復雜數學和理論計算機科學的競爭性編程問題。

首發版本為 Gemini Pro 版:

從今天開始 Google Bard 將使用 Gemini Pro 的微調版本來進行更高級的推理、計劃和理解等,它將在 170 多個國傢或地區提供英語版本,Google計劃在不久後擴展到不同模型、支持更多語言。

Pixel 8 Pro 引入 Gemini Nano 版:

Google還將雙子座引入 Pixel 8 Pro,在錄音機等應用中提供總結。後續 WhatsApp、Gboard 等也會集成 Gemini Nano。

接下來幾個月裡Google還會將雙子座集成到更多產品裡,包括搜索、廣告、Chrome 和 Duet AI 等。


相關推薦

2023-12-07

報告,沒有透露架構細節、模型參數或訓練數據集。艾倫人工智能研究所前CEO Oren Etzioni說,‘沒有理由懷疑Gemini在這些基準上比GPT-4更好,但沒準GPT-5會比Gemini做得更好。’打造像Gemini這樣的巨量模型,可能需要花費數億美元,

2024-02-07

過某些方式調出。尚未發佈的更新內容提到以下變更:1.Google Bard 正式更名為 Gemini (即雙子座);2.Gemini (即原 Bard) 的界面將進行優化,包括減少視覺幹擾、提高可讀性和簡化導航;3. 推出 Gemini Advanced 即雙子座高級版 (該版本預計

2023-12-07

速人類進步和改善生活的機會。我相信我們現在所看到的人工智能轉變將是我們一生中最深刻的轉變,遠遠大於之前向移動或網絡的轉變。人工智能有潛力為世界各地的人們創造從日常生活到非凡的機會。它將帶來新一波的創新

2023-12-07

導制作完美的紙飛機--包括通過拍攝他的設計照片來獲得人工智能提供的反饋--以及父母上傳他們孩子的傢庭作業照片,以獲得幫助,找出他們的數學題解體重點所在。不過,這些都隻是演示和宣傳視頻。皮查伊說,他認為這次

2023-11-17

niAI。今年年初,谷歌代表曾表示該公司計劃在11月份之前推出大語言模型Gemini(雙子座)。但現在,該公司稱在明年第一季度之前,不要指望這種模型會發佈。谷歌首席執行官桑達爾·皮查伊(Sundar Pichai)周四則表示,該公司“

2024-02-16

剛剛,我們經歷LLM劃時代的一夜。Google又在深夜發炸彈,GeminiUltra發佈還沒幾天,Gemini1.5就來。卯足勁和OpenAI微軟一較高下的Google,開始進入高產模式。自傢最強的Gemini1.0Ultra才發佈沒幾天,Google又放大招。就在剛剛,GoogleDeepMind

2024-02-28

(SundarPichai)在一份內部備忘錄中告訴員工,Google雙子座人工智能(GeminiAI)生成的與歷史不符的圖片和文字"冒犯我們的用戶,並顯示出偏見"。上周,Google暫停"雙子座"生成圖片的功能,因為人們廣泛

2024-02-18

Google下一代大模型,無預警降臨。Gemini1.5,除性能顯著增強,還在長上下文理解方面取得突破,甚至能僅靠提示詞學會一門訓練數據中沒有的新語言。此時距離去年12月Gemini1.0發佈,還不到3個月。現在僅僅中杯1.5 Pro版就能越級

2024-02-09

場回饋,那些已經花錢訂閱GPT的用戶們會不會轉投Gemini,人工智能整合進Google生態的全新究極樣貌是什麼?這些都讓人期待。今年,註定繼續是高潮迭起的AI拉鋸戰。

2023-12-07

劃。過去幾年裡,Google一直在談論其 Pixel 手機本質上是人工智能設備。憑借Tensor芯片與Google所有服務的緊密聯系,它們應該會隨著時間的推移變得更好、更智能。有 Gemini Nano,許多高端Android設備最終都能實現這一目標。而目前

2024-02-13

限性,以及過於信任它的危險性。GenAI 模型沒有真正實現人工智能。這種文本模型通常從公共網絡上獲取大量的示例,根據這些示例的模式(包括周圍數據的上下文)來學習數據(如文本)出現的可能性。這種基於概率的方法在

2024-02-23

可用於從在線評論到支持請求再到產品列表的所有內容。人工智能模型能夠理解用戶所處網頁的上下文,從而為相關內容提供建議。例如,為一雙鞋撰寫評論的人可能會看到一些建議,其中包括產品頁面上支持用戶觀點的關鍵功

2023-12-07

時候,整個AI行業都被重塑。Gemini技術報告:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf參考鏈接:[1]https://x.com/AravSrinivas/status/1732427844729581764[2]https://x.com/DimitrisPapail/status/1732529288493080600[3]https://www.linkedin.com/posts/svpino

2023-12-07

與Gemini生成式人工智能模型一起,Google今天上午發佈AlphaCode2,它是GoogleDeepMind實驗室大約一年前推出的代碼生成AlphaCode的改進版。AlphaCode2實際上是由雙子座模型(Gemini)驅動的,或者至少是它的某個變種(GeminiPro)在編程競賽