農歷春節除夕這一天,Google直接來一票大的:Bard今後統稱Gemini。通過GeminiAdvanced,即可訪問Google能力最強的原生多模態大模型GeminiUltra!去年12月,Google推出GeminiPro和GeminiNano,人們可以通過聊天機器人Bard、Pixel8Pro和三星S24系列手機免費使用。而今天,Bard改頭換面,帶來由超大杯Ultra1.0驅動的會員版
新服務訂閱價格為每月19.99美金 ,和ChatGPT Plus、Perplexity Pro等主流生成式AI應用每月20美金的價格差不多。不過為顯示誠意,Google會提供前兩個月免費試用。
Google最高階多模態大模型,Gemini Ultra新時代開啟
據Google CEO 桑達爾·皮查伊稱,Ultra 1.0是首個在 MMLU(大規模多任務語言理解)上超越人類專傢的模型,使用包括數學、物理、歷史、法律、醫學和倫理學在內的57個學科組合來測試知識和解決問題的能力。
因此,Gemini Advanced在編碼、邏輯推理、遵循微妙指令和協作創意項目等高度復雜的任務上將更加強大。不僅可以與用戶進行更長、更詳細的對話,還能更好地理解提示上下文。
比如:Gemini Advanced可以成為個人導師,為你創建逐步說明、個性化測驗或根據學習風格量身定制回答;解決更復雜的編碼場景,並協助評估不同的編程思路;成為數字創作者的創意夥伴,生成新鮮內容,分析最新趨勢,制定商業計劃書。值得一提的是,Gemini Ultra內由Imagen 2生成的所有圖像都應用數字水印(雖然你看不到它)。
隨著新功能不斷添加,用戶將體驗到更強的多模態能力、更多交互式編程功能以及更深入的數據分析。目前Gemini Advanced僅支持英語,可以在超過150個國傢和地區使用,將逐步擴展到更多語言。
Android和IOS手機端登場,Gmail、文檔、表格可使用
Gemini Advanced作為全新Google One AI高級計劃的一部分,還會給用戶提供2TB存儲空間。此外,AI高級訂閱者很快就能夠在Gmail、Docs、Slides、Sheets等之前被集合為Duet AI的應用中指調用Gemini Ultra。
為實現手機端輕松訪問,Google此次推出全新Gemini應用程序。
你可以拍攝一張車胎的照片請求說明,為晚宴邀請函生成自定義圖像,或者要求撰寫一條復雜短信。Google稱之為“構建真正的AI助手的重要第一步,一個具有對話性、多模態的新型實用助理。”
Android手機用戶可以下載Gemini應用程序,或按照平時激活Google助手的方式——比如直接說“嘿,Google”來將它喚醒。Gemini 能為你剛拍攝的照片生成描述,回答閱讀中文章的相關問題。許多Google助手的語音功能也將通過Gemini App可用,包括設置定時器、打電話和控制智能傢居設備等。
雖然iOS應用還在路上,但Google表示在接下來的幾周裡即會上架App Store。
將Gemini 能力擴展至更多產品
Gemini也將全面應用於個人和企業每天使用的產品,包括 Workspace 和Google雲服務。
Workspace:
皮查伊表示,目前已經有超過100萬人正在使用像 “Help me write ”這樣的功能,通過 Duet AI 提高生產力和創造力。從今天起,Duet AI 將改為 Gemini for Workspace,並且很快, Google One AI 高級計劃訂閱者就能在 Gmail、Docs、Sheets、Slides 和 Meet 等Google辦公全套件中使用 Gemini Ultra。
Google雲:
對於雲客戶來說,Gemini 將幫助提高企業生產力,協助開發人員更高效編寫代碼,並保護組織免受網絡攻擊。
開發者一直是每一次重大技術變革的基礎,在 Gemini 生態系統中也扮演著同樣重要的角色。現在已經有數十萬技術人員和企業正在使用 Gemini 大模型進行開發。Google將在下周分享更多關於開發者和雲客戶未來權益的詳細信息。
皮查伊還透露,Google已經在積極訓練下一代 Gemini 模型。
網友迫不及待,Gemini Ultra新鮮開測
去年12月6日Google發佈Gemini Pro時,對標的是GPT-3.5。由於取消原定的線下亮相,Gemini系列被媒體渲染得陰影重重。於是沒隔幾天,中杯大杯忽然集體登場,還以一個震懾三觀的“鴨子”視頻demo引發熱烈討論和網絡打假。當時Google曾預告說在32項LLM廣泛使用的基準測試中,Gemini Ultra有30項都超越 ChatGPT代表的業界最先進水平。
究竟Ultra版本實力如何,現在終於可以上手一探究竟。
用寫LinkedIn Post來測試內容生成。結論是Gemini Ultra憑借更多標題選項、更快響應速度和“沒有愚蠢的emoji表情”擊敗GPT-4成為絕對勝者。
網友 Alphabetting拿出一道邏輯推理題:Tabitha喜歡餅幹但不喜歡蛋糕,喜歡羊肉但不喜歡羔羊肉,喜歡秋葵但不喜歡南瓜。它詢問按照相同規則,Tabitha會喜歡櫻桃還是梨。
Gemini Ultra給出的建議是:“Tabitha喜歡發音兩個音節的食物,不喜歡一個音節的食物。”它列出謎題中每種食物的音節數,由於“cherries”有兩個音節,因此答案是櫻桃。
GPT-4認為Tabitha的偏好可能與單詞最後一個字母有關。她喜歡的食物結尾是輔音,而她不喜歡的食物結尾是原因。這樣的話,櫻桃和梨都符合條件——有些棘手,但一定要選一個的話,那就櫻桃吧。
他表示Gemini Ultra成功解決被GPT-4搞到稀碎的邏輯測試。
用戶Brett Winton測試兩者的文生圖功能,提示詞是“生成一個畫傢試圖在火箭外部畫靜物的圖像,讓它幽默一些,一幅插畫“。左邊是GPT-4,右邊是Gemini Ultra。
AI模型的想象力見仁見智,不過Gemini圖像裡的畫傢比起繪畫更像在吃東西,手部細節也有點問題。評論裡都覺得GPT-4更好些。
他又緊接著對比Gemini Ultra、 Claude和GPT-3.5對於8年級數學題計算能力。
題面是:Garcia正策劃一個比薩派對,她需要確保30名學生每人至少得到3片,每個比薩有8片。為增加多樣性, Garcia決定訂購一半奶酪比薩和一半香腸比薩。然而有5名學生是素食者,隻會吃奶酪比薩。
請回答:
1.Garcia需要訂購多少個比薩,以確保每個學生至少3片?
2.每種類型比薩各多少個?
3.如果每個比薩12美元,總訂單費用是多少?
在之前的測試中, Gemini Pro把這道題搞砸。此次Ultra答對總數12個比薩和費用144美元。但第2題的正確答案應該是兩種比薩各6個,Ultra沒通過。
Brett Winton表示,Gemini Ultra和Claude一樣,數學計算都不如GPT-3.5準確。
編碼能力上,網友Mervin Praison在Gemini Ultra用Python成功創建一個貪吃蛇遊戲。
更多更深入的用例,大傢可以抓住兩個月的免費試用福利,親自上手玩一玩。
OpenAI開辟AI代理新戰場,Google 不甘落後
Google副總裁兼Gemini體驗和Google助手部門總經理Sissie Hsiao表示,“對Google來說,Gemini不僅僅是模型。它實際上是我們思考最先進技術,以及我們在其基礎上構建的整個生態系統的轉變,從影響數十億用戶的產品,到開發者和企業用來創新的API平臺。”
就在昨天,The Information發表題為《OpenAI正將AI競爭焦點轉移到能操作設備和自動化任務的軟件上》的報道。
文中爆料,OpenAI正在開發一種代理軟件,能有效接管手機和電腦,替用戶執行復雜任務操作。你可以命令ChatGPT執行從文檔到表格的數據轉移,自動填寫費用報告並輸入到會計軟件中,或者在特定預算下創建行程或預訂機票等基於網絡的任務。
隨著越來越多全新大模型的推出,OpenAI也深知今年可能不再擁有市場上最強大LLM的可能性。所以加緊開辟新戰場早做準備。
據知情人士稱,這類請求將觸發代理點擊、光標移動、文本輸入等其它人類動作。可能會將將ChatGPT變成Sam Altman私下稱為“超智能個人工作助理”的工具,也將與微軟Copilot和GoogleGemini for Workspace 展開更直接競爭。
去年ChatGPT已經給OpenAI帶來16億美元收入,微軟也靠生成式AI顯著拉升最新季度財報業績。
而AI業務卻還沒有給Google帶來明朗的現金流。如今付費版本Gemini Advanced和Ultra 1.0的推出會帶來怎樣的市場回饋,那些已經花錢訂閱GPT的用戶們會不會轉投Gemini,人工智能整合進Google生態的全新究極樣貌是什麼?這些都讓人期待。今年,註定繼續是高潮迭起的AI拉鋸戰。