微軟:多模態大模型GPT-4下周就出


大傢都在猜GPT-4發佈時間,現在有人提前公佈答案,還是微軟自己的CTO。我們知道,引爆如今科技界軍備競賽的ChatGPT是在GPT-3.5上改進得來的,OpenAI很早就預告GPT-4將會在今年發佈。最近各傢大廠爭相入局的行動似乎加快這個進程。

最新消息是,萬眾期待的 GPT-4 下周就要推出:在 3 月 9 日舉行的一場名為“AI in Focus - Digital Kickoff”的線下活動中,四名微軟德國員工展示 GPT 系列等大型語言模型(LLM)的顛覆性力量,以及 OpenAI 技術應用於 Azure 產品的詳細信息。

在活動中,微軟德國首席技術官 Andreas Braun 表示 GPT-4 即將發佈,自從 3 月初多模態模型 Kosmos-1 發佈以來,微軟一直在測試和調整來自 OpenAI 的多模態模型。

GPT-4,下周就出

“我們將在下周推出 GPT-4,它是一個多模態的模型,將提供完全不同的可能性 —— 例如視頻(生成能力),”Braun 說道,他將語言大模型形容為遊戲規則改變者,因為人們在這種方法之上讓機器理解自然語言,機器就能以統計方式理解以前隻能由人類閱讀和理解的內容。

與此同時,這項技術已經發展到基本上“適用於所有語言”:你可以用德語提問,然後用意大利語得到答案。借助多模態,微軟和 OpenAI 將使“模型變得全面”。


微軟德國 CTO Andreas Braun。

改變業界

微軟德國公司首席執行官 Marianne Janik 全面談到人工智能對業界的顛覆性影響。Janik 強調人工智能的價值創造潛力,並表示,當前的人工智能發展和 ChatGPT 是“iPhone 發佈一樣的時刻”。她表示,這不是要代替人類工作,而是幫助人們以不同於以往的方式完成重復性任務。

改變並不一定意味著失業。Janik 強調說,這意味著“許多專傢會開始利用 AI 實現價值增長”。傳統的工作行為正在發生變化,由於新的可能性出現,也會產生全新的職業。她建議公司成立內部“能力中心”,培訓員工使用人工智能並將想法整合到項目中。

此外,Janik 還強調,微軟不會使用客戶的數據來訓練模型(但值得註意是,根據 ChatGPT 的政策,這不會或至少不會適用於他們的研究合作夥伴 OpenAI)。


微軟德國 CEO Marianne Janik。

實際用例

微軟的兩位 AI 技術專傢 Clemens Sieber 和 Holger Kenn 提供關於 AI 實際使用的一些信息。他們的團隊目前正在處理具體的用例,他們講解用例涉及的技術。

Kenn 解釋什麼是多模態人工智能,它不僅可以將文本相應地翻譯成圖像,還可以翻譯成音樂和視頻。除 GPT-3.5 模型之外,他還談到嵌入,用於模型中文本的內部表征。根據 Kenn 的說法,“負責任”的 AI 已經內置到微軟的產品中,並且可以通過雲將數百萬個查詢映射到 API 中。

Clemens Siebler 則用用例說明今天已經成為可能的事情,例如可以把電話呼叫的語音直接記錄成文本。根據 Siebler 的說法,這可以為微軟在荷蘭的一傢大型客戶每天節省 500 個工作小時。該項目的原型是在兩個小時內創建的,一個開發人員在兩周內完成該項目。據他介紹,三個最常見的用例是回答隻有員工才能訪問的公司信息、AI 輔助文檔處理和在呼叫中心處理口語的半自動化。

微軟表示人們很快就會與其全新的 AI 工具見面。特別是在編程領域,Codex 和 Copilot 等模型可以更輕松地創建代碼,令人期待。

當被問及操作可靠性和事實保真度時,Siebler 表示 AI 不會總是正確回答,因此有必要進行驗證。微軟目前正在創建置信度指標來解決此問題。通常,客戶僅在自己的數據集上使用 AI 工具,主要用於閱讀理解和查詢庫存數據,在這些情況下,模型已經相當準確。然而,模型生成的文本仍然是生成性的,因此不容易驗證。Siebler 表示微軟圍繞生成型 AI 建立一個反饋循環,包括贊成和反對,這是一個迭代的過程。

看來在 AI 大模型的競爭中,領先的一方也加快腳步。微軟在過去一周左右接連發佈展示多模態的語言大模型論文 Kosmos-1 和 Visual ChatGPT,這傢公司顯然非常支持多模態,希望能夠做到使感知與 LLM 保持一致,如此一來就能讓單個 AI 模型看文字圖片,也能“說話”。

微軟的下次 AI 活動選在 3 月 16 日,CEO 薩蒂亞・納德拉將親自上臺演講,不知他們是否會在這次活動上發佈 GPT-4。有趣的是,微軟的活動和百度推出文心一言選在同一天。

距離 3 月 16 日百度推出類 ChatGPT 聊天機器人還有一周時間,最近有報道稱,百度正在抓緊時間趕在發佈最後期限前完成任務。目前看來,百度打算分階段推出文心一言的各項功能,並首先向部分用戶開放公測。知情人士稱,在春節假期過後,李彥宏就要求包括自動駕駛部門在內的全公司 AI 研究團隊將英偉達 A100 支援給文心一言的開發。

我們期待下周各傢科技公司能帶來驚喜。


相關推薦

2023-03-10

3月10日消息,據外媒報道,微軟德國首席技術官(CTO)安德烈亞斯·佈勞恩(Andreas Braun)表示,GPT系列語言模型中最新的GPT-4將在下周推出,它將是一個多模態模型,將提供完全不同的可能性,例如視頻。據悉,ChatGPT背後的開發

2023-03-10

最近,微軟是喜訊連連。昨天,微軟德國CTO在活動中透露,GPT-4將在下周發佈,將提供多模態模型。毫無疑問,微軟要搞個大的——GPT-4將轉向多模態,Kosmos-1也是多模態,微軟亞研院3月8日提出的VisualChatGPT,也把視覺基礎模型整

2024-03-18

相較於英偉達、微軟等大型科技股,蘋果今年的表現令人失望不已,股價年內跌逾10%,且失去“全球市值最高公司”的寶座。背後原因很簡單,蘋果在這場人工智能(AI)競賽中落伍。為擺脫窘境,蘋果近期放棄造車項目,正在

2023-03-15

ChatGPT 直接升級成 GPT-4 版的,也開放 GPT-4 的 API。另外,微軟營銷主管在 GPT-4 發佈後第一時間表示:“如果你在過去六周內的任何時候使用過新的 Bing 預覽版,你就已經提前解 OpenAI 最新模型的強大功能。”是的,微軟的新必應

2023-03-10

,當前的模型還是21年發佈的GPT-3.5,下周就要推出GPT-4。微軟德國公司的CTO兼AI部門主管Andreas Braun日前在一次活動上透露,下周將推出GPT-4,將提供多模態模型,將提供完全不同的可能性,比如視頻。大傢知道當前的ChatGPT隻能處

2024-02-09

am Altman私下稱為“超智能個人工作助理”的工具,也將與微軟Copilot和GoogleGemini for Workspace 展開更直接競爭。去年ChatGPT已經給OpenAI帶來16億美元收入,微軟也靠生成式AI顯著拉升最新季度財報業績。而AI業務卻還沒有給Google帶來明

2024-04-15

這對於自動駕駛領域來說,或許是個好消息。巧合的是,微軟研究院前段時間更新跨語言、模態、模型和任務的基準測試 MEGAVERSE,包含 22 個數據集,涵蓋 83 種語言(包括資源匱乏的非洲語言)。微軟還在基準測試中加入兩個多

2023-12-07

傳說中的Gemini,終於在今天深夜上線!‘原生多模態’架構,是Google的史詩級創舉,Gemini也如願在多個領域超越GPT-4。這場仗,Google必不能輸。Google的復仇大殺器Gemini,深夜忽然上線!被ChatGPT壓著打整整一年,Google選擇在12月的

2023-03-16

hatGPT Plus已經可以適用GPT-4在前不久的GPT-4“謠言”階段,微軟就曾多次通過各種渠道透出New Bing會第一時間應用GPT-4。新模型發佈後,微軟更是在第一時間宣佈“我們很高興確認新的Bing正在運行GPT-4,我們已經為搜索進行定制。

2024-04-22

大模型V3.5版本,這也是國內首個基於全國產算力訓練的多模態認知大模型。其中訊飛星火V3.5的數學、語言理解和語音交互3大核心能力超越GPT-4 Turbo;代碼能力達到GPT-4 Turbo 96%,多模態理解達到GPT-4V 91%,成為國產最強多模態大模

2023-03-28

大模型的浪潮。在美國,以OpenAI、Anthropic等初創企業和以微軟、Google為代表的科技巨頭帶領著美國在AI大模型的道路上蒙眼狂奔,最大參數已卷到5620億。在中國,美團王慧文、阿裡賈揚清、前搜狗CEO王小川、前京東AI掌門人周伯

2023-11-05

全端應用。官方表示,360智腦大模型集成360GPT大模型、360多模態大模型技術能力,具備生成創作、多輪對話、邏輯推理等十大核心能力,覆蓋大模型全部應用場景。值得一提的是,今年8月,上海交通大學聯合清華大學及愛丁堡

2023-03-15

類,但在各種專業和學術基準上表現出人類水平的表現。微軟在GPT-4發佈後第一時間表示,新的必應(Bing)已經基於GPT-4 技術運行,這是為搜索產品量身定制的模型產品。“如果你在過去五周內的任何時候使用過新的Bing預覽版

2023-12-07

正式發佈卻似乎因為各種原因而屢遭推遲。為與 OpenAI 和微軟展開競爭,Google果斷從 PaLM 2 切換到 Gemini 上,甚至在今年 4 月份直接把Google大腦(Google Brain)和 DeepMind 合並在一起,Gemini 就由新組成的 Google DeepMind 匯合兩個實驗室