短短45分鐘發佈會 OpenAI如何再次讓AI圈一夜未眠


對於AI行業從業者來說,剛剛可能是一夜未眠。北京時間11月7日凌晨,美國人工智能公司OpenAI的開發者大會正式開啟,創始人SamAltman在臺上和同事,隻用45分鐘時間,就“轟”出團隊最新的成果GPT-4Turbo,後者不僅更快、有更長的上下文、而且更好的控制。

同時,OpenAI 下調 API 的價格近 3 倍,降到 1000 輸入/美分,讓在場開發者歡呼不已。

當然,更重要的是,OpenAI 推出“GPTs”——讓人們能用自然語言構建定制化 GPT,然後,你猜到——可以把 GPT 上傳到即將發佈的“GPT Store”!

如果說 GPT-4 Turbo 是更好用的“iPhone”,GPT Store 則可能是讓 OpenAI成為“蘋果”一樣的巨頭的重要一步

當競爭對手們依然在“AI 煉丹”時,OpenAI 已經開始構建起一個看起來相當宏偉的生態。

GPT-4 Turbo,更快,更省錢

發佈會一開始,Sam Altman 就宣佈 GPT-4 的一次大升級,推出 GPT-4 Turbo,同步在 ChatGPT 和 API 版本推出。

Sam Altman 表示團隊一直在征求開發者的建議,對開發者關註的問題做六大升級,分別是更長的上下文長度、更強的控制、模型的知識升級、多模態、模型微調定制和更高的速率限制

其中前四條主要關於新模型的性能的提升,而後兩點則主要針對企業開發者的痛點。在提升性能的同時,OpenAI 還宣佈 API 價格的下調,可謂“加量不加價”。


Sam Altman 公佈 GPT 的六大升級|OpenAI

六大升級中,第一,就是上下文長度

OpenAI 原本提供的最長的上下文長度為 32k,而此次,GPT-4 Turbo 直接將上下文長度提升至 128k,一舉超過競爭對手 Anthropic 的 100k 上下文長度。

128k 的上下文大概是什麼概念?大概約等於 300 頁標準大小的書所涵蓋的文字量。除能夠容納更長上下文外,Sam 還表示,新模型還能夠在更長的上下文中,保持更連貫和準確。

第二,是為開發者提供幾項更強的控制手段,以更好地進行 API和函數調用

首先,新模型提供一個 JSON Mode,可以保證模型以特定 JSON 方式提供回答,調用 API 時也更加方便。

另外,新模型還允許同時調用多個函數,同時引入 seed parameter,在需要的時候,可以確保模型能夠返回固定輸出。接下來幾周,模型還將增加新功能,讓開發者能看到 log probs。

第三,則是模型內部和外部知識庫的升級

ChatGPT 橫空出世大概一年後,GPT 的知識庫終於更新到 2023 年 4 月。Sam Altman 承諾未來還將繼續更新其知識庫,不使其落伍。“對於 GPT 的知識停留在 2021 年,我們和你們一樣,甚至比你們更惱火。”Sam Altman 表示。


GPT 內部知識庫終於升級到 2023 年 4 月|OpenAI

除內部知識庫的升級,GPT-4 Turbo 也升級外部知識庫的更新方式,現在可以上傳外部數據庫或文件,來為 GPT-4 Turbo 提供外部知識庫的支持。

第四,或許是最不讓人意外的,多模態

新模型支持 OpenAI 的視覺模型 DALL·E 3,還支持新的文本到語音模型——開發者可以從六種預設聲音中選擇所需的聲音。


多模態成為 GPT 的內置功能|OpenAI

GPT-4 Turbo 現在可以以圖生圖。同時,在圖像問題上,目前 OpenAI 推出防止濫用的安全系統。OpenAI 還表示,它將為所有客戶提供牽涉到的版權問題的法律費用。

在語音系統中,OpenAI 表示,目前的語音模型遠超市場上的同類,並宣佈開源語音識別模型 Whisper V3。

第五,模型微調與定制

8 月,OpenAI 曾經發佈過 GPT-3.5 Turbo 的微調服務。當時,有早期測試表明,經過微調的 GPT-3.5 Turbo 版本在某些任務中甚至可以超越 GPT-4,不過定價相對較高。

而此次,Sam 宣佈 GPT-3.5 Turbo 16k 的版本目前也可以進行微調的定制,且價格將比前一代更低。GPT-4 的微調定制也在申請中。

同時,OpenAI 也開始接受單個企業的模型定制。“包括修改模型訓練過程的每一步,進行額外的特定領域的預訓練,針對特定領域的後訓練等等。”Sam 表示。同時他表示,OpenAI 沒有辦法做很多這樣的模型定制,而且價格不會便宜。

第六,也是最後一點,是更高的速率限制

GPT-4 用戶,發佈會後馬上可以享受到每分鐘的速率限制翻倍的體驗。同時,如果不夠滿意,還可以進一步通過 API 賬戶,申請進一步提升速率限制。

六大升級以外,是 API 體系的全線降價。

此次新發佈的 GPT-4 Turbo,輸入方面比 GPT-4 降價 3 倍,而輸出方面降價 2 倍,OpenAI 表示,總體使用上降價大概 2.75 倍

新模型的價格是每千輸入 token 1 美分,而每千輸出 token 3 美分。降價的 API 迎來現場開發者的歡呼。

Sam 還表示,在優先解決價格之後,下一個重點解決的問題將是速度問題,很快,開發者們就會發現 GPT-4 Turbo 將變快很多。

GPT Store 來!

早在 5 月,OpenAI 就開放插件系統,首批上線 70 個大模型相關的應用,領域包括猜詞、翻譯、查找股票數據等等。


GPT Store 風格都非常“App Store”|OpenAI

當時,該功能被寄予厚望,不少媒體將其類比於蘋果的 App Store 時刻,認為它將改變大模型應用的生態。不過雖然後期插件不斷增加,但插件系統卻遠遠沒有達到蘋果應用商店的影響力。

而此次發佈會上,OpenAI 則重新梳理其應用商店的體系,並將其擴大到一個全新的范疇——人人都能通過自然語言創建基於自己的知識庫的 AIAgent,加入 OpenAI 的應用商店,並獲得分成

OpenAI 此次發佈的應用,不再稱為插件,而選擇一個相對比較奇怪的名字,GPT。而整體的應用商店,名字叫做 GPT Store,將在本月後期正式推出。

按照 Sam Altman 的說法,每一個 GPT 像是 ChatGPT 的一個為特殊目的而做出的定制版本


OpenAI 的工作人員嘗試讓 ChatGPT 管理自己的生活|OpenAI

為突出新的 GPT 應用,ChatGPT 整個頁面將有小幅度的調整。左上角除 ChatGPT,下面的應用,就是此次推出的 GPT 應用。

在演示中,可以看到,較為復雜的插件——比如曾經在 OpenAI 上線插件系統時第一批進入插件系統的 Zapier,仍然存在於目前的應用商店中,而且仍然可能是未來應用商店裡很重要的一批應用。

演示中,OpenAI 的 Jessica Shay,就利用 Zapier 鏈接自己的日歷和手機短信,通過與 Zapier 這個應用聊天的方式,直接安排自己的日程,並通知同事。

不過,Zapier 的功能雖然強大,這樣的應用並不是此次發佈的重點。據 Glassdoor 數據顯示,Zapier 公司擁有 500-1000 名員工,而財富網站報道,Zapier 估值已達 50 億美金。指望這樣的應用來填充 OpenAI 的羽翼未豐的應用商店,使其成為一個豐富的生態顯然不太現實。

因此,此次發佈中,OpenAI 推出一個重磅發佈:讓不懂代碼的人也能輕松定義一個 GPT

Sam Altman 為此進行現場展示。

“在 YC 工作過很多年,我總是遇到開發者向我咨詢商業意見。”Sam Altman 講到,“我一直想,如果有一天有個機器人能幫我回答這些問題就好。”

接著,Sam Altman 打開 GPT Builder,先打上一段對這個 GPT 的定義,類似於幫助初創公司的創始人思考他們的業務創意並獲得建議,接著,在對話中,GPT Builder 自己生成這個 GPT 的名字、圖標,並通過與 Sam 對話的形式,詢問 Sam 是否要對對生成的名字和圖標等進行調整。


Sam Altman 正在創建一個“創業導師 GPT”|OpenAI

接下來,GPT Builder 主動向他詢問這個應用該如何與用戶交互,Sam 表示可以從我的過往演講中選擇合適且有建設性的回答,然後上傳一段自己過往的演講。

即使加上講解,整個應用也在三分鐘內就完成。訪問這個 GPT 的人,會收到 GPT 自動生成的對話開頭,可以與這個 GPT 對話咨詢創業相關的內容,而得到的,將是一個類似於 Sam Altman 本人的回答。

Sam 表示,創建者還可以進一步為 GPT 增加 action(動作)。

創建一個這樣的 GPT,本質上,用戶能夠定制的功能其實並不多:指令(預設的 prompt),外設的知識庫和動作。但是,能把三者絲滑地結合起來,讓一個不懂代碼的人也能更簡單地創建應用,確實是此次 Open AI的創舉

GPT 發佈後,應用可以選擇私有,專屬企業擁有和公開所有三種方式。而 Open AI 表示,將為受歡迎的應用提供利潤分享。

很明顯,OpenAI 在這裡的發佈,並沒有希望普通用戶能夠通過自然語言創建出多麼復雜的應用,其中的想象空間,更重要的在於個人和企業能夠將自己的知識庫上傳到 OpenAI,一鍵構建專屬應用。

比如作為一個擁有貨運價格表的代理,可以將文件上傳到 OpenAI 後,一鍵部署出自己的詢價助理,這樣簡潔絲滑的應用部署,在之前還並不存在。而如果發佈最終能夠得到用戶認可的話,類似的應用也將能夠填充 OpenAI 的應用商店,使其成為各種信息的寶庫。

零代碼創建 AI Agent

如果你覺得上述的 0 代碼的 GPT 很酷,此次 OpenAI 也推出讓開發者更容易使用 OpenAI API 的開發方式——Assistants API。

Sam Altman 表示,市面上基於 API 構建 agent 的體驗很棒。比如,Shopify 的 Sidekick 可以讓用戶在平臺上采取行動,Discord 的 Clyde 可以讓管理員幫忙創建自定義人物,Snap 的 My AI 是一個自定義聊天機器人,可以添加到群聊中並提出建議。

但問題是,這些 agent 很難建立。有時需要幾個月的時間,由數十名工程師組成的團隊,處理很多事情才能使這種定制助手體驗。這些事情包括狀態管理(state management)、提示和上下文管理(prompt and context management)、擴展功能(extend capabilities)和檢索(retrievel)。

在 OpenAI 開發者大會上,這些事情被 API 化——OpenAI 推出 Assistants API,讓開發人員在他們的應用程序中構建“助手”。

使用 Assistants API,OpenAI 客戶可以構建一個具有特定指令、利用外部知識並可以調用 OpenAI生成式 AI模型和工具來執行任務的“助手”。像這樣的案例范圍包含,從基於自然語言的數據分析應用程序到編碼助手,甚至是人工智能驅動的假期規劃器。

Assistants API封裝的能力包括

持久的線程(persistent threads),人們不必弄清楚如何處理長的對話歷史;

內置的檢索(Retrieval),利用來自 OpenAI 模型外部的知識(例如公司員工提供的產品信息或文檔)來增強開發人員創建的助手;提供新的 Stateful API 管理上下文;

內置的代碼解釋器(Code Interpreter),可在沙盒執行環境中編寫和運行 Python 代碼。這一功能於 3 月份針對 ChatGPT 推出,可以生成圖形和圖表並處理文件,讓使用 Assistants API 創建的助手迭代運行代碼來解決代碼和數學問題;

改進的函數調用,使助手能夠調用開發人員定義的編程函數並將響應合並到他們的消息中。

Assistants API 處於測試階段,從今天開始可供所有開發人員使用。開發者可以前往 Assistants Playground 來嘗試 Assistants API 測試版,而無需編寫任何代碼。

Assistants API 被 OpenAI 視為幫助開發者在其應用程序中構建“類 agent 體驗”的第一步。有 Assistants API,構建 agent 應用將變得更容易。OpenAI 表示,隨著時間的推移,將會持續提高它們的能力。並且,未來計劃允許客戶提供自己的 copilot 工具,以補充其平臺上的 Code Interpreter、檢索組件和函數調用。

OpenAI 開發者大會上的產品升級,再次告訴人們,距離每個人都能有一個甚至多個專屬私人助理、使用自然語言就能開發軟件、還能像瀏覽應用一樣,付費/免費購買流行的私人助理,這樣的一個未來,正在加速向人們走來。

從 GPT-4 到 GPT-4 Turbo 和 GPT Store,OpenAI隻用半年多一點的時間。而在 6 個月之內,全球的科技和 AI 行業,已經是天上人間。


Sam Altman 總結發佈會亮點|OpenAI

當多模態、長文本輸入、更便宜、個性化……這些旨在和 OpenAI 大模型錯位競爭的特點,都被 OpenAI 搶先拿來自我革命;當 OpenAI 的產品在 B 端和 C 端都體現出強大的吸引力、並且還將利用 GPT Store 率先籠絡住全球AI開發者時,不知道全球的 AI 對手們的心情如何

但 OpenAI 的技術進步是令人興奮的,而團隊所采用的商業策略,又有著超出一般創業公司的成熟——我們目睹著一個行業的潮起,也可能正在見證一個巨頭的誕生。


相關推薦

2023-11-09

人徹夜未眠——全球科技圈都把目光聚焦在美國舊金山。短短45分鐘時間裡,OpenAICEO山姆・奧特曼向我們介紹迄今為止最強的大模型,和基於它的一系列應用,一切似乎就像當初ChatGPT一樣令人震撼。OpenAI在本周一的首個開發者日

2023-11-08

者大會正式開啟,創始人兼CEO山姆·奧特曼站在臺上,45分鐘的密集輸出,再次展示什麼叫“遙遙領先”。我們先簡單回顧一下這場發佈會的所有重點,其實無非就是三件事:一是技術能力:GPT-4 Turbo升級6大新能力,包括128K的上

2023-11-08

,早在今年三、四月份,就有過一輪AI 智能體的大爆發,短短半個月內,Camel 、BabyAGI、AutoGPT 、斯坦福西部世界小鎮如雨後春筍般冒出。據【自象限】解,在國內,AI Agents同樣是許多初創公司埋頭苦幹的項目,比如近期面壁智能

2023-11-07

開發者大會揭幕。OpenAI首席執行官山姆·奧特曼在接近45分鐘的開幕演講中,向全球開發者和ChatGPT用戶展示AI龍頭即將推出的一系列產品更新。(來源:OpenAI DevDay)在發佈會的開始,奧特曼簡短回顧公司過去一年的發展歷程,特

2023-11-20

科夫、阿爾特曼、穆拉提、佈羅克曼(圖源:Jessica Chou)短短兩天半,《矽谷風雲之年度OpenAI奪權大戲》已連更數集,包括但不限於《我被我一手搭建的董事會開除》、《“ChatGPT之父”加入AI失業大軍》、《陰謀論之GPT-4才是開

2024-05-01

而生成時長更長、效果更好的視頻。目前,Sora 能夠生成1分鐘的視頻,深圳市鼎盛方圓科技發展有限公司創始人黃鴻波表示,理論上來看,Sora 是能夠生成生成更長時間的視頻的,但其中的不確定性會更多,也會需要更高的算力

2023-06-16

這臺機器運行起來非常熱,它配備2000個風扇,可以在幾分鐘內把他所在的寬敞禮堂裡的空氣全部排走。黃仁勛走到他身後展示的實物大小圖像下,展示這臺機器令人生畏的規模。他把它比作成四頭大象。確實,看起來一點也不

2023-11-11

見。或許連OpenAI CEO山姆·阿爾特曼自己也沒有想到,隻是短短一年時間, OpenAI就成為全世界使用最廣泛的人工智能平臺之一,ChatGPT也成為全球AI領域被提及最多的產品。在OpenAI帶來的創新力大爆炸中,山姆·阿爾特曼被形容為“

2023-11-19

。彼時,站在講臺中心的正是ChatGPT之父阿爾特曼,他用45分鐘的時間講述GPT過去的一年,仿佛10年前黑暗的演講臺上,喬佈斯從容走出,下一個“蘋果時刻”來臨。然而一周後,當這場發佈會仍被無數人回味時,締造者卻退場。

2024-04-30

拉提供地圖數據服務,當時特斯拉還對應百度地圖數據,發佈全新的導航系統。並且就在上周百度舉行的Apollo智能汽車產品發佈會上,百度還宣佈百度地圖真車道級導航即將在特斯拉全球首發。如果雙方關於FSD的合作屬實,那麼

2024-03-06

在當地時間的周一,Anthropic發佈一組Claude3系列大模型,稱其功能在各種基準測試中均優於OpenAI的GPT4和Google的Gemini1.0Ultra。在模型的通用能力上,Anthropic稱Claude3系列“為廣泛的認知任務設定新的行業基準”,在分析和預測、細致

2023-02-25

從“YOU”到“ChatGPT”,隻有短短的17年。2006年,互聯網讓人人成為時代的主角,因此,TIME將“YOU”選為年度風雲人物。短短17年過去,時代發生重大轉變。如今,AI聊天機器人ChatGPT破勢而出。這意味著什麼?AI成為自己的主角,

2023-03-16

官方Twitter賬號發佈一篇文章,宣佈產品發佈的好消息。短短不到三個月之後,當OpenAI發佈新一代大型多模態模型GPT-4時,情況大有不同:OpenAI在Twitter、YouTube等平臺發佈宣傳短視頻、產品介紹短視頻,還由公司總裁兼聯合創始人

2023-11-16

北京時間周四凌晨1點,全球頂級技術大會微軟Ignite正式在西雅圖揭幕,微軟CEO薩蒂亞·納德拉進行接近1個小時的開幕演講,介紹AI龍頭取得的最新進步。納德拉表示,在本周的大會上,微軟又能拿出100多項有關AI的更新,但與過