對於AI行業從業者來說,剛剛可能是一夜未眠。北京時間11月7日凌晨,美國人工智能公司OpenAI的開發者大會正式開啟,創始人SamAltman在臺上和同事,隻用45分鐘時間,就“轟”出團隊最新的成果GPT-4Turbo,後者不僅更快、有更長的上下文、而且更好的控制。
同時,OpenAI 下調 API 的價格近 3 倍,降到 1000 輸入/美分,讓在場開發者歡呼不已。
當然,更重要的是,OpenAI 推出“GPTs”——讓人們能用自然語言構建定制化 GPT,然後,你猜到——可以把 GPT 上傳到即將發佈的“GPT Store”!
如果說 GPT-4 Turbo 是更好用的“iPhone”,GPT Store 則可能是讓 OpenAI成為“蘋果”一樣的巨頭的重要一步。
當競爭對手們依然在“AI 煉丹”時,OpenAI 已經開始構建起一個看起來相當宏偉的生態。
GPT-4 Turbo,更快,更省錢
發佈會一開始,Sam Altman 就宣佈 GPT-4 的一次大升級,推出 GPT-4 Turbo,同步在 ChatGPT 和 API 版本推出。
Sam Altman 表示團隊一直在征求開發者的建議,對開發者關註的問題做六大升級,分別是更長的上下文長度、更強的控制、模型的知識升級、多模態、模型微調定制和更高的速率限制。
其中前四條主要關於新模型的性能的提升,而後兩點則主要針對企業開發者的痛點。在提升性能的同時,OpenAI 還宣佈 API 價格的下調,可謂“加量不加價”。
Sam Altman 公佈 GPT 的六大升級|OpenAI
六大升級中,第一,就是上下文長度。
OpenAI 原本提供的最長的上下文長度為 32k,而此次,GPT-4 Turbo 直接將上下文長度提升至 128k,一舉超過競爭對手 Anthropic 的 100k 上下文長度。
128k 的上下文大概是什麼概念?大概約等於 300 頁標準大小的書所涵蓋的文字量。除能夠容納更長上下文外,Sam 還表示,新模型還能夠在更長的上下文中,保持更連貫和準確。
第二,是為開發者提供幾項更強的控制手段,以更好地進行 API和函數調用。
首先,新模型提供一個 JSON Mode,可以保證模型以特定 JSON 方式提供回答,調用 API 時也更加方便。
另外,新模型還允許同時調用多個函數,同時引入 seed parameter,在需要的時候,可以確保模型能夠返回固定輸出。接下來幾周,模型還將增加新功能,讓開發者能看到 log probs。
第三,則是模型內部和外部知識庫的升級。
ChatGPT 橫空出世大概一年後,GPT 的知識庫終於更新到 2023 年 4 月。Sam Altman 承諾未來還將繼續更新其知識庫,不使其落伍。“對於 GPT 的知識停留在 2021 年,我們和你們一樣,甚至比你們更惱火。”Sam Altman 表示。
GPT 內部知識庫終於升級到 2023 年 4 月|OpenAI
除內部知識庫的升級,GPT-4 Turbo 也升級外部知識庫的更新方式,現在可以上傳外部數據庫或文件,來為 GPT-4 Turbo 提供外部知識庫的支持。
第四,或許是最不讓人意外的,多模態。
新模型支持 OpenAI 的視覺模型 DALL·E 3,還支持新的文本到語音模型——開發者可以從六種預設聲音中選擇所需的聲音。
多模態成為 GPT 的內置功能|OpenAI
GPT-4 Turbo 現在可以以圖生圖。同時,在圖像問題上,目前 OpenAI 推出防止濫用的安全系統。OpenAI 還表示,它將為所有客戶提供牽涉到的版權問題的法律費用。
在語音系統中,OpenAI 表示,目前的語音模型遠超市場上的同類,並宣佈開源語音識別模型 Whisper V3。
第五,模型微調與定制。
8 月,OpenAI 曾經發佈過 GPT-3.5 Turbo 的微調服務。當時,有早期測試表明,經過微調的 GPT-3.5 Turbo 版本在某些任務中甚至可以超越 GPT-4,不過定價相對較高。
而此次,Sam 宣佈 GPT-3.5 Turbo 16k 的版本目前也可以進行微調的定制,且價格將比前一代更低。GPT-4 的微調定制也在申請中。
同時,OpenAI 也開始接受單個企業的模型定制。“包括修改模型訓練過程的每一步,進行額外的特定領域的預訓練,針對特定領域的後訓練等等。”Sam 表示。同時他表示,OpenAI 沒有辦法做很多這樣的模型定制,而且價格不會便宜。
第六,也是最後一點,是更高的速率限制。
GPT-4 用戶,發佈會後馬上可以享受到每分鐘的速率限制翻倍的體驗。同時,如果不夠滿意,還可以進一步通過 API 賬戶,申請進一步提升速率限制。
六大升級以外,是 API 體系的全線降價。
此次新發佈的 GPT-4 Turbo,輸入方面比 GPT-4 降價 3 倍,而輸出方面降價 2 倍,OpenAI 表示,總體使用上降價大概 2.75 倍。
新模型的價格是每千輸入 token 1 美分,而每千輸出 token 3 美分。降價的 API 迎來現場開發者的歡呼。
Sam 還表示,在優先解決價格之後,下一個重點解決的問題將是速度問題,很快,開發者們就會發現 GPT-4 Turbo 將變快很多。
GPT Store 來!
早在 5 月,OpenAI 就開放插件系統,首批上線 70 個大模型相關的應用,領域包括猜詞、翻譯、查找股票數據等等。
GPT Store 風格都非常“App Store”|OpenAI
當時,該功能被寄予厚望,不少媒體將其類比於蘋果的 App Store 時刻,認為它將改變大模型應用的生態。不過雖然後期插件不斷增加,但插件系統卻遠遠沒有達到蘋果應用商店的影響力。
而此次發佈會上,OpenAI 則重新梳理其應用商店的體系,並將其擴大到一個全新的范疇——人人都能通過自然語言創建基於自己的知識庫的 AIAgent,加入 OpenAI 的應用商店,並獲得分成。
OpenAI 此次發佈的應用,不再稱為插件,而選擇一個相對比較奇怪的名字,GPT。而整體的應用商店,名字叫做 GPT Store,將在本月後期正式推出。
按照 Sam Altman 的說法,每一個 GPT 像是 ChatGPT 的一個為特殊目的而做出的定制版本。
OpenAI 的工作人員嘗試讓 ChatGPT 管理自己的生活|OpenAI
為突出新的 GPT 應用,ChatGPT 整個頁面將有小幅度的調整。左上角除 ChatGPT,下面的應用,就是此次推出的 GPT 應用。
在演示中,可以看到,較為復雜的插件——比如曾經在 OpenAI 上線插件系統時第一批進入插件系統的 Zapier,仍然存在於目前的應用商店中,而且仍然可能是未來應用商店裡很重要的一批應用。
演示中,OpenAI 的 Jessica Shay,就利用 Zapier 鏈接自己的日歷和手機短信,通過與 Zapier 這個應用聊天的方式,直接安排自己的日程,並通知同事。
不過,Zapier 的功能雖然強大,這樣的應用並不是此次發佈的重點。據 Glassdoor 數據顯示,Zapier 公司擁有 500-1000 名員工,而財富網站報道,Zapier 估值已達 50 億美金。指望這樣的應用來填充 OpenAI 的羽翼未豐的應用商店,使其成為一個豐富的生態顯然不太現實。
因此,此次發佈中,OpenAI 推出一個重磅發佈:讓不懂代碼的人也能輕松定義一個 GPT。
Sam Altman 為此進行現場展示。
“在 YC 工作過很多年,我總是遇到開發者向我咨詢商業意見。”Sam Altman 講到,“我一直想,如果有一天有個機器人能幫我回答這些問題就好。”
接著,Sam Altman 打開 GPT Builder,先打上一段對這個 GPT 的定義,類似於幫助初創公司的創始人思考他們的業務創意並獲得建議,接著,在對話中,GPT Builder 自己生成這個 GPT 的名字、圖標,並通過與 Sam 對話的形式,詢問 Sam 是否要對對生成的名字和圖標等進行調整。
Sam Altman 正在創建一個“創業導師 GPT”|OpenAI
接下來,GPT Builder 主動向他詢問這個應用該如何與用戶交互,Sam 表示可以從我的過往演講中選擇合適且有建設性的回答,然後上傳一段自己過往的演講。
即使加上講解,整個應用也在三分鐘內就完成。訪問這個 GPT 的人,會收到 GPT 自動生成的對話開頭,可以與這個 GPT 對話咨詢創業相關的內容,而得到的,將是一個類似於 Sam Altman 本人的回答。
Sam 表示,創建者還可以進一步為 GPT 增加 action(動作)。
創建一個這樣的 GPT,本質上,用戶能夠定制的功能其實並不多:指令(預設的 prompt),外設的知識庫和動作。但是,能把三者絲滑地結合起來,讓一個不懂代碼的人也能更簡單地創建應用,確實是此次 Open AI的創舉。
GPT 發佈後,應用可以選擇私有,專屬企業擁有和公開所有三種方式。而 Open AI 表示,將為受歡迎的應用提供利潤分享。
很明顯,OpenAI 在這裡的發佈,並沒有希望普通用戶能夠通過自然語言創建出多麼復雜的應用,其中的想象空間,更重要的在於個人和企業能夠將自己的知識庫上傳到 OpenAI,一鍵構建專屬應用。
比如作為一個擁有貨運價格表的代理,可以將文件上傳到 OpenAI 後,一鍵部署出自己的詢價助理,這樣簡潔絲滑的應用部署,在之前還並不存在。而如果發佈最終能夠得到用戶認可的話,類似的應用也將能夠填充 OpenAI 的應用商店,使其成為各種信息的寶庫。
零代碼創建 AI Agent
如果你覺得上述的 0 代碼的 GPT 很酷,此次 OpenAI 也推出讓開發者更容易使用 OpenAI API 的開發方式——Assistants API。
Sam Altman 表示,市面上基於 API 構建 agent 的體驗很棒。比如,Shopify 的 Sidekick 可以讓用戶在平臺上采取行動,Discord 的 Clyde 可以讓管理員幫忙創建自定義人物,Snap 的 My AI 是一個自定義聊天機器人,可以添加到群聊中並提出建議。
但問題是,這些 agent 很難建立。有時需要幾個月的時間,由數十名工程師組成的團隊,處理很多事情才能使這種定制助手體驗。這些事情包括狀態管理(state management)、提示和上下文管理(prompt and context management)、擴展功能(extend capabilities)和檢索(retrievel)。
在 OpenAI 開發者大會上,這些事情被 API 化——OpenAI 推出 Assistants API,讓開發人員在他們的應用程序中構建“助手”。
使用 Assistants API,OpenAI 客戶可以構建一個具有特定指令、利用外部知識並可以調用 OpenAI生成式 AI模型和工具來執行任務的“助手”。像這樣的案例范圍包含,從基於自然語言的數據分析應用程序到編碼助手,甚至是人工智能驅動的假期規劃器。
Assistants API封裝的能力包括:
持久的線程(persistent threads),人們不必弄清楚如何處理長的對話歷史;
內置的檢索(Retrieval),利用來自 OpenAI 模型外部的知識(例如公司員工提供的產品信息或文檔)來增強開發人員創建的助手;提供新的 Stateful API 管理上下文;
內置的代碼解釋器(Code Interpreter),可在沙盒執行環境中編寫和運行 Python 代碼。這一功能於 3 月份針對 ChatGPT 推出,可以生成圖形和圖表並處理文件,讓使用 Assistants API 創建的助手迭代運行代碼來解決代碼和數學問題;
改進的函數調用,使助手能夠調用開發人員定義的編程函數並將響應合並到他們的消息中。
Assistants API 處於測試階段,從今天開始可供所有開發人員使用。開發者可以前往 Assistants Playground 來嘗試 Assistants API 測試版,而無需編寫任何代碼。
Assistants API 被 OpenAI 視為幫助開發者在其應用程序中構建“類 agent 體驗”的第一步。有 Assistants API,構建 agent 應用將變得更容易。OpenAI 表示,隨著時間的推移,將會持續提高它們的能力。並且,未來計劃允許客戶提供自己的 copilot 工具,以補充其平臺上的 Code Interpreter、檢索組件和函數調用。
OpenAI 開發者大會上的產品升級,再次告訴人們,距離每個人都能有一個甚至多個專屬私人助理、使用自然語言就能開發軟件、還能像瀏覽應用一樣,付費/免費購買流行的私人助理,這樣的一個未來,正在加速向人們走來。
從 GPT-4 到 GPT-4 Turbo 和 GPT Store,OpenAI隻用半年多一點的時間。而在 6 個月之內,全球的科技和 AI 行業,已經是天上人間。
Sam Altman 總結發佈會亮點|OpenAI
當多模態、長文本輸入、更便宜、個性化……這些旨在和 OpenAI 大模型錯位競爭的特點,都被 OpenAI 搶先拿來自我革命;當 OpenAI 的產品在 B 端和 C 端都體現出強大的吸引力、並且還將利用 GPT Store 率先籠絡住全球AI開發者時,不知道全球的 AI 對手們的心情如何。
但 OpenAI 的技術進步是令人興奮的,而團隊所采用的商業策略,又有著超出一般創業公司的成熟——我們目睹著一個行業的潮起,也可能正在見證一個巨頭的誕生。