“今天,有大約200萬開發者在使用我們的API進行各種用例的開發。超過92%的財富500強公司正在使用我們的產品進行構建,而現在ChatGPT每周活躍用戶大約有1億。”北京時間11月7日凌晨,在OpenAI的首次開發者大會上,SamAltman公佈過去一年中OpenAI的驕人成績。
“今天,有大約200萬開發者在使用我們的API進行各種用例的開發。超過92%的財富500強公司正在使用我們的產品進行構建,而現在ChatGPT每周活躍用戶大約有1億。”
北京時間11月7日凌晨,在OpenAI的首次開發者大會上,Sam Altman公佈過去一年中OpenAI的驕人成績。
如會前流傳的消息,本次大會上推出ChatGPT的最新版本GPT-4 Turbo,以及眾多全新功能。更重要的是,OpenAI宣佈要圍繞GPT打造AI平臺,推出GPT Store,並提出GPTs的概念,用戶可以利用GPT Builder工具,創建自己的GPT。
從ChatGPT被比喻為AI的iPhone時刻,恐怕Sam Altman就已經把目標瞄準蘋果。不過,他的野心更大,不僅要把ChatGPT做成下一個iOS,還要進一步加強與用戶的綁定,讓每個用戶都有機會成為開發者。
王炸:GPT-4 Turbo
本次發佈的LLM(大語言模型)更新主要包括:
最新的GPT-4 Turbo,支持128k上下文窗口,且價格更低,輸出更快。
全新的Assistants API,使開發人員更容易構建自己的人工智能應用程序。
新的多模態功能,包括視覺、圖像創建(DALL·E 3)和文本轉語音(TTS)。
OpenAI開發者大會的發佈的重要更新
長上下文
長上下文正在成為百模大戰的“主戰場”。對比眾多新模型,GPT-4的32k token上下文窗口已不那麼出色。此次GPT-4 Turbo更新的上下文窗口達到128k,是GPT-4的四倍,且超過競對Anthropic此前推出的100k token的Claude 2。
Sam Altman在演示中稱128k token大約相當於300頁紙的文字量,英國版的《哈利·波特與魔法石》差不多就是300頁,指環王三部曲平均每本是400頁。
不過,GPT-4 Turbo的上下文長度也並非最長。一周前,百川智能發佈的Baichuan2-192K,上下文窗口長度為192K,能夠處理約35萬個漢字。
開發助手
OpenAI此次更新中,著重面向開發者推出Assistant API,使開發者能在應用中集成類似代理的AI體驗。
這個API允許AI助手執行具體任務,調用模型和工具,並處理一些復雜的編程和數據處理工作。它支持多種用途,如自然語言數據分析、編碼輔助、旅行規劃等。
助手API具有持久化線程功能,簡化狀態管理,並允許調用開發者定義的函數。此外,它還提供代碼解釋器和檢索工具,可在外部數據上運行和檢索信息。數據保護方面,開發者可自主管理其傳遞給API的數據。現在,開發者可以通過助手API遊樂場,無需編碼進行測試。
此外,OpenAI對函數調用進行更新,現在模型可以在單個消息中調用多個函數,並更準確地返回正確的函數參數。GPT-4 Turbo在遵循指令生成特定格式時表現更佳,並支持新的JSON模式以確保輸出有效的JSON對象。新增的API參數response_format允許模型輸出語法正確的JSON。此外,通過新的seed參數,模型可以產生可重現的輸出,有助於調試和編寫單元測試。OpenAI還計劃推出返回輸出令牌對數概率的功能,以便在構建“自動完成”等功能時使用。
知識更新
GPT-4的知識庫更新到2023年4月。目前ChatGPT中使用的GPT-4模型,已經將知識庫更新到2023年4月,不過GPT-3.5的知識庫仍然停留在2022年1月。
新的多模態模型
在多模態能力方面,GPT-4 Turbo的API將集成DALL-E3,以及文生語音模型TTS(text-to-speech)。
開發者可以通過API直接調用GPT-4 Turbo with vision中的DALL-E3模型,進行圖片識別和圖片生成。事實上,DALL·E 3上線之後,ChatGPT Plus用戶就已經可以在GPT-4模塊下調用DALL·E 3進行圖片創作,以及多模態的圖片識別。不過,這次是以API的形式,將多模態的能力開放給開發者。
此外,OpenAI還上線新的TTS文生語音功能。類似能力,在ChatGPT手機端也已經上線一段時間(不過目前實測中文還是有一點英語口語),此次也是針對開發者的API開放。目前TTS的語音包共有六種聲音可選,可以輸出Opus、AAC和FLAC三種格式,尚不支持自建聲音。
價格更低,輸出更快
“在模型持續的迭代中,我們的價格也在不斷下降。”Sam Altman介紹說,相比於GPT-4,GPT-4 Turbo的輸入價格隻有1/3,0.01美元每1000 token;輸出價格為0.03美元每 1000 token,隻有原來的1/2。而內容生成的速度,提高2倍。
又一個iPhone時刻:GPT Store
在ChatGPT插件上線的時候,就有很多人將其比喻為Android市場或是iOS的App Store。如今,OpenAI真的推出AI版本的App Store——GPT Store。
用戶可以直接創建ChatGPT的自定義版本,在開發者大會現場,兩位OpenAI工作人員現場演示GPT的構建方法。
OpenAI工作人員Jessica shay現場演示利用GPT Builder構建一個能與行程表互動的 GPTs。並以對話的形式命令 GPT 給 Sam Altman 發信息, Altman也在現場接收到這條信息。
另一個更加專業的演示則是OpenAI 的工作人員現場演示Assistants API的用法:它不僅能列出巴黎旅遊建議,還能在地圖上將計劃中提到的地點按類別標記出來。
Sam Altman表示OpenAI 將會在本月底上線 GPT Store,開發者可以通過GPT Store分享、發佈自己的 GPTs。此外,GPT Store產生的收入OpenAI也將按一定比例與開發者分成,不過具體的分配方案還尚未公開。
關於錢和微軟
在現場的Assistants API演示過程中,OpenAI工作人員開放一個現場抽獎,第一波抽獎是隨機選5個到場工程師每人發500美元的開發者額度。第二波則直接給到場的900多名軟件開發人員及參會嘉賓每人發500美元額度。
看似“撒幣”的行為,其實對於OpenAI來說,也沒有特別大方,因為API額度消耗的速度對於正常開發者來說,實在是太快。多位開發者曾在OpenAI社區中表達OpenAI發放的120美元的開發者試用優惠額度很快就會用光。
開發者zolika84在測試語音識別whisper-api時,90分鐘就用掉120美元額度
過去半年中,OpenAI的估值水漲船高,總融資超過140億美元,但OpenAI的資金消耗速度驚人。
一方面,OpenAI需要支付大量的算力和研發成本;另一方面,還要為未來不確定的法律問題做準備。
本次大會,OpenAI推出copyright shield功能,用於保護用戶不受到版權問題困擾,不光從技術上規避版權風險,當用戶遇到版權問題時OpenAI也會協助解決。
過去幾個月中,OpenAI一直被美國的眾多版權所有者聯合維權,多傢出版集團都在向OpenAI伸手要錢。在版權問題方面,未來的商業化推廣道路需要有龐大的資金支持。在美國的法律環境下,要推出這樣一項服務,OpenAI大概率也已經盤算好敗訴後的退路。
說到錢,就不得不提到OpenAI一直以來的大金主:微軟。坊間一直流傳著兩傢不合的傳聞。Sam Altman的演講中,隻邀請微軟CEO Satya Nadella一個嘉賓,似乎是在向外界證明OpenAI和微軟的無間合作。
在演講中,Sam Altman直白地問Satya Nadella:微軟和OpenAI的合作關系怎麼樣?
Satya Nadella幽默地回答說:“事實上,我記得你第一次向我伸出手時說,‘嘿,你有一些 Azure 積分嗎’,比起那時,我們已經取得很大的進步。”
微軟始終是基礎設施提供者,賺的是基礎設施的錢。Satya Nadella反復強調:“我們的首要任務是構建最好的系統,以便你可以構建最好的模型,然後將其全部提供給開發人員。”
不過,Satya Nadella並沒有否認微軟開發團隊在AI方面的研究工作,他表示:“我們自己也是開發者,我們也在構建產品。”