當地時間周一,人工智能行業龍頭OpenAI的歷史首屆開發者大會揭幕。OpenAI首席執行官山姆·奧特曼在接近45分鐘的開幕演講中,向全球開發者和ChatGPT用戶展示AI龍頭即將推出的一系列產品更新。
(來源:OpenAI DevDay)
在發佈會的開始,奧特曼簡短回顧公司過去一年的發展歷程,特別提到“公司在今年3月發佈的GPT-4,至今仍是世界上能力最強的AI大模型”。時至今日,已經有200萬開發者正在使用OpenAI的API(應用程序接口),在全球各地提供多種多樣的服務;92%的財富500強公司正在使用OpenAI的產品搭建服務,而ChatGPT的周活用戶數也達到1億人。
GPT-4 Turbo模型登場
隨後便進入新品發佈時間,首先登場的是GPT-4 Turbo模型。
簡單來說,相較於全球股民都很熟悉的GPT-4,GPT-4 Turbo的進步主要體現在6個方面。
1、AI能夠理解更長的上下文對話長度(context length)。標準版GPT-4模型最多支持8192個token,此前的升級將其提高至最多3.2萬個token。而GPT-4 Turbo支持最高12.8萬個token,相當於一本標準大小的300頁紙質書所包含的文本量;奧特曼也表示,新模型在處理長文本情境下的準確度也有所提高;
2、給予開發者更多的控制權。新的模型允許開發者指示模型固定以特定形式返回有效JSON—JSON模式。同時開發者可以通過訪問seed參數和system_fingerprint響應字段,來實現“模型對每次請求都給出確定性的輸出”。
3、GPT-4對於現實世界的知識截止於2021年9月,GPT-4 Trubo的知識則截止於2023年4月。
4、多模態API來。文生圖模型DALL·E 3、具有視覺輸入能力的GPT-4 Trubo,以及新的聲音合成模型(TTS)都在今日進入API。OpenAI也在今天發佈新的語音識別模型Whisper V3,將在近期向開發者提供API。
5、繼向全球開發者開放GPT 3.5微調(Fine-tuning)後,OpenAI宣佈將向活躍開發者提供GPT-4微調的資格。對於開發細分行業的垂直AI應用而言,微調是必經的過程。對於這類開發者,OpenAI也推出定制化模型項目,幫助一些組織訓練針對特定領域的定制化GPT-4模型。奧特曼也表示,這件事情一開始並不會便宜。
6、OpenAI將所有GPT-4用戶的Token速率限制擴大一倍,開發者可以申請進一步提高速率。
與微軟、Adobe類似,OpenAI也引入“版權護盾”機制。在ChatGPT企業版用戶和API用戶遭到版權官司時,公司將會出面辯護,並支付因此產生的賠償責任。
在市場極為關註的定價方面,作為行業領先的大模型,GPT-4 Turbo的價格要遠低於GPT-4。其中輸入Token的價格隻有三分之一,而輸出Token的價格隻有一半。也就是說,輸入1000個Token的定價為1美分,而輸出1000個Token的定價為3美分。與此同時,GPT-3 Turbo 16K模型的價格也有所下調。
(新定價表,來源:OpenAI)
在新品發佈間隙,微軟CEO納德拉也來到現場,猛誇一頓OpenAI並再次強調“微軟深愛著OpenAI”。
ChatGPT也有更新
奧特曼宣佈,雖然今天是開發者大會,但OpenAI也忍不住對ChatGPT做出一些更新。
首先,從今天開始ChatGPT將使用剛剛發佈的GPT-4 Trubo模型。另外,針對用戶每次對話前都要選擇不同模式的困擾,GPT-4 Trubo也將迎來產品邏輯的更新,現在機器人能夠主動根據對話來適配對應的功能。
更新前⬇
更新後⬇
接下來本場活動的第二個重要產品登場——GPTs。用戶將能通過自定義指令、拓展(模型)的知識邊界和下達行動命令,來構建自己的GPT,並能對外發佈給全球更多的人使用。更重要的是,整個構建“自定義GPT”的過程也是通過自然語言對話形成的。
奧特曼也在現場演示如何通過聊天搭建一個GPT。他給GPT Builder的指令是“希望幫助創業者思考商業靈感並提供建議,然後‘拷問’他們為何公司發展得不夠快。”
隨後ChatGPT迅速搭建一個創業咨詢GPT,還順手生成一個Logo。
隨後奧特曼在屬性頁面中上傳一份他自己關於創業公司的演講稿,向這個用例提供額外的知識。至此,自定義用途的GPT初步搭建完成。用戶可以保存這個用例隻給自己使用,也能對外公開發佈。
既然說到“公開發佈”,OpenAI也順勢宣佈,將在本月晚些時候上線“GPT應用商店”。對於那些最熱門的GPT,公司還將分享一部分的營收,來推進GPT應用生態的進步。
Assistants API
最後是面向開發者的新品Assistants API。“助理API”是一個專門構建的人工智能,具有特定的指令,利用額外的知識,並能調用模型和工具來執行任務。新的助手API提供如代碼解釋器、檢索以及函數調用等功能,以處理此前開發者必須自己完成的諸多繁重工作。
OpenAI介紹稱,這個API的用例范圍非常靈活,例如基於自然語言的數據分析應用、編程助手、AI度假規劃器、語音控制DJ、智能視覺畫佈等等。
作為示例,OpenAI的首席開發者體驗官Romain Huet搭建一個“知曉整場開發者大會”的用例,並調用Whisper來實現語音輸入。
同時由於這個API可以聯網,所以Romain也在現場用語音指示AI隨機挑選5位現場觀眾,給他們的OpenAI賬戶裡各充值500美金。
作為本場活動的最後一個驚喜環節,Romain再一次向AI發出指令,給現場所有人的賬戶裡各打500美元。