去年11月底,OpenAI發佈ChatGPT人機對話交互模型,ChatGPT可以回答連續性問題,可謂上知天文、下曉地理”,上線5天,就收獲100萬用戶。
據解,ChatGPT是GPT迭代出的第3.5個版本,2018年GPT-1誕生,到2022年,OpenAI為給GPT-4收集用戶反饋,而發佈GPT-3.5,也就是如今的ChatGPT。
微軟的AI大模型及強大算力是助力OpenAI的關鍵,OpenAI曾為讓GPT-3的表現更接近人類,用45TB的數據量、近1萬億個單詞來訓練它,大概是1351萬本牛津詞典。
大模型及其高算力對應的是高昂的資金消耗,ChatGPT一次運算就要花費450萬美元,據美國《財富》雜志報道,2022年,OpenAI公司凈虧損總額為5.45億美元。
此外,ChatGPT測算生成一條信息的成本在1.3美分左右,是目前傳統搜索引擎的3到4倍,單次搜索成本過於高昂。
這樣高的研發門檻,註定目前主流的大模型多由大企業,或是背靠大企業的研究機構掌握,並且成為相關企業的護城河”。
模型是AI的靈魂,參數量越大,模型越復雜,做出來的預測就越準確。如今業界主流的AI生成類工具的大模型都是千億級、萬億級參數量的水平。
這些AI生成類工具可以學習各行各業的各類數據,除可以給出相較於小模型更準確的預測結果外,它也展現出驚人的泛化能力和遷移能力,產出的內容質量更高、更智能。