上周,OpenAI創始人阿爾特曼(SamAltman)確認,現階段並沒有在訓練GPT-5,“隻是在GPT-4的基礎上進行更多的工作”。“更多的工作”有哪些?佈局移動端或是重要一環。
其公司招聘頁顯示,OpenAI正招募ChatGPT移動終端工程經理,“我們正在尋找一位經驗豐富的工程師來幫助建立和領導ChatGPT移動團隊。”該領導崗位的年薪在30萬美元至50萬美元間,還包括“慷慨”的股權贈與和員工福利。OpenAI的移動端佈局跨iOS和Android,將招募Android軟件工程師和iOS軟件工程師等。
圖源:OpenAI官網
此前,ChatGPT已經試水移動端。微軟於2月份宣佈,iOS和Android端的必應搜索和Edge瀏覽器均已接入ChatGPT。
ChatGPT登陸移動端無疑有利於觸達更多用戶。正如微軟所說,“如今有64%的搜索都發生在手機上。” 據調研機構Gartner統計,2022年全球電腦出貨2.862億臺,手機出貨12.8億部。
另一方面,移動設備廠商也有意引入AI應用為硬件產品增加亮點。據消息,三星電子考慮將其設備上的默認搜索引擎由Google改為必應。三星是目前全球出貨量第一的手機廠商,據估計,Google與三星的合同關系到前者近30億美元的年收入。
不過,以ChatGPT為代表的大模型應用登陸移動端將面臨計算資源、網絡資源、電量、儲存空間和信息安全受限等技術問題。
以大模型的計算需求為例,GPT等模型龐大且計算資源要求高,而手機上沒有用來加速AI運算的專業GPU,計算速度遠不及電腦,且在移動端運行AI模型需要的大量計算也會迅速耗盡設備電量。
產業端已著手解決這些技術難題,高通、華為致力於實現 AI 大模型在終端的輕量化部署,Google、騰訊、百度等已將模型壓縮技術緊密結合移動端模型部署框架/工具。
3月2日,高通在MWC2023大會發佈全球首個運行在Android手機上的Stable Diffusion終端側演示,Stable Diffusion模型參數超過10億,高通利用其AI軟件棧對模型進行量化、編譯和硬件加速優化,使其成功在搭載第二代驍龍8移動平臺的手機上運行。
華為新一代P60系列手機將於5月上線智慧搜圖功能,該功能通過對模型進行小型化處理,實現其在端側輕量化應用。
Google在2018年推出MLKit,核心功能Learn2Compress模型壓縮技術結合網絡剪枝、量化以及知識蒸餾三項技術,可實現在CIFAR-10圖像分類測試任務中生成較NASNet尺寸縮小94倍的輕量化模型,且仍保持90%以上精度。
2018年騰訊推出全球首款自動化深度學習模型壓縮框架PocketFlow,2022年百度開源的文心ERNIE-Tiny在線蒸餾方案可得到參數規模僅為原模型0.02%且效果相當的輕量級模型。
華泰證券分析師黃樂平認為,模型壓縮技術可在保有大模型原有性能和精度基本不變前提下降低對推理算力的需求,是實現AI大模型在邊/端部署的核心技術。伴隨模型壓縮技術發展,AI將加速與終端設備融合應用。