原本小雷還以為“2023年是屬於元宇宙的一年”,實在沒想到以ChatGPT為代表的AI技術能在這麼短的時間內搶走元宇宙的風頭,成為2023年的技術關鍵詞。從OpenAI到搜索引擎、從繪圖工具到遊戲公司,幾乎所有“稍微出名點”軟件企業都在今年推出自己的自然語音AI對話模型。
但可惜的是,本應“造福所有人”的AI技術,卻不是每個人都用得上。比如有的AI模型嚴格限制使用者的IP地址,有的AI模型動不動就會封禁某個區域的用戶賬號,相比之下那些“資源有限”要求排隊抽簽領取測試資格的AI模型都變得那麼的平易近人。
當然,有使用門檻就意味著有信息差,也意味著有人可以用這個信息差“大賺一筆”:在Google Play、App Store甚至是微信小程序平臺,我們可以找到各式各樣的AI App。他們有些調用的是OpenAI給出的免費接口,有些則直接掛羊頭賣狗肉,用貨不對本的低級AI模型來糊弄用戶。但有一點這些App倒是表現出驚人的一致性:他們要麼全是廣告,要麼向用戶收費。
不過這些App的好日子馬上就要結束。
前段時間,推出大量成功AI模型的OpenAI更新招聘職位列表,開始尋找“移動工程師”,簡單來說就是正在組建移動平臺上的AI團隊。沒錯,OpenAI終於要對移動互聯網生態下手。
01.姍姍來遲的AI移動端
盡管OpenAI這才開始組建移動團隊,其他幾大AI平臺行業也都不約而同地選擇瀏覽器(網頁端)作為自己的主要載體,但從App Store、Google Play等平臺的搜索量以及第三方App的下載量來看,移動端AI顯然有著極為廣闊的市場前景:
比如文心一言才發佈沒多久,在App Store上就出現很多“第三方文心一言”App。這些App從LOGO到文案介紹都和文心一言別無二致,再配上有模有樣的圖片展示,讓很多網友們以為,這就是百度官方推出的文心一言App。
雖然小雷不建議大傢使用這一類“第三方AI App”,但從下載量來看,確實有不少人對這種手機AI App有迫切的需求。不過話又說回來,為何各大AI模型都還隻提供瀏覽器的訪問入口?在移動平臺上部署AI,真就這麼難嗎?
從開發者的角度看,“將AI模型帶到移動平臺”具體可以分為兩種情況:隻在本地部署前端,模型放在遠端的“在線模型”以及將整個AI模型部署在移動設備上的本地模型。
圖片來源:OpenAI
我們先說第一種,所謂“隻有前端在本地”這個方案其實已經非常成熟,成熟到無數“第三方AI App”都已經實現這個需求。簡單來說,隻部署前端指的是用戶手機上安裝的App隻負責用戶界面等軟件交互,實際上所有的數據都通過AI模型的API發送到對應的遠端服務器中。舉個不太恰當的例子;用戶安裝在手機裡的App隻不過是一個外賣軟件,實際炒菜的是外面的餐廳。至於最終炒菜的餐廳是“麗晶飯店”還是“麗晶蒼蠅館”,用戶並不知悉。
在這裡小雷也必須澄清一點,這類隻提供前端的第三方App並非都是“偷蒙拐騙”的App,有些App確實能解決OpenAI的ChatGPT在使用上的不便。如果大傢有使用過ChatGPT,應該對它復雜的訪問環境要求和煩瑣的登錄驗證流程有印象。即使小雷平時都是通過Google直接登錄,但反復的驗證確實也非常麻煩。
而有些第三方App就在本地重寫ChatGPT的交互,優化原本使用瀏覽器時的不便。這類App通常需要用戶自己在OpenAI的控制板中生成自己端口的API(AI ID)並添加到App中。
可能有人覺得這類App技術技術含量低,但至少從OpenAI招聘啟事來看,他們正在組建的移動App團隊,采取的也是這種方案。對於采用這種方案的App來說,它的難點主要在於如何把一個有潛力成為國民級App的交互界面設計得更人性化,而不是像某個真國民級App那樣讓全國人民教產品經理做軟件。
換句話說,這種App做起來並不難。但作為對比,采用第二種方案開發的App,它的工程難度高可不止一點半點。
02.移動AI之難,難於上青天
從技術的角度看,完全在移動平臺上部署AI模型背後的技術難點可以分為五個部分:計算資源限制、網絡資源限制、電量限制、儲存空間限制和信息安全限制。
一般來說移動設備的計算資源通常有限,而深度學習模型需要大量的計算資源。因此在移動平臺上使用AI的用戶一般會使用專門為移動設備設計的硬件來提高計算速度,比如筆記本電腦就會配備更適合AI加速的專業顯卡。
但很顯然手機上沒有用來加速AI運算的專業GPU,甚至在大多數手機移動平臺上,和AI最沾邊的不是神經網絡單元NPU就是用來處理相機圖像信號的ISP。當然,開發者也可以調整AI模型的邏輯,讓AI主動適應移動平臺上並不充裕的計算資源。隻不過出來的效果可能就隻有Siri的級別。
網絡資源限制聽起來有些矛盾,畢竟我們討論的是部署在移動設備本地的AI模型。但如果大傢有試過在本體部署AI模型,應該明白不斷更新的網絡資源對AI模型的重要性。
電量限制和存儲空間無需多講——深度學習模型需要進行大量的計算,這會導致移動設備的電量迅速耗盡,這對於本上就不以續航見長的智能手機來說則更是要命。另外在計算機科學領域有一句非常著名的話叫“空間換時間”,簡單來說就是算法的“空間復雜度”和“時間復雜度”通常無法兩全——想要在手機上部署並維持一個好用的AI模型?OpenAI你問過手機裡那一個文件保存5份還會過期的國民級App嗎?
信息安全限制聽起來很復雜,但是實際上非常簡單:在移動設備上運行AI模型需要使用大量的用戶數據,而手機這個載體記錄的個人數據已經遠遠超過其他個人電子設備。我們該如何保證AI拿到所有信息都是我們“想讓AI知道”的呢?
03.我們需要怎樣的移動AI?
雖然讓AI登陸手機背後有無數的難點,但作為一個AI模型用戶,我不得不承認AI技術的加入將對整個手機行業帶來天翻地覆的變化,甚至有可能打破iOS與Android之間“一超多強”的格局。
一旦AI模型登陸手機平臺,首先可以肯定的是上遊SoC供應商會積極改變產品策略,大幅提升SoC中用於AI運算的NPU數量和性能。AI也不再是我們評判手機拍攝表現時的指標,而是成為一個通用的綜合能力指標,甚至跑分軟件都會爭相加入對AI算力的測試環節。
而在用戶層面,AI技術的加入也將解決一些過去手機中那些有大量數據,但因算力不足而無法解決的問題。比如用AI學習用戶的臉部變化,從而提供更安全的口罩人臉解鎖或聲紋解鎖,或者利用AI學習用戶的使用習慣,從而在用戶橫著掏手機時精確判斷用戶意圖並打開相機自動拍攝。針對采用曲面屏的手機,AI的加入可以根據用戶拿手機的方式提供更智能的邊緣防誤觸策略。
至於AI在相機領域的應用更是一絕:在AI的幫助下:某些手機品牌可以跳過拍照的步驟,直接“增強”一張月亮照片出來。實際上,對智能手機行業來說“AI”並不是陌生的詞匯,甚至早在七八年前,就已經有手機廠商宣佈會借助AI能力對手機體驗進行優化,而發展至今AI也依然潛藏在我們的手機裡。
但我們需要認識到的是,ChatGPT技術發展的速度、所展現的能力遠不是智能手機上那種“增強AI”可比的,如果類似的大模型AI真的深入到智能手機中,說不定直接會讓智能手機變成一個全新的品類。
但如果OpenAI隻想打造一個適用於移動端的App,那麼手機廠商暫時還不用過多擔心,甚至可以嘗試和OpenAI合作說服他們開放接口,好讓這種AI能力接入到手機的各個應用層面之中。
當然,AI模型的加入也會為手機帶來真正智能化的語音助手,而當大型AI模型真正在用戶手機上部署時,Siri也應該擺脫“人工智障”的外號吧。隻是又有多少iPhone存得下一個完整的AI模型呢?
但願AI時代沒有64GB的iPhone。