快科技4月2日消息,據媒體報道,蘋果公司近日宣佈,成功研發出一款前沿的人工智能系統ReALM(Reference Resolution As Language Modeling,即基於語言建模的參考解析)。
據悉,該系統具備卓越能力,能夠精準解析屏幕上模糊的內容,同時深入理解相關對話及背景環境,從而為用戶提供更為自然流暢的語音助手交互體驗。
ReALM系統通過運用大語言模型技術,巧妙地將識別屏幕視覺元素這一復雜任務轉化為純語言處理問題。這一創新轉換使得ReALM在性能上相較於傳統技術實現質的飛躍。
值得一提的是,ReALM的獨特之處在於其能夠重新構建屏幕內容。通過深入分析屏幕上的信息及其位置分佈,系統能夠生成精準的文本表示,這對於捕捉視覺佈局中的關鍵信息至關重要。
研究人員進一步展示將ReALM與專門針對內容指向優化的語言模型相結合的方法,結果顯示在執行相關任務時,ReALM的性能已超越業界翹楚GPT-4。
研究人員興奮地表示:我們對現有系統進行深度優化和顯著改進,使其在處理各種類型的內容指向任務時均表現出卓越性能。即便是我們的最小模型,也實現超過5%的性能提升;而大型模型的表現更是顯著超越GPT-4,令人矚目。”
長期以來,蘋果在創新領域更多扮演跟隨者的角色,然而隨著人工智能技術的迅猛發展,市場格局正發生深刻變革。如今,蘋果正積極迎接挑戰,努力在人工智能領域占據一席之地。
此外,備受矚目的全球開發者大會即將在6月盛大召開。屆時,蘋果預計將推出一系列創新成果,包括全新大語言模型框架、Apple GPT”聊天機器人及其生態系統中的其他AI功能。