大模型向下紮根深入行業,必須要破解高質量數據供給的挑戰。7月5日,2024年世界人工智能大會進入第二天,作為數據要素領域的主要技術服務商,螞蟻集團發佈“隱語Cloud”大模型密算平臺,通過軟硬件結合的可信隱私計算技術,在大模型托管和大模型推理等環節實現數據密態流轉,保護模型資產、數據安全和用戶隱私。
當下,高質量數據供給和安全流通,成為大模型進入垂直產業應用的首要挑戰。其一,行業大模型要獲得解決專業問題的能力,首先要經過數量充足、質量高的專業數據訓練。然而,專業數據往往分散在不同的機構、企業中,並且由於價值大、保密要求高,難以流動。此外,在企業、大模型廠商和用戶之間存在信任壁壘,企業擔心數據對外泄露,大模型廠商擔心模型資產安全,用戶擔心個人數據和隱私風險。
在發佈會現場,螞蟻密算CEO王磊介紹,“隱語Cloud”大模型密算平臺首批推出兩大服務,分別為大模型密態托管和大模型密態推理。大模型密態托管,指模型提供方可以將模型加密後托管在平臺上,一鍵完成雲上密態部署,保護模型資產不被泄漏和盜用;大模型密態推理,是指數據以密態形式完成推理,保護用戶交互時的數據安全、商業機密等。
此外,該平臺支持GPU在可信執行環境下進行計算,使得大模型推理在密態形式下的響應時間和使用效率與明文大模型接近,實現大規模商業可用。在安全保障上,該產品利用內存、磁盤加密等方法,實現用戶訪問的端到端加密和托管模型的跨域訪問控制。在易用性上,產品支持輕量化遠程認證,用戶在網頁訪問時就可以完成遠程認證,不需要額外的操作步驟。
當下,大模型在垂直行業應用時,許多企業通過私有化部署來應對數據安全挑戰,這不僅增加企業的運維和服務成本,也影響對外服務的效率和質量。對行業的發展來說,私有化方案不利於多方數據跨領域、跨行業高效融合,無法進一步激發大模型的能力。
據介紹,隱語Cloud”大模型密算平臺提供公有雲和專有雲交付方案,支持市面上主流的通用大模型。以公有雲為例,無論用戶重新構建新的垂直大模型,或者將已有的大模型重新部署在該平臺,隻需一鍵部署和接入,比如10分鐘即可完成高可用推理服務的發佈。在使用過程中,用戶按需獲取密態算力,即開即得。
王磊透露,隱語Cloud大模型密算平臺的服務,將逐步覆蓋到垂直大模型從構建到對外服務的全鏈路數據安全。“接下來,我們將為垂直大模型從預訓練、微調、評測、推理到用戶交互的全程提供密態計算服務,在大模型提供方、數據提供方、大模型使用方等之間實現數據可信安全流轉。平臺還將提供密態大模型開發所需的全鏈路工具,提供的服務包括密態檢索增強生成、密態提示詞、Agent流程編排等。”
螞蟻集團副總裁兼首席技術安全官、螞蟻密算董事長韋韜認為,數據供給決定大模型應用能力的上限,而隱私計算技術決定數據跨域供給的上限。當大模型從通用走向專業應用,從技術想象力走向產業的生產力,必須要解決高質量數據集稀缺與專業數據阻滯的挑戰,否則大模型作為“智力引擎”,隻會陷入空轉。今後,高價值數據要深度融合,一定需要以密態方式進行安全流轉。
韋韜表示,螞蟻集團從2016年開始探索隱私計算技術,能力涵蓋全棧可信技術、多方安全計算、聯邦學習、同態加密、差分隱私、機密計算等隱私計算全譜技術域。“我們希望聯合產業合作夥伴,把螞蟻集團多年來在密態計算技術上的探索和創新,以開源和產品化的形式對外開放,助力推動產業向前發展,為實體經濟和中小微企業創造新的價值,讓數據價值的流動像自來水一樣即開即用。”
目前,螞蟻可信隱私計算的核心技術已全部開源,包括“隱語”可信隱私計算框架、“星綻”可信執行環境操作系統Occlum等。此外,參與制定60多項國內外隱私計算技術標準,其中主導9項國際標準。螞蟻還與超過50所國內外高校緊密合作,並且與中國計算機學會聯合設立“隱私計算專項科研基金”。
今年5月底,螞蟻集團對外公佈以人工智能和數據要素技術為核心的科技戰略,隨後成立獨立運營的密態計算公司——浙江螞蟻密算科技有限公司,將提供密算相關的產品和服務,包括一套端到端的數據安全保障、一套軟硬件結合的計算加速解決方案和一個隱私計算雲服務平臺,推動數據安全可信的跨雲跨端低成本流通。