蘋果公司發表四款開源新模型 有助於提高未來人工智能的準確性


蘋果公司已經公開分享四個開源模型,這些模型擁有更高的查詢準確性,有助於未來人工智能模型的開發。隨著科技行業在人工智能方面的不斷發展,蘋果公司也不斷提供更多關於其正在研發的技術的信息。在最新的公開版本中,蘋果發佈四款開源模型。

59424-121287-58271-118725-000-lead-Siri-and-Apple-Park-xl-xl.jpg

這些指導模型被稱為開源高效 LLMs 或 OpenELMs,托管在協作平臺 Hugging Face 上。Hugging Face 用於托管人工智能模型,以及對其進行訓練和與他人合作改進。

OpenELM 是指一個開源庫,它利用進化算法將多個大型語言模型 (LLM) 結合在一起。

這四個 OpenELM 模型采用"分層縮放策略",在變壓器機器學習模型的各層中分配參數,以提高精確度。

這些模型使用 CoreNet 庫進行預訓練。蘋果公司提供使用 2.7 億、4.5 億、11 億和 30 億個參數的預訓練和指令調整模型。

預訓練數據集由 Dolma v1.6 子集、RefinedWeb、重復 PILE 和 RedPajama 子集組合而成。這樣得到的數據集約有 1.8 萬億個標記。

在本周二發佈的一篇相關論文中,該項目的研究人員表示,大型語言模型的可重復性和透明度"對於推進開放式研究至關重要"。它還有助於確保結果的可信度,並允許對模型偏差和風險進行調查。

至於模型的準確性,據解釋,在使用 10 億個參數預算的情況下,OpenELM 比 OLMo 的準確性提高 2.36%,而所需的預訓練代幣數量僅為 OLMo 的一半。

模型和論文的作者包括 Sachin Mehta、Mohammad Hossein Sekhavat、Qingqing Cao、Maxwell Horton、Yanzi Jin、Chenfan Sun、Iman Mirzadeh、Mahyar Najibi、Dmitry Belenko、Peter Zatloukal 和 Mohammad Rastegari。

發佈這些模型的源代碼是蘋果公司宣傳其人工智能和機器學習發展成果的最新嘗試。

這並不是蘋果公司第一次公開發佈人工智能程序。今年10 月,蘋果分享一個名為 Ferret 的開源 LLM,它改進模型分析圖像的方式。

今年 4 月,Ferret 的新版本增加解析應用程序截圖中數據點的功能,並能大致解應用程序的功能。此外,還發佈關於生成式人工智能動畫工具和創建人工智能頭像的論文。預計 6 月份的 WWDC 將包括蘋果產品在人工智能方面的許多進展。


相關推薦

2023-11-09

靠性和安全性。站長之傢(ChinaZ.com) 11月9日 消息:近年來,人工智能和機器學習領域的最新進展使人們的生活變得更加便利。憑借其令人難以置信的能力,人工智能和機器學習正在涉足各個行業並解決問題。而機器學習的一個關鍵

2024-04-19

Meta發佈開源生成式人工智能模型Llama系列的最新產品:Llama3。或者,更準確地說,該公司已經開源新的Llama3系列中的兩個模型,其餘模型將在未來某個不確定的日期推出。Meta 稱,與上一代 Llama 模型 Llama 2 8B 和 Llama 2 70B 相比,

2023-11-13

說無疑是很不爽的體驗——這時候維基百科就顯示出它與人工智能的不同,盡管在反復的編輯中某些詞條自然存在部分爭議,但依照“N.P.V.O”的原則,關於事實陳述部分要比ChatGPT靠譜很多。本文來自微信公眾號:利維坦 (ID:l

2024-03-21

的生命。那麼,如何在全球范圍內進行可靠的洪水預報?人工智能(AI)模型或許大有可為。如今,來自 Google Research 洪水預測團隊的 Grey Nearing 及其同事開發的人工智能模型,通過利用現有的 5680 個測量儀進行訓練,可預測未測

2024-02-05

成為科學傢們試圖努力攻破的重要課題之一。當前,隨著人工智能(AI)大模型的不斷發展,大型 AI 氣象預測模型(Large AI Weather forecast Model,LWMs)已經成為中程天氣預測的關鍵組成部分,在上述極端天氣事件的預測中的表現要

2023-03-08

最近,OpenAI、微軟、Google等公司開發的人工智能(AI)搜索引擎占據大部分頭條,這些AI工具的出現似乎打算顛覆我們的生活和工作方式。近年來,人工智能在醫學上的應用也在逐步增多,尤其是在診斷疾病方面。現在越來越多

2023-02-25

公司所有員工每周用兩到四個小時幫助測試和改進其新的人工智能搜索聊天機器人Bard。就在Bard發佈前不久,微軟也剛剛發佈采用ChatGPT聊天機器人背後技術的新版必應搜索引擎,它允許用戶就幾乎任何話題進行多輪對話。然而,

2022-10-18

立大學研究生中心的一個研究小組已經開發出一種新型的人工智能模型,它可以顯著提高藥物開發過程的準確性並減少時間和成本。正如當地時間10月17日將發表在《Nature Machine Intelligence》上的一篇論文所描述的那樣,這個名為CO

2024-02-13

、醫療機構的研究人員在Nature上聯合提出一種全新的醫學人工智能范式,即“全科醫學人工智能”,可以靈活地編碼、整合和大規模解釋醫學領域的多模態數據,比如文本、成像、基因組學等。而GoogleResearch和GoogleDeepMind也曾共

2022-12-13

的人都有幫助。"幾周前,社區筆記得到一次更新,該公司聲稱這將有助於識別更多的"低質量"事實核查。更多撰寫這些無益註釋的貢獻者將失去意義,Twitter說,要求這些用戶重新獲得他們的"貢獻者"身份。算

2024-08-31

算法的準確性要求非常高。因此,許多汽車制造商和科技公司正在研究將純視覺系統與其他傳感器數據相結合的混合系統,以提高智能駕駛的整體性能和安全性。

2024-03-02

究人員解決活動檢測和說話者分離等問題。- 💡 提出的模型利用多模態數據集 MSCSG 數據集,包括音頻、視頻和 IMU 信號,以提高轉錄準確性。- 💡 通過整合各種技術來改善實時對話的轉錄準確性,包括目標說話者識別 / 定位、

2023-01-13

新的研究顯示,埃克森美孚公司以顯著的準確性預測全球氣溫的上升,即使它試圖淡化氣候變化的存在。它附帶令人震驚的數據可視化,用硬性數字說明埃克森美孚對它所制造的氣候危機有多解。關於埃克森美孚如何拒絕主流氣

2023-04-07

“風烏”基於多模態和多任務深度學習方法構建,由上海人工智能實驗室聯合中國科學技術大學、上海交通大學、南京信息工程大學、中國科學院大氣物理研究所及上海中心氣象臺發佈。實驗室領軍科學傢歐陽萬裡表示:“風烏