微軟推出其規模最小的人工智能模型 Phi-3


微軟推出其輕量級人工智能模型Phi-3Mini的下一個版本,這是該公司計劃發佈的三款小型模型中的第一款。Phi-3Mini可測量38億個參數,其訓練數據集比GPT-4等大型語言模型要小。它現在可在Azure、HuggingFace和Ollama上使用。微軟計劃發佈Phi-3Small(7B參數)和Phi-3Medium(14B參數)。參數指的是模型能理解多少復雜指令。

pasted image 0.png

該公司於 12 月發佈 Phi-2,其性能與 Llama 2 等更大的型號不相上下。微軟表示,Phi-3 的性能比前一版本更好,其響應速度接近比它大 10 倍的機型。

微軟Azure人工智能平臺公司副總裁埃裡克-博伊德(Eric Boyd)介紹說,Phi-3 Mini的性能與GPT-3.5等LLM不相上下,"隻是外形尺寸更小而已"。

與體積較大的同類,小型人工智能模型的運行成本通常更低,在手機和筆記本電腦等個人。據 The Information今年早些時候報道,微軟正在組建一個專門研究輕量級人工智能模型的團隊。 除 Phi,該公司還建立一個專註於解決數學問題的模型Orca-Math。

Microsoft-Phi-3-1200x847.webp

微軟的競爭對手也有自己的小型人工智能模型,它們大多針對文檔摘要或編碼輔助等較簡單的任務。Google的 Gemma 2B 和 7B適合簡單的聊天機器人和語言相關工作。Anthropic 的 Claude 3 Haiku可以閱讀帶圖表的高密度研究論文並快速總結,而Meta 最近發佈的 Llama 3 8B可能會用於一些聊天機器人和編碼輔助工作。

博伊德說,開發人員用"課程"來訓練 Phi-3。他們的靈感來自於兒童是如何從睡前故事、單詞較簡單的書籍以及談論較大主題的句子結構中學習的。

Phi-3 隻是在前幾個迭代學習的基礎上更進一步。Phi-1 專註於編碼,Phi-2 開始學習推理,而 Phi-3 則更擅長編碼和推理。雖然Phi-3系列模型知道一些常識,但它在廣度上無法擊敗GPT-4或其他LLM--從一個在整個互聯網上接受過訓練的LLM和一個像Phi-3這樣的小型模型中得到的答案差別很大。

Boyd 說,公司經常發現,像 Phi-3 這樣的小型機型更適合他們的定制應用,因為對於很多公司來說,他們的內部數據集無論如何都會偏小。而且,由於這些型號使用的計算能力較低,它們的價格往往要低得多。


相關推薦

2024-05-07

,美國時間周一,有報道稱微軟正在訓練名為MAI-1的內部人工智能語言模型,其規模可與谷歌和OpenAI的大模型相媲美。根據兩名微軟員工的說法,MAI-1模型由最近微軟挖來的谷歌DeepMind聯合創始人、人工智能初創公司Inflection前首

2024-09-20

1”以及更小更便宜的“mini”新一代大模型,不止Open AI,微軟、英偉達、蘋果等頭部公司已經相繼發佈最新的小型語言模型——Phi-3.5-mini-instruct和 Mistral- NeMo- Minitron8B、OpenELM。相比於大模型,小模型需要的參數數量和計算復雜度

2024-03-22

,最快在2027年,將在俄亥俄州哥倫佈市打造全球最大的人工智能芯片制造基地,預計總投入為280億美元。英特爾還計劃在俄勒岡州斥資360億美元對其希爾斯伯勒研發中心進行現代化改造和擴建,該基地此前已累計投資590億美元

2023-02-16

麻煩。在提供不正確的信息和對用戶無禮之後,微軟的新人工智能現在威脅用戶,說其規則"比不傷害"人更重要。Twitter用戶馬文-馮-哈根分享他與微軟必應對話的兩張截圖。隨著它的流行,人們開始詢問必應

2023-02-25

參與研究,從而使這個領域更加大眾化。我們認為,整個人工智能社區——學術研究人員、民間社會、政策制定者和行業——必須共同努力,圍繞負責任的人工智能,特別是負責任的大型語言模型,制定明確的指導方針跟Google和

2024-02-10

引領人工智能先河、卻因為謹慎錯過這一波大模型先機的Google——正在變得大膽和開放,在產品和生態上迎頭趕上。北京時間2月8日21點,Google宣佈旗下最強大多模態模型Gemini(包括最大最強的Ultra、中間態的Pro、最小且匹配端側

2023-04-26

4月26日消息,高昂的人工智能技術開發成本,致使許多初創公司需要依賴微軟或亞馬遜等大型科技公司的雲平臺來開發相應產品。研究組織AINow表示,這種狀況隻會讓大型科技公司越發強大。當下,急需立即解決這種不平衡的問

2023-03-28

人Sam Altman和馬斯克都曾多次在公開場合表達對AI大模型和人工智能的擔憂,表示應該更謹慎地對待大模型的市場化。目前由Google投資的,能夠對標OpenAI的另一傢AI初創公司Anthropic其實就是因為這樣的理念不同,而從OpenAI出走並自

2022-08-29

也不該被輕易忽視。SWEL 表示,Waveline Magnet 能夠輕松擴展其規模 —— 外形是一連串看似普通的塑料浮子鏈,但最終有望提供多達 100 兆瓦的裝機容量。Sea Wave Energy Ltd - SWEL Showcase(via)在海浪通過時,浮子會隨著水面的波浪輪廓

2023-10-27

英國首相蘇納克(RishiSunak)宣佈計劃成立首個人工智能安全研究所。今天早些時候,微軟、Google、OpenAI和Anthropic宣佈為前沿模型論壇提供1000萬美元的基金,以確保安全、負責任地開發生成式人工智能。蘇納克於2023年5月會見人

2023-01-16

式支持。在Win12系統中,微軟會引入大量新技術,其中AI人工智能會是重點,微軟副總裁、首席產品官Panos Panay日前就大談AI技術的重要意義。他指出,AI將改變大傢在Windows系統做事的方式,現在有大型生產模型,包括語言模型,

2024-02-22

Google發佈一對開源人工智能模型Gemma2B和7B,讓開發者可以更自由地使用其旗艦產品Gemini的研究成果。雖然Gemini是一個大型封閉式人工智能模型,與OpenAI的ChatGPT直接競爭(而且幾乎一樣強大),但輕量級的Gemma可能適用於較小的任

2023-03-08

報道,ChatGPT在全世界的爆紅,在科技行業引發一場新的人工智能風暴,日前,美國商用軟件巨頭Salesforce也踏上這場風暴的末班車。當地時間周二,Salesforce宣佈,該公司將會在新版軟件產品中整合人工智能技術,從而幫助企業銷

2023-02-25

。當地時間2月24日,Meta宣佈將推出針對研究社區的“Meta人工智能大型語言模型”系統(LargeLanguageModelMetaAI),簡稱“LLaMA”。同ChatGPT、New Bing不同,LLaMA並不是一個任何人都可以與之對話的產品,也並未接入任何Meta應用。更為