Google發佈一對開源人工智能模型Gemma 2B和7B 適用於較小的任務


Google發佈一對開源人工智能模型Gemma2B和7B,讓開發者可以更自由地使用其旗艦產品Gemini的研究成果。雖然Gemini是一個大型封閉式人工智能模型,與OpenAI的ChatGPT直接競爭(而且幾乎一樣強大),但輕量級的Gemma可能適用於較小的任務,如簡單的聊天機器人或摘要。

gemma_promo_press.jpg

不過,這些模型在復雜性上的不足,可能會在速度和使用成本上得到彌補。盡管規模較小,但Google聲稱,Gemma 模型"在關鍵基準測試中明顯超越更大的模型",並且"能夠直接在開發人員的筆記本電腦或臺式電腦上運行"。這些模型將通過 Kaggle、Hugging Face、NVIDIA 的 NeMo 和Google的 Vertex AI 提供。

Gemma 進入開源生態系統的方式與 Gemini 的發佈方式截然不同。雖然開發者可以在 Gemini 的基礎上進行開發,但他們要麼通過 API,要麼在Google的 Vertex AI 平臺上進行開發。Gemini 被認為是一種封閉的人工智能模式。通過將 Gemma 開源,更多的人可以嘗試使用Google的人工智能,而不是轉向提供更好訪問權的競爭對手。

無論組織規模、用戶數量和項目類型如何,這兩種尺寸的模型都將獲得商業許可。不過,與其他公司一樣,Google通常禁止將其模型用於武器開發項目等特定任務。

Gemma 還將提供"負責任的人工智能工具包",因為開放模型比 Gemini 等封閉系統更難設置防護措施。Google DeepMind 產品管理總監特裡斯-瓦肯汀說,"由於開放模型的固有風險,公司對 Gemma 進行更廣泛的重新設計"。

負責任的人工智能工具包允許開發人員在項目中部署 Gemma 時創建自己的準則或禁用詞列表。該工具包還包括一個模型調試工具,可讓用戶調查 Gemma 的行為並糾正問題。

Warkentin 表示,這些模型目前最適用於英語語言相關任務,希望能與社區合作,滿足英語任務以外的市場需求。

開發人員可以在 Kaggle 中免費使用 Gemma,首次使用Google雲的用戶可以獲得 300 美元的免費額度來使用模型。該公司表示,研究人員最多可申請 500000 美元的額度。

雖然目前還不清楚人們對 Gemma 這樣的小模型有多大需求,但其他人工智能公司也推出重量更輕的旗艦基礎模型。Meta 去年推出 Llama 2 7B,這是 Llama 2 的最小迭代版本。 Gemini 本身也有幾種重量,包括 Gemini Nano、Gemini Pro 和 Gemini Ultra,Google最近宣佈推出速度更快的 Gemini 1.5,目前也是針對企業用戶和開發人員。

順便說一下,Gemma 的意思是寶石。


相關推薦

2024-02-22

Gemma 提供推理和監督微調(SFT)的工具鏈。在各傢大廠和人工智能研究機構探索千億級多模態大模型的同時,很多創業公司也正在致力於構建體量在數十億級別的語言模型。而 Meta 去年推出的 Llama 系列震動行業,並引發人們對

2024-02-27

a 7B得分為44.4%)。近期研究發現,即便是經過精心對齊的人工智能模型,也可能遭受新型對抗攻擊,這種攻擊能夠規避現有的對齊措施。這類攻擊有可能使模型行為異常,有時甚至會導致模型重復輸出它在訓練過程中記住的數據

2024-02-22

Qwen系列表現也很亮眼)我們也發佈一個負責任的生成性人工智能工具包(Responsible Generative AI Toolkit),它為負責任地使用像Gemma模型這樣的開放模型提供資源,包括:關於設定安全政策、安全調整、安全分類器和模型評估的指導

2024-02-22

昨日晚間,Google毫無預兆地發佈開源模型Gemma,直接狙擊Llama2,繼通過Gemini拳打OpenAI後,試圖用Gemma腳踢Meta。不同於Gemini的“全傢桶”路線,Gemma主打輕量級、高性能,有20億、70億兩種參數規模,能在筆記本電腦、臺式機、物聯

2024-04-19

Meta發佈開源生成式人工智能模型Llama系列的最新產品:Llama3。或者,更準確地說,該公司已經開源新的Llama3系列中的兩個模型,其餘模型將在未來某個不確定的日期推出。Meta 稱,與上一代 Llama 模型 Llama 2 8B 和 Llama 2 70B 相比,

2024-04-23

微軟推出其輕量級人工智能模型Phi-3Mini的下一個版本,這是該公司計劃發佈的三款小型模型中的第一款。Phi-3Mini可測量38億個參數,其訓練數據集比GPT-4等大型語言模型要小。它現在可在Azure、HuggingFace和Ollama上使用。微軟計劃發

2024-04-19

主要平臺上可用,包括雲服務商、API 提供商等。從AWS、Google Cloud、Databricks、Snowflake 、NVIDIA NIM到Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure——Llama 3 將無處不在。它也得到 AMD、AWS、Dell、Intel、NVIDIA 和 Qualcomm 提供的硬件平臺支持

2024-03-09

點。在OpenAI的官網主頁上寫著,“我們的使命是確保通用人工智能(AGI)造福全人類。”最初,OpenAI的確作為一個非營利組織堅持著這樣的路線。而自GPT-2後,OpenAI采取閉源策略,公司出售大模型API訪問權限,但不再發佈有關其

2023-02-25

參與研究,從而使這個領域更加大眾化。我們認為,整個人工智能社區——學術研究人員、民間社會、政策制定者和行業——必須共同努力,圍繞負責任的人工智能,特別是負責任的大型語言模型,制定明確的指導方針跟Google和

2024-05-13

內 AI 編碼工具領域使用率第一。但是,從最開始的產品發佈、到現在靈碼的產品能力獲得用戶的一致好評,這中間我們經歷非常多的困難。最開始,我們嘗試基於開源模型,然後基於通義的基礎模型進行訓練,這其中挑戰與機

2024-03-18

閉源與開源雙線作戰,閉源對抗OpenAI,開源對抗Meta。在人工智能領域裡,Google可以算是開源大模型的鼻祖。今天幾乎所有的大語言模型,都是基於Google在2017年發佈的Transformer論文,這篇論文顛覆整個自然語言處理領域的研究范

2024-04-19

e Verge 的采訪時描繪 Meta 的願景——致力於打造 AGI(通用人工智能)。與不 open 的 OpenAI 形成鮮明對比,Meta 則沿著 open 的開源路線朝 AGI 的聖杯發起沖鋒。正如紮克伯格所說,堅定開源的 Meta 在這條充滿挑戰的征途中也並非毫無

2024-03-25

除 OpenAI 模型外,模型目錄還提供多種開源和商業模型。人工智能研發:微軟和 Mistral AI 將探索為特定客戶訓練特定目的模型的合作。當被問及公司是否正在改變其開源商業模式時,Mistral AI 聯合創始人 Arthur Mensch 在采訪中表示

2023-02-25

。當地時間2月24日,Meta宣佈將推出針對研究社區的“Meta人工智能大型語言模型”系統(LargeLanguageModelMetaAI),簡稱“LLaMA”。同ChatGPT、New Bing不同,LLaMA並不是一個任何人都可以與之對話的產品,也並未接入任何Meta應用。更為