Google發佈一對開源人工智能模型Gemma2B和7B,讓開發者可以更自由地使用其旗艦產品Gemini的研究成果。雖然Gemini是一個大型封閉式人工智能模型,與OpenAI的ChatGPT直接競爭(而且幾乎一樣強大),但輕量級的Gemma可能適用於較小的任務,如簡單的聊天機器人或摘要。
不過,這些模型在復雜性上的不足,可能會在速度和使用成本上得到彌補。盡管規模較小,但Google聲稱,Gemma 模型"在關鍵基準測試中明顯超越更大的模型",並且"能夠直接在開發人員的筆記本電腦或臺式電腦上運行"。這些模型將通過 Kaggle、Hugging Face、NVIDIA 的 NeMo 和Google的 Vertex AI 提供。
Gemma 進入開源生態系統的方式與 Gemini 的發佈方式截然不同。雖然開發者可以在 Gemini 的基礎上進行開發,但他們要麼通過 API,要麼在Google的 Vertex AI 平臺上進行開發。Gemini 被認為是一種封閉的人工智能模式。通過將 Gemma 開源,更多的人可以嘗試使用Google的人工智能,而不是轉向提供更好訪問權的競爭對手。
無論組織規模、用戶數量和項目類型如何,這兩種尺寸的模型都將獲得商業許可。不過,與其他公司一樣,Google通常禁止將其模型用於武器開發項目等特定任務。
Gemma 還將提供"負責任的人工智能工具包",因為開放模型比 Gemini 等封閉系統更難設置防護措施。Google DeepMind 產品管理總監特裡斯-瓦肯汀說,"由於開放模型的固有風險,公司對 Gemma 進行更廣泛的重新設計"。
負責任的人工智能工具包允許開發人員在項目中部署 Gemma 時創建自己的準則或禁用詞列表。該工具包還包括一個模型調試工具,可讓用戶調查 Gemma 的行為並糾正問題。
Warkentin 表示,這些模型目前最適用於英語語言相關任務,希望能與社區合作,滿足英語任務以外的市場需求。
開發人員可以在 Kaggle 中免費使用 Gemma,首次使用Google雲的用戶可以獲得 300 美元的免費額度來使用模型。該公司表示,研究人員最多可申請 500000 美元的額度。
雖然目前還不清楚人們對 Gemma 這樣的小模型有多大需求,但其他人工智能公司也推出重量更輕的旗艦基礎模型。Meta 去年推出 Llama 2 7B,這是 Llama 2 的最小迭代版本。 Gemini 本身也有幾種重量,包括 Gemini Nano、Gemini Pro 和 Gemini Ultra,Google最近宣佈推出速度更快的 Gemini 1.5,目前也是針對企業用戶和開發人員。
順便說一下,Gemma 的意思是寶石。