Facebook的所有者Meta公司發佈一個新的人工智能模型,當被提示時,它不僅可以識別圖像中的單個物體。還可以根據輸入模型的文本來選擇它們。該工具名為SegmentAnything,其工作原理是識別哪些圖像像素屬於一個物體。
它被作為一個項目推出,該項目不僅包括模型,還包括一個任務和數據集作為其研究論文的一部分。
該模型本身被命名為Segment Anything Model(SAM),數據集被命名為Segment Anything 1-Billion mask dataset(SA-1B),被Meta公司吹捧為有史以來最大的分割數據集,以實現一系列廣泛的應用。該數據集將被用於研究目的,該模型在允許的開放許可(Apache 2.0)下可用。
Meta進一步說,SAM可以被用來為那些需要在眾多領域的任何圖像中尋找和分割任何物體的應用提供動力。該模型本身在未來也可以成為能力更強、范圍更廣的人工智能的一個組成部分,並可用於增強AR和VR應用,根據用戶的視線選擇物體。
基於SAM的技術已經在Meta內部使用,特別是在Facebook和Instagram上,用戶對照片進行標記,對禁止的內容進行審核,還為決定向用戶展示哪些帖子的算法提供信息。
Meta已經推出一個模型的演示,任何人都可以用自己的圖片來嘗試,以解人工智能的能力。