Facebook母公司Meta今天宣佈一個名為Sphere的新工具,該工具圍繞著挖掘開放網絡上的巨大信息庫,為人工智能和其他系統的工作提供知識基礎而建立。
Sphere的第一個用戶是維基百科,它正在用它自動掃描詞條,並識別其詞條中的引文何時得到有力支持或沒有支持。該研究團隊已經開放Sphere的源代碼,它目前基於1.34億個公共網頁。
將Sphere用於維基百科的想法很簡單:該在線百科全書有650萬個條目,平均每月增加約17000篇文章。這背後的維基概念實際上意味著添加和編輯內容是眾包的,雖然有一個編輯團隊負責監督,但這是一項艱巨的任務,而且與日俱增,不僅僅是因為其規模,還因為其任務。
與此同時,監管維基百科的維基媒體基金會一直在權衡利用所有這些數據的新方法。上個月,它宣佈一個企業層級和它的第一批兩個商業客戶Google和互聯網檔案館,它們使用基於維基百科的數據為自己的商業利益服務,現在將有更廣泛和更正式的服務協議圍繞它。
就Meta公司而言,該公司繼續被公眾的不良看法所拖累,部分原因是有人指責它使錯誤信息和有毒思想得以自由傳播,所以推出Sphere這樣的東西感覺有點像Meta公司的公關活動,如果它能發揮作用,也可能是一個有用的工具,就表明該組織中有人在努力真誠地工作。
今天關於Meta與維基百科合作的公告並沒有提到維基媒體企業,但一般來說,為維基百科增加更多的工具,以確保其擁有的內容是經過驗證和準確的,這將是企業服務潛在客戶在考慮為該服務付費時想知道的事情。
目前還不清楚這項交易是使維基百科成為Meta的付費客戶。不過,Meta確實指出,為訓練Sphere模型,它創建一個新的數據集(WAFER),包括400萬條維基百科引文,比以往用於此類研究的數據集要復雜得多。而就在五天前,Meta宣佈維基百科的編輯們也在使用它建立的一個新的基於人工智能的語言翻譯工具,所以顯然這裡面有聯系在其中。