吉米·威爾士正在考慮使用GPT來協助編寫維基百科 但隱患很明顯


盡管GPT經常出現嚴重的信息不準確的狀況,但它讓維基百科的創始人吉米-威爾士認真思考人工智能如何成為人類歷史上最大和最多讀者的參考文獻庫的工作流程的一部分。在接受倫敦《標準晚報》的丹尼爾-漢伯瑞(DanielHambury)采訪時,威爾士對該技術固有的一些問題進行分析--特別是它的"胡言亂語"傾向,或者說是完全虛構的內容。

jI83SWqg.jpg

但他指出,"使用人工智能將維基百科的條目數量增加兩倍,我們每年的運營成本不會增加超過1000英鎊"。

威爾士說,一個早期的用例可能是使用像GPT這樣的大型語言模型(LLM)來比較多篇文章,尋找相互矛盾的點,並利用其結果來識別維基百科的人類志願者大軍可能需要投入一些工作的內容。

"我認為我們離'ChatGPT,請寫一個關於帝國大廈的維基百科條目'還有一段距離,"他告訴Hambury,"但我不知道我們離這有多遠,當然比我兩年前想的要近。"

一種可能的情況是,讓人工智能去尋找維基百科上所有的許多空白--那些可能有用的頁面從未被寫過--並試圖利用網絡上的信息為它們創建摘要條目。

但威爾士意識到,維基百科的整個聲譽是建立在對準確性的認知上的,而這是目前像GPT這樣的法律碩士的一個巨大問題。他說:"它有一種憑空捏造東西的傾向,這對維基百科來說真的很糟糕。"那是不可以的。我們必須對此非常小心。"

如果讓LLM編寫像維基百科這樣的中央知識庫,那些沒有被立即發現的幻覺或謊言在AI的放大作用下將開始像滾雪球一樣越滾越大。人們會在自己的寫作中使用這些非事實,隨後的人工智能將被訓練出這些非事實,從長遠來看很難糾正它們,並容易使我們更深入地進入這個"後真相"時代。

威爾士還擔心,使用LLM來擴展資源是否會幫助或加劇維基百科的系統性和無意識的偏見問題;該資源目前是由志願者編寫和維護的,其中絕大多數是白人男性,因此該網站傾向於忽略這一群體不感興趣的話題,並從某種角度來報道其他話題。

ChatGPT的明確設計是為在可能的情況下嘗試從平衡的角度看待話題,試圖將一些細微的差別帶回討論領域,在這些領域,來自不同方面的人越來越難以從任何共同點出發。但GPT在其訓練數據中也有其固有的偏見問題。

這是一個棘手的問題,當然也會讓贊助者考慮,如果該維基百科走這條路,是否還能繼續捐款給它。但現實的是,任何組織如果不圍繞下一代LLM的驚人能力重新定位,就會使自己在未來的競爭中處於巨大的劣勢當中。


相關推薦

2023-11-27

在最近接受EuronewsNext采訪時,維基百科創始人吉米·威爾士(JimmyWales)對當前ChatGPT的性能表達嚴厲的批評。他指出,該OpenAI開發的流行人工智能(AI)工具在撰寫維基百科文章時效果“糟糕”,因為它經常“錯漏百出,以可信的方

2022-11-01

平臺。大傢最喜歡的大學論文原始資料維基百科的創始人吉米-威爾士,已經提出與Twitter相抗衡的計劃。雖然仍處於起步階段,但威爾士希望將WT.Social變成一個成熟的社交媒體平臺,摒棄算法,並將"基於信任進行排名",

2022-09-10

想知道。他們在女王的文章中多次改變他的名字--從"威爾士親王"到"查爾斯三世"再到"英國國王查爾斯"。(查爾斯最終選擇"查爾斯三世")。關於維基百科編輯們在周四的瘋狂時間,還有更多的例子,

2023-11-13

目前我使用的還是ChatGPT3.5版本,和本文開頭的維基編輯一樣,我發現ChatGPT經常滿嘴胡說……它不僅經常煞有介事地捏造一些子虛烏有的事實,當你指出它的錯誤後,它還會瞬間改變自己的回答,盡管再次的回答往往還是錯誤的

2024-05-06

生成式人工智能正在改變軟件開發行業。人工智能驅動的編程工具正在協助程序員完成工作流程,而人工智能領域的工作崗位也在不斷增加。但這種轉變在學術界也很明顯--學術界是下一代軟件工程師學習如何編碼的主要途徑之

2022-06-22

Google正在向維基媒體基金會付費,以幫助在其搜索引擎上提供最準確和最新的信息。維基媒體基金會是維基百科背後的非營利組織,它也是Google首批購買其商業企業服務的公司之一。去年推出的維基媒體企業服務允許那些二次使

2022-07-04

是第一個發現中文維基裡的古俄羅斯史不對勁的人。伊凡正在網上連載《穿越世界的君士坦丁堡》,一本設定在歐洲和東羅馬帝國的奇幻小說。6 月份,為瞭寫小說,他在維基百科上搜索資料,查到一座“卡申銀礦”。它於 1344

2023-01-18

別對待。這部百科全書完全由世界各地成千上萬的志願者編寫和編輯。維基媒體基金會的麗貝卡-麥金農(RebeccaMacKinnon)也表示,對該法案的擬議修改將"限制表達自由"。維基媒體基金會是托管百科全書的非營

2022-07-12

提供知識基礎而建立。Sphere的第一個用戶是維基百科,它正在用它自動掃描詞條,並識別其詞條中的引文何時得到有力支持或沒有支持。該研究團隊已經開放Sphere的源代碼,它目前基於1.34億個公共網頁。將Sphere用於維基百科的

2024-04-10

戶開放,當然隻有開通ChatGPTPlus的訂閱用戶才能在ChatGPT中使用。不過 OpenAI 也宣佈該版本面向部分使用 API 調用的開發者們開放,所以如果你已經有 OpenAI API 那麼也可以通過 API 付費調用 Vision 版。GPT-4 Turbo with Visio 繼承 GPT-4 Turbo

2023-02-20

業集團之一、《每日鏡報》和《每日快報》的出版商Reach正在探索利用ChatGPT幫助記者撰寫短篇新聞報道。Reach首席執行官吉姆•馬倫(Jim Mullen)日前在接受當地媒體采訪時表示,該公司已成立一個工作組,研究如何利用ChatGPT協

2022-08-16

某一主題感興趣的人撰寫,所以對其進行仔細審查和認真考慮是一件非常重要的事情。MIT院研究員、該研究的論文第一Neil Thompson說道:“不難想象,在訴訟的早期階段,一個資源豐富的訴訟人鼓勵他的法律團隊將他們自己對相

2022-06-30

現在可以支付其目前的運營成本,並且有越來越多的用戶正在探索其使用。即使訪問數據的客戶規模很大如Google,但這並不是使用商業產品的要求。維基媒體基金會在6月的一份公告中指出,所有的維基媒體項目--包括其公開的數

2024-03-01

考慮使用人工智能生成報道的新聞網站可能需要註意以下警告:CNET於2022年悄然開始發佈錯誤百出、剽竊人工智能制作的內容,由於其不明智的試驗,維基百科已將其可靠性評級下調。去年,《未來主義》(Futurism)的一篇報道