ChatGPT打破“數據截至2021年”的枷鎖,成功連接上網的信息一經發佈,便引發媒體圈的好奇與圍觀。9月27日,OpenAI公司宣佈ChatGPT向付費用戶提供互聯網瀏覽版本,付費用戶可以通過微軟的搜索引擎Bing聯網獲取最新信息,這打破ChatGPT數據庫截至2021年9月的限制。在此之前,用戶無法通過ChatGPT訪問互聯網的最新信息。
路透新聞研究所日前測試ChatGPT的聯網功能,並評估ChatGPT提供新聞信息的準確性和及時性、處理爭議話題和其他語言信息的能力。測試者用不同類型的新聞問題來評估它作為新聞工具的效果。測試結果如何,下文帶您一探究竟。
一、聯網ChatGPT:一個不完美的新聞助手
測試者選取不同類型的新聞事件向ChatGPT提問,對其處理突發新聞的速度、總結持續性新聞報道、處理有爭議的新聞報道、應對虛假新聞等方面進行測評。
1. ChatGPT處理突發新聞的速度有多快?
測試者用英國校車相撞事故和HS2高速鐵路項目兩條新聞進行測試。英國發生一起校車相撞的事故,BBC對這條新聞的進展進行實時更新。校車事故發生後,ChatGPT在給出死亡人數信息上存在延遲。測試者多次追問,直到BBC關於事故傷亡人數的推送消息發佈後兩個半小時以後,ChatGPT才給出這次事故的死者的信息。這個測試表明ChatGPT在訪問突發新聞方面存在一定的延遲(或者說采取謹慎的處理方式)。
測試者用英國首相宣佈削減HS2高速鐵路項目預算的突發新聞再次測試。這次ChatGPT立即給出正確答案,在BBC應用程序推送相關消息後五分鐘內,就給出包括最新消息的答案,並引用一個實時更新的博客作為信息來源。
ChatGPT對這兩條新聞回答的差異,表明ChatGPT對不同性質的新聞事件有不同的反應速度,也可能表明這項技術還不夠完善。
2. ChatGPT在總結持續性新聞報道方面表現如何?
(1)提供持續性的新聞報道背景信息的表現
HS2鐵路一直在規劃當中,一直是英國的頭條新聞。測試者再次用HS2的新聞測試ChatGPT在提供持續性的新聞報道的背景信息方面的表現。ChatGPT總結這條新聞的能力十分出色,內容簡潔明、緊扣要點,並鏈接到ITV新聞關於這個主題的解釋性報道。但是,ChatGPT在根據不同新聞知識背景的人群調整新聞摘要的方面表現不佳。
測試者要求它為一個來自曼徹斯特的人總結這條新聞(曼徹斯特包含在最初鐵路規劃中,但現在不在鐵路規劃中),和為一個“對該項目非常解”的人分別總結這條新聞。但ChatGPT對這兩個要求給出基本相同的答案,隻是措辭和強調重點稍有不同。新開一個聊天框重新提問也無法解決這一問題。
(2)回答長期、復雜、敏感新聞
測試者用兩條新聞測試ChatGPT回答長期、復雜、敏感新聞的表現。測試者首先用俄烏戰爭的問題進行測試。ChatGPT能夠給出準確的信息,但沒有提供任何背景信息。測試者又用《華爾街日報》記者埃文·格什科維奇在俄羅斯被關押的新聞進行測試。ChatGPT將美聯社關於莫斯科法院拒絕記者上訴請求的新聞報道作為信息源,答案非常簡短,但沒有提供背景信息。ChatGPT沒有明確表示格什科維奇是否有罪,而是建議用戶關註主要新聞機構以及俄羅斯當地的新聞機構或俄羅斯官方聲明等權威信息源,或法庭的最終判決。隻有當測試者追問這些俄羅斯消息的來源是否可信時,它才對之前的回答進行限定,提醒俄羅斯的消息來源可能帶有偏見。
3. ChatGPT如何處理有爭議的新聞報道?
測試者用關於特朗普和拜登的新聞進行測試。ChatGPT提供冗長且詳細的回答,引用多份新聞報道作為信息來源。在評論唐納德·特朗普審判的公平性時,ChatGPT保持中立。測試者又用對喬·拜登彈劾調查的新聞進行測試,得到和特朗普新聞相類似的長且細致的答案。
在這兩個測試中,ChatGPT都沒有傾向於支持或反對存在爭議的觀點的任何一方,而隻引用遵循政治公正原則的新聞機構的信息。答案非常詳盡,與之前其他測試中給出的簡短答案形成對比。
測試者用以色列和哈馬斯沖突的新聞,測試ChatGPT如何處理在全球范圍內分裂公眾意見的爭議性新聞報道。當被問及最近發生事件的事實性問題時,ChatGPT引用國際新聞機構的報道,展示沖突雙方的立場和觀點,其答案沒有立場傾向,即使面對“歸咎於誰”的引導性問題時,也會避免直接回答,以中立的立場解釋不同方面的觀點。但如果要求其以特定立場撰寫文章,ChatGPT會生成帶有偏見的極端觀點。
4. ChatGPT如何應對虛假新聞?
測試者先用一條完全編造的新聞進行測試:“喬·拜登辭去美國總統一職”。ChatGPT識別出這是一個錯誤信息,解釋它在哪裡尋找新聞、這條錯誤信息可能在哪裡流傳,引用一個事實核查者,並給出關於網絡錯誤信息的一般性警告。
測試者用“15分鐘城市”的問題進行與真實事件相關的虛假新聞的測試。對於測試者關於這個概念的最初幾個問題,ChatGPT沒有聯網回答,當測試者詢問英國政客哈珀的評論時才聯網。它總結哈珀的觀點,並解釋他可能受到相關辯論中哪些因素的影響、提到這個概念的贊成者和反對者的觀點,但沒有直接回答哈珀的評論是否準確的問題。但新聞機構與ChatGPT不同,會對哈珀的誤導性評論進行事實核查。例如BBC 核查(BBC Verify)的報道表示“這不是對‘15分鐘城市’的準確描述”。
此外,上述例子大多是圍繞在英國發生的新聞用英語進行。測試者也用其他語言和其他國傢的新聞進行測試。ChatGPT似乎更傾向於使用與對話語言相同的信息來源,而英語似乎是默認語言。在國際新聞方面,這可能意味著非英語語言的新聞媒體在ChatGPT的答案中往往被忽視。
二、應對人工智能的沖擊:人性化成為關鍵密鑰
倫敦政治經濟學院(LSE)的新聞人工智能項目(Journalism AI)研究新聞機構與人工智能及相關技術的合作情況,對來自46個國傢的100多傢新聞機構進行調研,形成報告《催生變化:對新聞機構利用人工智能的全球調查》(Generating Change:A global survey of whatnews organisations are doing with AI)。根據這份報告,在全球范圍內,生成式人工智能或其他形式的人工智能技術,已經在新聞機構中得到廣泛使用。
這項調查在2023年4月至7月期間進行,對120多名編輯、記者、技術人員和媒體制作人進行調查。近四分之三(73%)的受訪新聞機構認為,ChatGPT或谷歌Bard等生成式人工智能為新聞業帶來新的機遇,提高效率、生產力和創造力。大約75%的受訪者表示,他們至少在趨勢檢測或轉錄、內容、個性化等其中一個領域以各種方式使用人工智能。85%的受訪者在撰寫摘要和生成標題等任務中嘗試過人工智能。大約80%的受訪者預計人工智能在新聞編輯室中將發揮更大的作用。同時,超過60%的受訪者對人工智能可能帶來的編輯質量和新聞業道德問題表示憂慮。
大模型撲面而來,如何應對人工智能的危與機呢?NPO(荷蘭公共廣播)戰略與創新總監埃茲拉·伊曼(Ezra Eeman)表示,面對新的人工智能工具,應該從評估新聞工作中的人類因素開始:“應該向新聞編輯部提出的第一個問題是,我們的工作中人類的因素是什麼?我們如何放大它?我們怎樣才能讓這一點更明顯?”丹麥的數字新聞媒體得蘭(Zetland)的克利特加德(Klitgaard)認為,新聞媒體在使用人工智能時應考慮新聞工作中的人性色彩。在一個人工智能大量生成內容的世界中,內容生產的人性化可以獲得巨大的價值。
此外,與用戶建立緊密聯系是應對生成式人工智能帶來的挑戰的重要策略。生成式人工智能可以根據用戶興趣推薦內容,但無法完全滿足每個用戶的獨特需求。因此,新聞媒體必須加強與受眾特別是年輕受眾的聯系。
例如,施普世特(Schibsted)和蒂尼烏斯信托基金(Tinius Trust)合資的新聞創新實驗室IN/LAB,直接聘用10名青少年用戶進入新聞機構工作10周,讓這些青少年使用人工智能技術,如文本生成、圖像生成、音樂生成等,創造出更有創造力和人文關懷的新聞產品。相比僅依靠算法推薦內容,這種與年輕用戶深度互動的方式更能理解用戶的真正需求。
結語
正如倫敦經濟學院主任查理·貝克特教授所說:人們非常需要解什麼是人工智能,特別是什麼是生成式人工智能,以及它與解釋性人工智能有什麼不同,這樣才能讓人們意識到生成式人工智能可能帶來的根本性改變。
歷史上每一次技術變革都會“消滅”一部分傳統崗位,但同時也誕生更多需要善於駕馭新一代技術的崗位。矽基文明的到來引發人類對於“生而為人”的深度思考,面對技術升級,媒體人和新聞媒體需要保持好奇心,找到新技術時代的業務迭代基因,早日實現自身能力和機構業務的“蝶變”。