聲明:本文來自於微信公眾號德外5號(ID:dewaiwuhao),作者:婁立原 於海嬌,授權站長之傢轉載發佈。
新聞媒體打響AI“保衛戰”
面對生成式AI的沖擊,海外新聞業存在悲觀和樂觀的兩種態度。在悲觀者看來,ChatGPT的橫空出世代表著對新聞業的沖擊。而在樂觀者看來ChatGPT能使新聞業更加便捷自動化,新聞媒體可以自由創作更復雜、更有吸引力的內容。
目前,多數海外傳媒多站在悲觀者的立場,比如,路透社、彭博社、CNN、《衛報》《紐約時報》等海外著名新聞媒體近期在其網站的根目錄配置文件中禁止ChatGPT等生成式AI爬取其網頁內容。印度的一些主流媒體如《印度時報》《印度斯坦時報》《帕斯卡日報》《印度教徒報》也進行效仿,保護網站免受ChatGPT的母公司OpenAI的網絡掃描爬取工具GPTbot的訪問。一傢頭部數字新聞媒體透露,媒體行業正在阻擊的對象不僅是OpenAI,所有生成AI大模式在未經許可的情況都會被拒之門外,解決內容被違規使用及濫用問題已經迫在眉睫。
而樂觀派的代表——美聯社走一條不同的路線,美聯社在本月已與OpenAI簽訂合作協議,授權OpenAI使用部分美聯社的文本檔案,同時美聯社也將利用OpenAI的技術和產品專業知識。據外媒報道,美聯社是第一傢與主要人工智能平臺達成(收費)協議的主要媒體。
這些海外媒體巨頭接下來究竟會采取什麼行動還有待觀察。據報道,《紐約時報》可能采取更為激烈的方式——起訴OpenAI。
一位外媒高管表示:“互聯網上充斥著低質量的垃圾信息。而傳統媒體,卻以事實為導向,提供高質量的內容。”新聞媒體的內容對於努力為用戶提供準確信息ChatGPT等人工智能模型來說,是非常有價值的,甚至是至關重要的。
雖然如此,但面對新聞媒體的強烈抵制,主要科技媒體被迫做出妥協。近期ChatGPT的母公司OpenAI表示接受新聞網站對其的屏蔽行為,也不再爬取新聞網站內容文本,但聲稱之前所獲得的數據不會刪除。Facebook和Instagram的母公司Meta也推出一項新政策,允許用戶表示他們的個人信息不被用於訓練AI模型。
對待此事,埃隆·馬斯克(Elon Musk)秉持一貫強烈的個人化風格。他對推特平臺(X)施加防爬蟲限制,解決他所稱的AI公司為構建模型對其平臺進行“極端水平的數據爬取”,馬斯克表示數據爬取使得他的公司要部署更多的服務器,增加一定成本。然而,他卻允許旗下的AI創業公司xAI使用推特平臺的公共推文來訓練模型。
AI“三道閘”
美國新聞媒體行業協會The News Media Alliance(NMA))總裁兼首席執行官丹妮爾·科菲(Danielle Coffey)新聞機構確實對這項迅速發展的技術感到擔憂。
第一,流量截留,既有商業模式可能被顛覆。英國專業出版協會(Professional Publishers Association)首席執行官Sajeeda Merali接受《新聞公報》(Press Gazette)采訪時表示,過去新聞媒體允許Google等搜索引擎抓取內容,以獲得商業回報:搜索引擎會將讀者引導至新聞媒體網站,在網站內,他們可以展示廣告,吸引讀者成為訂閱者,或者進行活動宣傳以及其他聯盟合作,從而創造聯盟收入。
ChatGPT這種聊天機器人的采用可能會徹底改變用戶與新聞內容的互動方式。現在,由於ChatGPT取得突破性的進展,用戶可以直接通過對話獲取有效信息,使得該應用異常火爆,人們開始不再依賴傳統搜索引擎進行信息查詢檢索。然而ChatGPT在未經許可的情況下利用新聞媒體網頁內容來構建“大型語言模型”,從而能夠學習如何用自然語言與用戶進行對話並給出一個綜合、全面、有效的答案,這也是其備受歡迎的原因。ChatGPT提供的清晰且簡短的答案比從新聞網站查閱幾篇長文所帶來的用戶體驗更佳。但是ChatGPT並不會向用戶顯示所給信息的來源,更不會把新聞媒體的鏈接展示出來。
此外,微軟、微軟已將人工智能技術整合到搜索業務中谷歌搜索引擎,新聞媒體普遍擔憂以後可能大部分用戶不再會點擊新聞鏈接,隻是閱讀科技巨頭所給出的標題,屆時新聞網站的推薦流量將遭遇重創,這將徹底顛覆新聞業的商業模式。在過去的幾個月裡,新聞消費下滑、手機銷量下降、生成式人工智能截留流量等因素,造成在線新聞媒體收入下行。
第二,AI“黑箱”引發媒體信任危機。Merali還強調,AI公司如何使用媒體內容來訓練他們的工具缺乏透明度。迄今雙方並沒有就使用哪些內容來訓練AI模型達成協議。“在解內容如何被使用之前,很難確定這些內容的價值。但目前情況有點像黑洞。”
“如果沒有政府幹預,那麼這將對該行業(新聞媒體)的可持續、健康以及繁榮發展產生相當嚴重的不利影響。內容創作者將無法從內容創作中獲利。”他表示,正在尋找創新性的解決方案,確保行業以正確的方式運轉,並使新聞內容得到價值認可。
Meral表示,新聞媒體一直在測試和分享使用AI工具的實驗結果,這些工具可以“潛在地改善他們的工作流程或潛在地幫助他們更好地解讀者,以便提供更相關的內容”。
“所以我們並不是一個一成不變的行業,不想有任何變化。我認為在如何使用它方面已經進行很多創新,但這關乎公平競爭。”
第三,AI生成內容存在較大缺陷。一是ChatGPT的數據采集范圍有限。ChatGPT目前用於訓練的內容數據截至2021年底,近兩年的問題不能夠精準回答。此外,ChatGPT不能訪問互聯網誕生之前就有的內容,比如不能通過圖書、報紙等紙質媒介進行學習,這意味著其對任何歷史問題的回答都可能產生參差不齊的結果。ChatGPT還不能對當前互聯網實時更新的內容進行訪問和爬取。ChatGPT隻能查閱互聯網上的數字資料,不能對直接對消息來源處進行實地采訪,也不能拿出一本圖書館的書本來核查事實。
二是生成內容的可信度不夠。人們對AI大規模生產虛假信息的潛在風險憂心忡忡。可靠的消息來源和可信度是好新聞的基石,ChatGPT可能會生成不全面和帶有偏見性的新聞內容,這將會是新聞業的災難。如果上述問題得不到有效解決,整個媒體生態及媒介信息環境將面臨危機。
生成式AI通過嵌入搜索引擎、APP和如今無處不在的智能設備等方式,利用從新聞媒體獲取的內容數據,圍剿新聞媒體,一旦培訓AI模型的權威信息來源變成真空,困惑的AI將成為錯誤信息的孵化器。沒有高質量內容的支撐,我們的未來註定是黯淡的。
呼籲監管新政出臺
面對科技巨頭們的沖擊,海外新聞媒體表示,他們並非隻是想要“閉關鎖國”,而是更願意與技術平臺公平合作,以獲取他們想要的價值,同時要求政府出臺相關法案以保證他們的利益。
在英國,多個新聞媒體組織聯合向英國首相裡希·蘇納克(Rishi Sunak),呼籲健全實施合作條款的法律基礎,“以確保人工智能系統的所有者聲明他們如何使用新聞媒體的內容,以便能夠識別哪些內容被爬取用於訓練,從而解決補償問題”。在給首相的信中還寫道:“如果沒有透明的合作條款,版權所有人就無法知道其內容是如何被使用的,這會影響到隨後將進行的合作談判,政府必須迅速采取行動建立正確的監管機制。”
與此同時,印度政府在今年2月成立一個委員會,提出一項數字競爭法案來遏制大型科技公司的反競爭行為。一個印度媒體協會DNPA(Digital News Publishers Association)的秘書長蘇雅塔·古普塔(Sujata Gupta)表示:“我們的首要目標是在版權保護、促進創新和向印度國民自由傳播具有可信度的新聞之間取得平衡。我們希望印度政府即將出臺的數字治理與競爭法案能夠考慮到技術領域發生的最新變化,這些變化將對媒體的收入和版權產生影響,技術平臺和新聞媒體間需要雙贏才行。”
結語
目前尚處在生成式AI應用發展的早期階段,傳媒業很難確定“來者”是敵是友,挑戰與機遇並存。信息技術發展至今,早已不能以“互聯網+”“數字+”來定義技術對傳媒業的影響,AI在變革信息交互模式的同時,開始沖擊傳媒業的根基,亦讓傳媒業向內審視:生成式AI形成降維打擊的源頭——優質內容資產的版權價值,“借船出海”與“造船出海”的選擇題將再次擺上臺面......