用戶聊天內容不能白用 Reddit將向OpenAI等收費


4月19日消息,微軟、谷歌和OpenAI一直在利用Reddit論壇上的用戶聊天數據來開發新的人工智能系統。現在,Reddit打算向這些公司收取使用費。Reddit一直是互聯網上熱門話題的討論集中地,每天有大約5700萬人訪問這個網站討論各種話題,包括化妝技巧、電子遊戲到自動洗車機等等。

近年來,Reddit論壇上的聊天內容已成為谷歌、OpenAI和微軟等公司的免費訓練工具,用於開發人工智能系統。現在,許多業內人士認為,這些人工智能系統將成為科技行業的下一個大事件。

因此,Reddit打算向開發人工智能技術的公司收費。許多公司都通過應用程序編程接口(API)下載並處理論壇上的聊天內容。周二,Reddit表示計劃開始向使用API的公司收費。

Reddit創始人兼首席執行官史蒂夫·霍夫曼(Steve Huffman)在接受采訪時表示:“Reddit的數據庫確實很有價值,我們沒有必要免費提供這些價值給世界上最大的公司。”

Reddit此舉是社交網絡首次明確向OpenAI等收取費用開放訪問權,用於開發像ChatGPT這樣的人工智能系統。ChatGPT等新人工智能系統可能有一天會成為大企業,但對Reddit等公司的幫助不大。相反,這些人工智能系統還可以自動生成聊天內容,成為Reddit的競爭對手。

Reddit正在為今年可能上市做準備,該公司成立於2005年,目前主要依賴平臺廣告和電商交易進行盈利。Reddit方面表示,正在敲定API接口的收費細節,並將在未來幾周內公佈價格。

如今,大型語言模型已成為開發人工智能新技術的重要組成部分,Reddit論壇上的用戶聊天內容也成有價值的商品。

谷歌人工智能聊天機器人Bard的底層算法之一就是用Reddit聊天數據訓練的。同時,OpenAI的ChatGPT也將Reddit的數據作為訓練大型語言模型的信息之一。

除此之外,其他公司也開始意識到平臺上所存儲的聊天內容和圖片的價值。圖片托管服務Shutterstock已經把圖像數據出售給OpenAI,幫助開發能夠根據簡單文字提示就能生成圖像的人工智能系統DALL-E。

目前,有幾千傢公司和大小開發者都在使用API跟蹤推特平臺上的幾百萬條聊天內容。上個月,個人社交媒體平臺推特所有者埃隆·馬斯克(Elon Musk)表示,他正在改變使用推特API的現行方式,要為使用API收取幾萬到幾十萬不等的費用。不過馬斯克沒有提到大型語言模型是促使他做出改變的原因。

為不斷改進模型,人工智能企業需要兩個重要因素:強大的計算能力和大量可用的數據。一些大型人工智能開發企業通常擁有足夠的算力,但仍會在互聯網上尋找改進算法所需的數據。其中包括維基百科、各種數字化書籍、學術文章和Reddit論壇上的聊天內容等資源。

谷歌、OpenAI和微軟等公司目前尚未對Reddit計劃收費的事宜作出回應。

很長一段時間以來,Reddit與谷歌和必應等搜索引擎一直是相互依存的關系。它們自動獲取Reddit網頁信息,進行索引,然後將相關信息展示在搜索結果頁面中。雖然這種自動抓取方式不見得受到所有網站的歡迎,但是Reddit卻能因此在搜索結果中排名靠前。

而大型語言模型則完全不同,它需要盡可能多地獲取數據,這樣才能創建新的人工智能系統。

Reddit認為,它的論壇數據特別有價值,因為它不斷更新。霍夫曼表示,這種新鮮度和相關性正是大型語言模型算法生成最佳結果所需要的東西。

“Reddit比互聯網上任何其他地方都更適合聊天,”霍夫曼說。“網站上有很多內容是你隻會私下裡說的,或者壓根就不會說的東西。”

霍夫曼還強調,對於想要開發幫助人們使用Reddit的應用程序開發者來說,API仍然是免費的。比如開發者可以免費使用API等工具來開發機器人,自動跟蹤用戶評論是否遵守內容發佈規則。出於學術研究或非商業目的來研究Reddit數據的人也能繼續免費訪問這些數據。

Reddit還希望將更多機器學習融入論壇運營,例如,Reddit可以用機器學習來識別平臺上人工智能生成文本的使用情況,並為其添加標簽,告知用戶哪些評論是來自機器人。Reddit還承諾改進供論壇版主使用的軟件工具,幫助他們監控論壇上的第三方機器人。

但對於人工智能制造商來說,Reddit認為是時候付費。

“通過抓取Reddit的數據來創造價值,卻不向我們的用戶返利,這是我們自己的問題,”霍夫曼說。“現在是我們加強管理的好時機。”


相關推薦

2024-03-23

Facebook 以及 Amazon。招股書裡顯示,Reddit 有 3.3 億月活躍用戶,7310 萬日活躍用戶,10 萬個活躍子社區。然而,Reddit 正式員工隻有 2013 人,而且不同於其他科技互聯網公司,Reddit 的辦公室分散在舊金山和紐約和世界各地。甚至許

2024-02-22

Reddit對第三方客戶端進行趕盡殺絕,目的就是確保Reddit的內容不被外部獲取。而這些內容將成為 Reddit 的搖錢樹,彭博社此前已經提到 Reddit 與某個科技公司達成合作,後者每年將向 Reddit 提供 6000 萬美元的資金,以獲取 Reddit 的

2023-04-23

t、Java、C#、PHP、Android、Python、jQuery和HTML等。如今其註冊用戶已超過2000萬。其首席執行官Prashanth Chandrasekar表示,“社區平臺推動大語言模型(LLM)發展,所作出的貢獻也必須得到補償。”同樣也是在本周,美國新聞媒體聯盟(T

2023-02-17

人工智能優化後的必應搜索結果。微軟對來自169個國傢的用戶進行為期一周的必應搜索引擎人工智能新功能測試,並於當地時間周三公佈初步結果。微軟表示,71%的測試者認可人工智能優化後的搜索結果。人工智能聊天機器人功

2023-05-12

歌表示,這種所謂生成式搜索體驗的產品能更好響應來自用戶的搜索查詢。谷歌將向一些用戶展示人工智能生成的文本段落,並在搜索結果頁面優先顯示數個相關鏈接,而不是谷歌搜索結果通常顯示的“十個藍色鏈接”。基於人

2023-03-15

。當前,谷歌正在測試其AI產品,允許一部分GoogleWorkspace用戶訪問。GoogleWorkspace是谷歌的一整套辦公組件,包括Gmail和GoogleDocs等。Google Workspace產品副總裁約翰娜·沃利奇·賴特(Johanna Voolich Wright)在一份聲明中稱:“無論你是一

2024-03-23

版主,即moderator管理,制定版規、維護秩序、組織活動,用戶們則可以自由發帖、評論,或者給其他人的發言投票。除此之外,Reddit似乎並沒有什麼玄妙的地方。相比於今天以算法推薦、AI驅動的互聯網產品,Reddit的形態實在原

2023-06-06

曾公佈基於人工智能模型的BingChat聊天機器人,獲得大量用戶的好評。但在很長一段時間內,用戶都隻能在Edge瀏覽器中,才能夠使用BingChat,這一導致部分不滿。近日,微軟廣告和網絡服務部門的負責人Mikhail Parakhin終於宣佈,將

2024-03-12

一消息,現在,微軟已正式確認將為購買CopilotPro訂閱的用戶推出CopilotGPT生成器功能。周五晚些時候,微軟必應部門副總裁邁克爾-謝克特(MichaelSchechter)在他的X(原Twitter)賬戶上發佈一條消息,暗示CopilotGPT生成器將向更多Copil

2024-01-31

通過使ChatGPT用戶能夠在任何聊天中調用GPT,OpenAI正在推動由其人工智能模型驅動的第三方應用程序GPT的采用。從今天開始,OpenAI的人工智能聊天機器人前端ChatGPT的付費用戶可以通過輸入"@"並從列表中選擇一

2024-04-02

向公眾推出以來,OpenAI一直要求想要訪問該聊天機器人的用戶註冊OpenAI賬戶。今天,該公司透露將向所有人免費開放ChatGPT,無需創建賬戶。OpenAI在今天的一篇博文中表示,它將"逐步"推出這一新的訪問權限,

2023-11-17

ChatGPT可能要上新一項重大功能。那就是記住你之前的聊天內容並不斷從中學習(並非單純保存歷史記錄),從而解你的偏好和信息,用於在日後聊天派上用場。比如你可以給它下達一句“始終用python寫代碼”的命令,那麼之後

2023-02-07

式,沒有啥技術含量。而在各社交平臺,用ChatGPT命名的用戶開始泛濫。在微信平臺,有大量以ChatGPT命名的微信公眾號或者小程序,兩者加起來得有上百個。這些公眾號大部分內容是ChatGPT的使用或註冊教程,也有將ChatGPT連接到

2023-01-24

因良好的交互表現而名聲大噪,不到一周就聚集超過100萬用戶。納德拉在今年達沃斯世界經濟論壇上發佈演講時曾預測,當前AI將引發一場波及全行業的“平臺轉移”,就像過去15年向移動設備和雲計算平臺上轉移一樣。同時納