Twitter對外披露部分源代碼 包括其推薦算法


正如首席執行官埃隆-馬斯克多次承諾的那樣,Twitter已經向公眾開放部分源代碼,包括它用來在用戶時間線上推薦推文的算法。在GitHub上,Twitter發佈兩個代碼庫,其中包含使社交網絡運轉的許多部分的代碼,包括Twitter用來控制用戶在"給你的時間線"上看到的推文的機制。

在一篇博文中,Twitter將此舉描述為"提高透明度的第一步",同時"防止"對Twitter本身和該平臺上的人造成風險。

在今天的Twitter Spaces會議上,馬斯克澄清說:

"我們最初發佈的所謂算法會相當尷尬,人們會發現很多錯誤,但我們會很快修復它們。即使你不同意某些東西,至少你會知道它為什麼在那裡,而且你沒有被秘密操縱......在這裡,我們渴望的類比是Linux作為一個開源操作系統的偉大例子......理論上,人們可以為Linux發現許多漏洞。在現實中,所發生的是社區識別和修復這些漏洞。"

關於博文中關於預防風險的第二點,開源版本不包括為Twitter的廣告推薦業務提供支撐的代碼或用於訓練Twitter推薦算法的數據。此外,它們幾乎不包括關於如何檢查或實際使用這些代碼的說明--這加強這些版本嚴格以開發者為中心的想法。

Twitter寫道:"[我們排除]任何會損害用戶安全和隱私或保護我們的平臺不受不良行為影響的代碼,包括破壞我們打擊兒童性剝削和操縱的努力。我們[還]采取措施,以確保用戶安全和隱私將得到保護。"

Twitter正在開發工具以管理來自社區的代碼建議,並將變化同步到其內部存儲庫。據推測,這些工具將在未來的某一天提供--目前還沒有跡象表明它們的存在。

馬斯克在Spaces會議上說:"我們將尋求建議,不僅僅是關於錯誤的建議,還有關於算法應該如何工作的建議。這將是一個不斷發展的過程。我不會期望它是一個不間斷的上升運動......但我們對能夠改善用戶體驗的東西非常開放。"

乍一看,社交網絡的算法是相當復雜的--但從技術角度看,不一定令人驚訝。它由多個模型組成,包括檢測"對工作不安全"或辱罵性內容的模型,一個Twitter用戶與另一個用戶互動的可能性,以及計算一個Twitter用戶的"聲譽"。(目前還不清楚"聲譽"具體指的是什麼;高層文件並不清楚)。幾個神經網絡負責對推文進行排名,並推薦要關註的賬戶,而過濾組件則隱藏推文 - "支持法律合規,提高產品質量,增加用戶信任,通過使用硬過濾、可見產品處理和粗粒度降級來保護收入"。

在一篇工程博文中,Twitter透露更多關於推薦管道的信息,它聲稱該管道每天大約運行50億次:

Twitter寫道:"我們試圖從數以億計的信息庫中提取最好的1500條推文......今天,為你服務的時間線平均由50%[你不關註的人的推文]和50%[你關註的人的推文]組成,盡管這可能因用戶而異。"[推文]的排名是通過一個約4800萬個參數的神經網絡實現的,該網絡在推文互動方面不斷訓練,以優化積極的參與(例如喜歡、轉發和回復)。"

源代碼的公佈是在最近幾個月涉及Twitter推薦算法調整的幾場爭議之後發生的。據Platformer報道,今年2月,馬斯克呼籲Twitter的工程師重新配置算法,以便他的推文能被更多人看到。(Twitter後來收回這一改變--至少在某種程度上。)

解更多:

https://github.com/twitter/the-algorithm/


相關推薦

2023-03-18

埃隆-馬斯克似乎接近於兌現他對Twitter代碼開源的承諾,至少是其中的一部分。在社交媒體平臺上的一篇文章中,這位Twitter首席執行官宣佈,該公司將於3月31日開放用於推薦推文的代碼。馬斯克沒有提供關於如何運作的任何其他

2023-04-01

北京時間4月1日消息,Twitter公司周五宣佈提高透明度措施,公開決定該社交媒體如何推薦內容的部分計算機代碼,允許用戶和程序員解其工作原理,並能夠對算法提出修改建議。Twitter在一篇題為《Twitter透明度新時代》的博文中

2023-03-27

reeSpeechEnthusiast"的用戶的資料庫,該資料庫包含Twitter的專有源代碼,此前該社交網絡提出DCMA移除請求。這個用戶名當然似乎是對Twitter老板埃隆-馬斯克的嘲諷,他曾多次聲稱自己是"言論自由絕對主義者&

2023-04-07

4月7日消息,上周推特兌現埃隆·馬斯克(ElonMusk)長期以來的承諾,在GitHub上公佈部分推薦算法底層代碼。然而,研究人員表示,其中的內容並不詳盡,推特省略“算法到底是如何工作的”等重要細節,使得我們想要弄清推特平臺

2023-01-29

rseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/[3]https://twitter.com/Kirtaner/status/1619007274202329091[4]https://twitter.com/dom_woodman/status/1619028740201398274[5]https://twitter.com/alex_buraks/status/1618988134850785280

2024-04-26

得進展,他可以將最後期限延長三個月。字節跳動未公開披露其財務業績或任何部門的財務細節。另有消息人士稱,該公司的大部分資金仍然來自中國,主要是抖音等其他應用,抖音相當於中國的 TikTok。另一位直接知情人士說

2023-03-27

3月27日消息,社交媒體平臺推特稱部分源代碼已經被泄露到網上,目前公司正努力確定責任人以及哪些人下載過代碼。據外媒報道,一份法律文件顯示,推特平臺部分底層源代碼已經泄露到網上。雖然推特在努力減少技術問題,

2023-02-15

Twitter首席執行官伊隆·馬斯克近日要求工程師采取措施,讓他的推文優先顯示在關註者的頁面上。根據科技媒體Platformer對知情人士的采訪和獲得的文件,在馬斯克關於超級碗的推文比美國總統拜登的推文效果差之後,他下令對

2022-06-22

FSR 1相比,它被設計為提供更高的圖像質量"。FSR 2.0的源代碼包括完整的C++代碼庫,以及用於Direct3D的HLSL源代碼。還有一個代碼示例實現和FSR 2.0 API文檔。FSR 2.0支持Direct3D 12和Vulkan。FSR 2.0的源代碼和文檔現在可以通過GitHub獲得

2024-02-04

知名遠程控制軟件AnyDesk今天披露該公司最近遭到黑客攻擊,黑客通過某種方式入侵AnyDesk的生產系統,最終黑客成功竊取AnyDesk的部分源代碼以及私有的代碼簽名證書和私鑰。AnyDesk 提供遠程訪問解決方案,不少企業使用 AnyDesk 為

2023-11-27

,並會定期記錄、嚴格分析和確認,並積極保護不向公眾披露。”起訴書稱。根據法庭文件,Meta自己的記錄顯示,數十萬青少年用戶每天花費超過5個小時時間在Instagram上。一位Meta產品設計師在一封內部電子郵件中寫道,“年輕

2022-10-08

VX-Underground在Twitter上表示,在經歷一次重大的黑客攻擊之後,英特爾第12代AlderLake的源代碼(包括BIOS文件等)在網上泄露。英特爾的AlderLakeCPU於去年11月4日發佈,2021年,數據包括容量2.8GB的壓縮源代碼(完整文檔5.86GB),據稱泄

2024-03-09

微軟今年早些時候披露,俄羅斯國傢支持的黑客一直在監視其高級領導團隊一些成員的電子郵件賬戶。現在,微軟披露,這次攻擊來自SolarWinds攻擊背後的同一個組織,在微軟所稱的持續攻擊中,一些源代碼也被竊取。"最近

2022-10-09

露的,也可能是一個PC品牌的制造夥伴意外泄露的。一些Twitter用戶似乎認為該代碼源自4chan。昨天,它進被分享到GitHub,在今天早些時候被撤下之前,有人查看它的源代碼日志,發現最初的提交日期是9月30日,作者被標記為LC Futu