Twitter開源算法到底揭示什麼?其實也沒什麼 比馬斯克承諾的差遠


4月7日消息,上周推特兌現埃隆·馬斯克(ElonMusk)長期以來的承諾,在GitHub上公佈部分推薦算法底層代碼。然而,研究人員表示,其中的內容並不詳盡,推特省略“算法到底是如何工作的”等重要細節,使得我們想要弄清推特平臺內部運作機制仍然很困難。

以下是翻譯內容

當馬斯克第一次提出要接管推特時,就宣稱他接手後的第一件事就是“開源”推特算法。。上周,他終於履行自己的承諾,推特在GitHub上發佈平臺上有關“為你推薦”功能的部分底層代碼。

人們很快開始對這些代碼進行深挖,沒過多久就發現馬斯克的推文有特殊類別標記。推特工程師們急忙站出來解釋說,這是為便於“跟蹤統計”,其他分析也證實這一說法。盡管推特幾個小時後就從GitHub上刪除這段代碼,但人們仍然猜測推特工程師們特別優待馬斯克所發內容,可能采取人為措施來提升他的推文曝光量。

自此之後,推特沒有發佈更多代碼,也沒有說明其平臺算法的內部運作機制。那些希望通過推特公開代碼來探究平臺內部運作機制的人可能會感到失望。研究過這些算法的工程師們表示,這是因為推特發佈的代碼省略“算法”到底是如何工作的等關鍵細節。

據紐約大學研究社交媒體的副教授、前推特員工索爾·梅辛(Sol Messing)稱,推特所公開的內容對推特算法進行“大量編輯”,其中首要問題就是沒有涵蓋在推特推薦功能中能發揮作用的所有系統。

推特表示,它沒有公開用於處理廣告的代碼、信任和安全系統,以防止不良行為者利用這些代碼進行惡意操作。此外,推特還選擇不公佈用於訓練算法的底層模型,並在一篇博客文章中解釋稱,這是為“確保用戶的安全和隱私得到保護”。梅辛認為,這個決定甚至更為重要。“算法的最關鍵部分——驅動模型仍沒有開源,”他說,“因此,算法最為核心的部分仍然讓人費解。”

馬斯克最初開源推特算法的動機似乎源於他對推特利用算法壓制言論自由的擔憂。他在去年四月份的TED演講中說:“我認為推特應該開源算法,公開對推文內容的任何更改——無論是推薦還是不推薦——都應該明明白白地呈現出來。這樣,任何人都可以看到推特采取哪些措施,就不會有任何算法或人工的幕後操作。”這一演講是馬斯克確認收購推特後不久做的。

在推特發佈的代碼中,沒有提供足夠的信息來告訴人們這個平臺是否存在潛在的偏見,也沒有提供內容來說明是否存在馬斯克想要公開的那種“幕後操縱”手段。梅辛說:“這隻是透明度的做法。”“但是這些內容並沒有真正幫助人們深入解算法的運作,也沒有讓人真正深入解為什麼有些人的推文排名會下降,而其他人的排名會上升。”

此外,梅辛還指出,推特最近在調整其應用程序編程接口(API)方面的政策,這基本上切斷絕大多數研究人員訪問大量推特平臺數據的途徑。沒有合適的API訪問權限,研究人員根本無法自行研究推特算法的新細節。梅辛在自己的分析中寫道:“在推特公佈這些代碼的同時,這種做法使得研究人員更難深入分析代碼內容。”

去年,在馬斯克首次討論“開源”推特算法的計劃後不久,分佈式人工智能研究所(DAIR)研究總監亞歷克斯·漢納(Alex Hanna)也提到研究人員審查代碼的重要性。和梅辛一樣,她也認為僅在GitHub上發佈代碼並不足以提高推特運作方式的透明度。

漢納說:“如果你真的對公眾監督推特算法等事情感興趣,那就必須采取多種方法。”

不過,推特在GitHub上公開的部分代碼確實揭示推特算法的一些內容。梅辛透露,數據科學傢傑夫·艾倫(Jeff Allen)從中挖掘出一份文件,其中的內容揭示推特如何使用“公式”為不同類型的用戶參與賦予優先級。梅辛寫道:“如果我們從字面上理解,就會發現推特上的1個贊相當於半個推文轉發。”“一條回復相當於27次轉發,而1條回復再加上推文作者的回應就相當於75次轉發。”

雖然這在一定程度上揭示一些信息,但有關推特平臺的運作方式的描述並不完整。梅辛說:“沒有實際數據的話,這種分析沒有多少意義。”“如今馬斯克讓學者獲取數據的成本高得離譜。如果他們現在真的想研究這個問題,基本上每年需要花費50萬美元的巨資才能獲得大量有意義的數據。”


相關推薦

2023-04-12

埃隆`馬斯克說,Twitter最終將在4月20日或4/20日采取行動,刪除遺留的藍色復選標記。他在一條推文中說,這是"最後的日期"。如果這一舉措得以實施,Twitter將隻為付費用戶和企業以及政府實體和官員設置認證

2023-12-01

主。同時,特斯拉還公佈Cybertruck的配置和售價。這款車到底怎麼樣呢,聽聽外媒是怎麼評價的?特斯拉交付Cybertruck彭博社:產量受限 價格太貴彭博社指出,最便宜的Cybertruck車型售價達到60,990美元(約合43萬元人民幣),比馬斯克

2022-11-01

自從埃隆-馬斯克(ElonMusk)接管Twitter以來,該網站乃至背後運營的公司一直處於動蕩不安的狀態。可以理解的是,一定比例的用戶對領導層的突然和劇烈變化一點也不滿意。許多用戶理所當然地擔心,承諾的缺乏節制和所謂的&a

2023-04-01

北京時間4月1日消息,Twitter公司周五宣佈提高透明度措施,公開決定該社交媒體如何推薦內容的部分計算機代碼,允許用戶和程序員解其工作原理,並能夠對算法提出修改建議。Twitter在一篇題為《Twitter透明度新時代》的博文中

2023-04-01

正如首席執行官埃隆-馬斯克多次承諾的那樣,Twitter已經向公眾開放部分源代碼,包括它用來在用戶時間線上推薦推文的算法。在GitHub上,Twitter發佈兩個代碼庫,其中包含使社交網絡運轉的許多部分的代碼,包括Twitter用來控制

2024-03-03

不公平商業行為在內的 5 項罪名。要求歸還收入,把技術開源,恢復非營利。其訴訟的核心,概括起來就是:OpenAI 這小子,違背造福全人類的非營利性的創立協議,成給微軟賺錢的工具。“ 尋求開源技術以造福公眾 ”這個目標

2023-02-15

Twitter首席執行官伊隆·馬斯克近日要求工程師采取措施,讓他的推文優先顯示在關註者的頁面上。根據科技媒體Platformer對知情人士的采訪和獲得的文件,在馬斯克關於超級碗的推文比美國總統拜登的推文效果差之後,他下令對

2022-07-08

臺設備將車速限制在85英裡/小時(137公裡/ 小時),但為什麼卻取消限速,導致18歲的巴利特·萊利(Barrett Riley)以116英裡/小時的速度沖出佛羅裡達的道路,撞墻身故。根據這位律師對通話內容的描述,在通過特斯拉確認詹姆斯

2024-03-13

。言外之意,能活到今天,英偉達是一路跟隨的。不管AI算法如何變,英偉達都能夠通過軟件隨機應變。事實上,在推理和訓練之間靈活切換,目前隻有英偉達。為什麼隻有它?這就要說到英偉達的CUDA計算平臺,如果把GPU看成一

2023-04-10

思維習慣,這個其實也很難做到。“而且考慮到OpenAI暫不開源,我們隻能夠一步步慢慢向前探索。如果要想超過ChatGPT,肯定就得去找到一條比它更好的實現路徑,而這個過程無疑充滿艱險。”邱錫鵬說。MOSS的實現方案。邱錫鵬

2022-09-23

。”雖然目前還不清楚馬斯克所說的父親做的“壞事”是什麼意思,但他在2017年接受采訪時稱他的父親為“糟糕的人”。他在采訪中說,你能想到的每件邪惡的事情,他(指父親)都做。馬斯克和父親和之間的關系似乎很復雜

2022-10-01

拉到現在還沒有開始交付賽博電動皮卡。周四,馬斯克在Twitter上說,這款皮卡將“足夠防水,可以臨時當船用”。特斯拉還在發佈會上探討拖延已久的自動駕駛技術。研發自動駕駛軟件的工程師描述他們如何訓練軟件進行決策

2023-01-08

協議後卻發現,馬斯克此前的承諾成空談。近日,大量前Twitter 員工收到來自“[email protected]”的郵件,該郵件將人們引向CPT集團運營的一個網站,以獲取完整的離職協議。遣散協議中指出,他們將不能夠參與到任何針對公司

2022-09-16

PoW)和Proof-of-Stake(PoS)都是區塊鏈網絡上共識機制的的算法。但PoW工作量證明模型需要計算機競相求解復雜的數學方程,花費大量算力和能量以驗證交易。而PoS權益證明模型則將網絡的控制權委托給代幣的所有者,通過計算你