每小時或標註2萬個單詞 最低時薪僅9元 ChatGPT背後的“血汗工廠”曝光


於2022年11月發佈,ChatGPT被譽為當年最具創新性的人工智能工具之一。這項強大的AI聊天機器人幾乎可以生成任何問題的文本,從莎士比亞的十四行詩,到用5歲孩子都能理解語言描述的復雜數學問題,可謂“無所不能”。

瑞銀此前發佈的一份研究報告顯示,ChatGPT的月活躍用戶在今年1月份預計達到1億,這距離其推出隻有2個月時間,成為史上增長最快的消費者應用

然而,在ChatGPT掀起的這場人工智能“革命”和資本市場狂歡的背後,有一個被邊緣化的、被遺忘的卻又至關重要的群體,值得所有人關註,他們就是數據標註員。

據美國《時代周刊》上月中旬的報道,為訓練ChatGPT,OpenAI雇傭時薪不到2美元的肯尼亞外包勞工,他們所負責的工作就是對龐大的數據庫手動進行數據標註。

時薪1.32~2美元 每小時或標註超2萬個單詞

從當下看來,OpenAI已經成為“生成式人工智能”行業無可爭議的領頭羊。

最樂觀的投資者認為,計算機生成的文本、圖像、視頻和音頻將改變無數行業的經營方式,從創意藝術到法律,再到計算機編程,該技術都將提高人類的工作效率。

然而,數據標簽員工的工作條件揭示行業背後“黑暗”的部分:盡管人工智能魅力無限,但它往往依賴於全球最廉價的勞動力,他們往往被大幅剝削。盡管他們為數十億美元的產業作出傑出貢獻,但這些幾乎“隱形”的工人仍然處於最邊緣的地帶。

《時代周刊》查閱的文件顯示,OpenAI在2021年底與Sama簽署三份總價值約20萬美元的合同,為數據庫中有害的內容進行標記

Sama是一傢總部位於美國舊金山的公司,該公司雇傭肯尼亞、烏幹達和印度的外包員工。

大約30多名工作人員被分成三個小組,每個小組都專註於一個主題。三名員工對《時代周刊》表示,他們每9個小時要閱讀和標註150~200段文字。這些段落的范圍從100個單詞到1000多個單詞不等。如此計算,平均每小時他們最多要閱讀和標註超2萬個單詞

接受《時代周刊》采訪的四名員工都表示,這份工作給他們留下持久的心理創傷。盡管他們有權參加健康咨詢師課程,但四人都表示,由於對工作效率的要求很高,他們隻能選擇參加小組會議。其中還有一人表示,他們要求以一對一的方式與心理咨詢師會面的請求被Sama管理層多次拒絕

Sama官網截圖
Sama官網截圖

合同規定,OpenAI將為該項目向Sama支付每小時12.50美元的報酬,這是該項目員工時薪的6~9倍

《時代周刊》稱,其查閱數百頁Sama和OpenAI的內部文件(包括工人工資單),並采訪Sama四名參與該項目的員工,驚人的內幕顯示,Sama為OpenAI雇傭的數據標簽員工支付的時薪在1.32美元~2美元之間(約8.99元~13.62元),具體取決於資歷和表現

據Sama員工透露,“代理商”是三個小組中最初級的數據標簽人員,他們的基本工資為每月2.1萬肯尼亞先令(約170美元或者約1158元)。此外,他們每月還能獲得約70美元(約477元)的獎金,如果達到準確性和速度等關鍵績效指標,他們還可以獲得傭金。

按此計算,一名每天工作9小時的員工預計稅後時薪至少能拿1.32美元,如果超額完成所有目標,則最高可達到1.44美元。質量分析師是資歷更深的數據標簽員工,他們的工作是檢查“代理商”的工作,如果他們達到所有績效目標,時薪可以拿到2美元

公開資料顯示,肯尼亞並沒有統一的最低工資標準,但當這些外包員工受雇時,肯尼亞首都內羅畢的最低時薪是1.52美元

據《時代周刊》報道,Sama的一名發言人在一份聲明中稱,公司對工人的要求是在9小時的工作中標註70段文字,而非200段。此外,工人們的稅後時薪是1.46美元~3.74美元,不過這位發言人拒絕透露哪類崗位會達到其所述時薪區間的上限。

OpenAI的一位發言人則在另一份聲明中稱,該公司沒有發佈任何的業績目標,且外包員工的工資和心理健康由Sama的管理層負責。

2022年2月,Sama開始為OpenAI的另一個項目進行試點工作,但工作內容根據美國的法律是非法的。盡管這項試點工作似乎與ChatGPT無關,但僅僅在幾周之內,Sama便叫停與OpenAI的所有項目,比合同中約定的時間提前8個月。

Sama當時在一份聲明中稱,其為OpenAI收集的圖像協議中不包括任何涉及非法的內容,直到相關工作開始後,OpenAI才發來“附加指示”,提到“一些非法的類別”,隨後肯尼亞團隊的高管立即提出擔憂並結束該項目。

Sama曾向多傢矽谷大廠提供類似服務 自稱是“有道德的人工智能公司”

訓練ChatGPT對OpenAI來說至關重要。

ChatGPT的前身GPT-3已經展示非常強大的語句串聯的能力。然而,當時的GPT-3卻存在很多弊端,例如內容容易出現暴力、性別歧視等言論。之所以會出現這樣的不足之處,是因為AI工具從互聯網抓取數千億個單詞來訓練,這也是一把雙刃劍——由於互聯網的詞匯有不少帶有偏見及負面的詞匯,因此單純憑借學習能力無法來清除這些訓練數據。

《時代周刊》的報道顯示,即使是一個由數百人組成的團體,也需要幾十年的時間才能手動搜索龐大的數據庫。OpenAI隻能通過建立一個額外的、AI驅動的安全機制,才能控制上述弊端,創造出適合人們日常使用的聊天機器人。

《時代周刊》報道截圖
《時代周刊》報道截圖

據報道,為建立這個安全系統,OpenAI借鑒Facebook(現Meta)等社交媒體公司的做法。此前,Facebook已經證明其可以構建能夠檢測仇恨言論等的AI工具,並將這些內容從其平臺上移除。這項工作也很簡單:給AI提供標有暴力、仇恨語言等標簽,AI工具就可以學會檢測這些內容。目前類似的工具已經內置到ChatGPT當中,以檢測它是否與訓練數據的內容相呼應,並在它觸及到用戶之前將不良內容過濾掉。

《時代周刊》報道稱,為獲得這些有害內容的標簽,OpenAI從2021年11月開始便向一傢外包公司發送數萬條文本片段。其中大部分文字似乎都是從互聯網“最黑暗的角落”挖掘出來的。

據報道,OpenAI發言人曾在一份聲明中證實,Sama在肯尼亞的員工為該公司正在開發的監測有害內容的工具作出貢獻,該工具最終被內置到ChatGPT中

除OpenAI,Sama還為谷歌、Mate和微軟等矽谷科技巨頭標註數據。此外,Sama還標榜其是一傢“有道德的人工智能公司”,並稱其已經幫助5萬多人脫貧。

人工智能組織聯盟Partnership on AI表示,“盡管這些豐富數據的專業人士發揮基礎作用,但越來越多的研究表明,這些工人都面臨著不穩定的工作條件。這可能是慶祝技術效率提升的同時,試圖掩蓋人工智能對龐大勞動力依賴的結果。”

記者|蔡鼎

編輯|段煉 高涵 杜波


相關推薦

2023-05-08

5月7日消息OpenAI的聊天機器人ChatGPT靠外包工人的訓練工作才能成就輝煌。這些工人為訓練數據打標簽,和機器人來回對話並糾正系統生成的答案。這些美國外包工人的時薪超過15美元,他們中既有為生計者,也有為搶先一步解人

2023-09-17

脹保護措施等。目前,底特律汽車企業工會工人起薪約為每小時18美元(約合人民幣123元),達到一定工齡的工人最高工資約為每小時32美元。40%的加薪將是下一個四年合同期內的總體漲薪幅度,不過目前來看,車企們答應該請

2023-03-02

今日凌晨,OpenAI放出真正的ChatGPTAPI,不是背後的GPT-3.5大模型,是ChatGPT的本體模型!ChatGPTAPI價格為1ktokens/$0.002,等於每輸出100萬個單詞,價格才2.7美金(約18元人民幣),比已有的GPT-3.5模型便宜10倍。手快的開發者可以沖!這將

2024-02-26

ChatGPT在公眾中流行的時間並不長,但它在法律領域的應用卻並不順利。雖然最近發生的事件並不涉及人工智能生成器引用編造的案例,但有一傢律師事務所因為使用該工具計算律師費,每小時"超標"600美元而

2024-02-09

顯示,根據最新生效的薪資標準,特斯拉美國工廠工人的最低時薪為22美元(約合人民幣158元),而最高為39美元(約合人民幣280元)。特斯拉去年12月曾宣佈,將給工廠工人漲薪,今年1月8日,該薪資標準正式生效。根據新標準

2023-02-16

在美國《科學公共圖書館·數字健康》的一篇文章提到,ChatGPT參加美國執業醫師資格考試。這項以高難度著稱的考試中,共350道題,內容涵蓋基礎科學、生物化學、診斷推理和生物道德學。ChatGPT未經專門的培訓或強化,經過兩

2024-02-21

查”的新承包商。傑伊的時薪高達60美元,他在OpenAI推出ChatGPT之前的一個月加入Remotasks。自那時起,該公司加速招聘專業“數據標註工”。據《連線》雜志報道,2024年1月,Remotasks發佈招聘廣告,尋找能夠掌握20多種歐洲語言的

2023-02-17

羅馬不是一天建成的。當人工智能對話工具ChatGPT一夜之間成為頂流,在略顯沉悶的科技界如閃電般發出炫目光芒後,它似乎點亮指引投資界方向的明燈,一些商界人士的內心開始“騷動”。的確,這個成績是史無前例的。ChatGPT

2023-02-10

號稱史上最強AI的ChatGPT知道自己每天排放多少二氧化碳嗎?一番溝通後,華爾街見聞得到否定的答案。看來暫時隻能由人腦來替它回答。環球零碳研究中心研究員唐淑姝告訴華爾街見聞,如果粗略合算ChatGPT的總生命周期碳足跡

2022-09-26

提出單位服務時間的收入指標(IPSH)。指標顯示,平均每小時50元以上收入的車主占比達到54.2%。

2023-03-14

格也有不同。目前,市場上共享充電寶的租用價格大多是每小時3元,而熱門景點、商業區、車站等地的價格在每小時4到6元不等;在個別點位,價格甚至達到每小時8元。例如,美團(嘉裡中心)與 美團(子木造型)收費標準不

2024-02-13

得最高薪酬。根據內部文件,特斯拉將工廠工人的工資從每小時至少22美元(約合人民幣160元)提高到最高39美元(約合人民幣280元)。特斯拉工廠的工人分為七個級別,領導崗位分為兩個級別。根據工作表現和特斯拉的總體業

2023-02-01

誕生!受試者通過植入設備,平均輸入速度能達每分鐘62個單詞,是團隊之前紀錄的3倍。同時準確率也有明顯提升,面向50個單詞詞匯表,識別準確率比先前紀錄提升2.7倍。據研究者稱,這已開始接近正常人溝通速度(每分鐘160

2024-08-20

、戴著虛擬現實頭盔來訓練人型機器人擎天柱,時薪介於每小時25.25美元(約合人民幣180元)至48美元(約合人民幣344元)之間。特斯拉官網介紹,應聘員工身高需在1米70到1米80之間,穿戴動捕服和虛擬現實頭盔,沿預定路線行