5月7日消息OpenAI的聊天機器人ChatGPT靠外包工人的訓練工作才能成就輝煌。這些工人為訓練數據打標簽,和機器人來回對話並糾正系統生成的答案。這些美國外包工人的時薪超過15美元,他們中既有為生計者,也有為搶先一步解人工智能發展狀況的人。
以下是翻譯內容:
現年34歲的阿列克謝·薩夫勒(Alexej Savreux)住在密蘇裡州堪薩斯城,他說自己這些年來做過各種各樣的工作:賣過快餐三明治、當過保管員、垃圾搬運工,還曾為劇場安裝過音響。現在,他成一名人工智能訓練師,不再需要從事體力勞動。
作為人工智能行業眾多外包大軍中的一員,薩夫勒等人一直在幕後訓練人工智能系統如何分析數據,以便讓人工智能最終生成各種讓用戶驚嘆不已的文本和圖像。為提高人工智能的準確性,薩夫勒會為各種照片貼上標簽,並預估應用程序接下來應該生成什麼文本。
雖然他們的時薪超過15美元,但並沒有任何福利。
在過去幾年中,薩夫勒和其他外包工人花費大量時間來訓練OpenAI的人工智能系統,以便讓ChatGPT能夠更好地響應用戶。這些工人提供OpenAI等人工智能企業所需的文本、標簽及其他信息,滿足企業們無休止的迫切需求。
去年11月份,OpenAI發佈人工智能聊天機器人ChatGPT,引起生成式人工智能領域的熱潮。薩夫勒說:“我們幹的都是苦力活,但如果沒有我們,就不會有人工智能語言系統。”
薩夫勒說:“你可以設計所有你想要的神經網絡,你可以讓所有你想要的研究人員參與進來,但如果沒有標簽,你就沒有ChatGPT。你什麼都沒有。”
這份工作不會給薩夫勒帶來多少名聲或財富,但在人工智能領域中,這是一份容易被忽視的重要工作,外包工人的勞動可能會在新技術前沿的魔力面前黯然失色。
總部位於舊金山的非營利組織人工智能夥伴關系(Partnership on AI)致力於推動人工智能方面的研究和教育。該組織的人工智能、勞工和經濟項目負責人索南·金達爾(Sonam Jindal)表示:“很多人在慶祝人工智能的成就,但我們忽略一個重要組成部分,那就是如今人工智能仍然非常依賴於大量人力。”
多年來,科技行業一直依賴於成千上萬的低技能、低收入工人來支撐其龐大的計算機業務,從20世紀50年代的穿孔卡操作員到最近抱怨自己在公司是二等公民的谷歌合同工都是如此。隨著各種外包平臺的興起,很多在線零工工作也更受人歡迎。
如今,蓬勃發展的人工智能行業也在上演類似的劇情。
這種外包工作通常不穩定,隨時隨地都可能因為需求變化而變動。從事此類工作的員工要麼直接與公司簽訂書面合同,要麼被專門從事臨時工或外包業務的第三方供應商雇用。他們能獲得的醫療保險等福利很少或根本不存在,這意味著科技公司的人力成本更低。此外,這些工作通常是匿名的,所有的功勞都被歸功於科技公司的高管和研究人員。
人工智能夥伴關系在2021年的一份報告中警告稱,通過添加、更新、清洗和處理來自外部數據源的數據,以改進現有數據集的“數據擴充工作”(data enrichment)的需求即將激增。該組織建議人工智能行業致力於推動公平薪酬和其他改進做法。去年,他們發佈企業自願遵守的指導方針。
目前,谷歌旗下的人工智能公司DeepMind是迄今唯一一傢公開承諾遵守這些準則的科技公司。
金達爾表示:“很多人已經認識到這一點很重要。現在的挑戰是讓公司能夠真正踐行。”
“這是一個由人工智能創造的新工作崗位,”她補充說。“我們有可能讓這份工作成為高質量的工作,從業者因他們為實現技術進步所做的貢獻而受到尊重和重視。”
最近,工作需求已經出現激增,而一些從事人工智能外包工作的工人開始要求提高待遇。據報道,上周一,肯尼亞內羅畢有150多名在Facebook、TikTok和ChatGPT從事人工智能工作的工人已成立工會,理由是他們認為工資低,而且工作對精神造成一定程度的傷害。Facebook和TikTok沒有立即回應置評請求。OpenAI拒絕置評。。
到目前為止,美國從事人工智能外包工作的員工還沒有類似動作,他們還在逐字逐句為開發人工智能系統默默做貢獻。
薩夫勒是通過網上招聘廣告進入這個行業的,現在在傢裡使用筆記本電腦工作。薩夫勒認為,人工智能領域的這種零工幫助他擺脫無傢可歸的境地,畢竟每小時15美元的工資比堪薩斯城的最低工資要高。雖然有些人可能認為這些必要的費力工作微不足道,但薩夫勒認為這是機器學習領域必不可少的初級工作。
人工智能外包工作的招聘信息既說明行業需求激增,也反映出這項工作有時會讓人筋疲力盡。臨時工中介Invisible Technologies在招聘廣告中聲稱,他們正在尋找“高級人工智能數據訓練師”,這份工作是初級工種,每小時起薪15美元,但也可能“有益於人們”。招聘啟事上這樣寫道:“你可以把這份工作看成是語言藝術老師,或者是最具影響力的技術私教。” Invisible Technologies表示,新員工將“在世界領先人工智能研究人員制定的協議下”工作,但沒有透露所服務客戶的名字。
雖然目前尚未有確切數據表明有多少外包工人在為人工智能公司工作,但這種工作形式在全球范圍內變得越來越普遍。今年1月份的報道稱,OpenAI雇用來自肯尼亞的低薪工人來標記包含各種不良內容的文本,以幫助應用程序更好地識別。
此外今年年初有報道稱,OpenAI已經還在東歐和拉丁美洲等地雇傭大約1000名遠程外包工人,專門為數據打標簽或訓練公司軟件。盡管OpenAI首席執行官薩姆·奧爾特曼(Sam Altman)在推特上表示,截至今年1月份,OpenAI仍然是一傢小公司,大約隻有375名員工,但這個數字並不包括外包工人,也無法完全反映公司的運營規模。OpenAI一位發言人表示,沒人可以回答有關使用人工智能外包工人的問題。
創造數據來訓練人工智能模型的工作並不總是那麼簡單,有時也相當復雜,但足以吸引那些想在人工智能行業領域創業的人士。
22歲的賈京·庫馬爾(Jatin Kumar)來自德克薩斯州奧斯汀,畢業於計算機科學專業,從事人工智能工作已經有一年時間。。他表示,這讓他解到生成式人工智能技術的最新發展方向。庫馬爾說:“這讓你有機會在公眾接觸到這項技術之前,就開始考慮如何運用它。”此外,他還創立一傢名為Bonsai的科技初創公司,專門為醫院開發計費軟件。
作為一名人工智能會話培訓師,庫馬爾的主要工作是與聊天機器人進行對話,提出各種問題,這是訓練人工智能系統漫長過程的一部分。他說,開始時這很簡單,但隨著經驗的積累,這些任務變得越來越復雜。“每隔30到45分鐘,你就會接到一個新任務,要提出新的問題,”庫馬爾說,開始提示可能很簡單,比如“法國的首都是哪裡?”
庫馬爾說,他與其他約100名外包工人合作生成訓練數據,糾正答案,並通過對答案進行反饋來微調模型。
庫馬爾表示,其他工作人員會處理“標記過”的對話內容。有些用戶會將聊天機器人的答案反饋給公司進行審查,工作人員會閱讀ChatGPT用戶提交的對話。當有一個被標記的對話出現時,工作人員會根據所涉及的錯誤類型進行分類,然後用於進一步訓練人工智能模型。
庫馬爾說:“最初,這是我在OpenAI幫助解決問題,學習現有技術的一種方式。”但他表示,現在他無法想象離開這個崗位。