AI外包正轉向歐美地區尋找各類專業人才訓練大模型

2024-02-21 來自網易科技發表於業界精選

2月21日消息，隨著傳統職業人員如語言專傢、創意作傢和核物理學傢等逐漸成為“數據標註工”，他們的職業前景正變得岌岌可危，最終可能被他們所培訓的人工智能系統所取代。以下是翻譯內容：

傑伊（Jay）高中時愛上數學，他的物理老師向他展示復雜微積分的樂趣。大學時期，傑伊專攻物理和數學，夢想有朝一日能將自己的知識傳授給下一代。這個機會出現在2022年10月，當時25歲的傑伊加入一個在線平臺，以數學專傢的身份為方程式打分。但他的工作不同於傳統教師，他的工作重心將聚焦於訓練一個人工智能系統，而這恰恰可能使他的專業知識變得不再那麼重要。

為保護自己的隱私，傑伊選擇使用化名。他透露，他當時幫助培訓的系統由OpenAI開發，他的工作是為該公司的大語言模型（LLM）提供專傢指導。這一機器學習系統具備聊天機器人的會話能力，並試圖提升其在數學領域的解題能力。在葡萄牙的傢中，傑伊負責評估人工智能模型在解決數學問題時的步驟是否正確，通過添加點贊或不滿的表情符號來提供反饋，甚至在必要時解釋模型出錯的原因。

傑伊知道，他是在為薩姆·奧特曼（Sam Altman）領導的OpenAI訓練算法，因為他被邀請加入OpenAI的Slack工作頻道。在與《連線》分享的截圖顯示，傑伊是名為“數學培訓師”的小組成員，該小組是由OpenAI研究員尤裡·佈爾達（Yuri Burda）建立的。但傑伊並非直接為OpenAI工作，他的雇主是全球最大的數據勞動平臺之一Remotasks。這傢公司是美國初創公司ScaleAI的子公司，2021年的估值已超70億美元，其客戶涵蓋OpenAI、Meta、微軟和美國陸軍等。

Scale AI與客戶密切合作，提供和管理他們需要的訓練數據，以建立自動駕駛汽車或大語言模型背後的人工智能模型。通常情況下，這些寶貴的數據往往來源於與Scale AI緊密合作的Remotasks簽約員工。自2017年成立以來，這傢數據巨頭已與全球數十萬名員工建立合作關系，尤其是在勞動力成本相對較低的國傢，如菲律賓。Remotasks表示，菲律賓員工主要致力於自動駕駛汽車的計算機視覺訓練，幫助車輛精準識別周圍環境。

然而，在過去的一年裡，Scale AI的重點已轉向美國和歐洲。他們正積極招募白領和語言專傢，為日益興起的大語言模型提供訓練數據。這一轉變無疑加劇人們對未來職業的擔憂，這些白領和語言專傢正在訓練將來可能取代他們職業的人工智能競爭對手。

傑伊對自己在未來工作中充當的角色進行深入反思。他承認自己在傳遞知識給人工智能，但他堅信，人工智能模型難以復制人類在解決復雜數學問題時的獨特能力。他期望自己參與的工作能夠創造出與他水平相當的聊天機器人，共同探索數學的奧秘，而非取代他的人工智能。他說：“當我開始訓練這些模型時，這正是我所期待的。”

面對人工智能系統的崛起，Scale AI負責數據運營的副總裁威洛·普裡馬克（Willow Primack）強調，隨著AI系統開始生成知識和內容，Remotasks等公司正尋求不同領域的專傢幫助，以確保人工智能應用的準確性和可靠性。隨著生成式人工智能在科技行業的廣泛應用，數據提供商急需一批能夠進行“專傢事實核查”的新承包商。

傑伊的時薪高達60美元，他在OpenAI推出ChatGPT之前的一個月加入Remotasks。自那時起，該公司加速招聘專業“數據標註工”。據《連線》雜志報道，2024年1月，Remotasks發佈招聘廣告，尋找能夠掌握20多種歐洲語言的人才，以及美國的創意作傢、體育記者、化學專傢和核物理學傢。

普裡馬克說：“如果讓生成性人工智能完全依賴自身，它們可能會產生幻覺。即便它們提供的答案是事實，也有辦法改進，使其更加全面。專傢的參與至關重要，他們提供的數據能夠真正提升人工智能的能力。”

普裡馬克表示，盡管Scale AI在菲律賓擁有龐大的運營規模，但該公司正逐步將重心轉向美國和以英語為母語的歐洲地區，尋求更多專業承包商的加入。普裡馬克不太願意透露到底是什麼促使這種轉變，是特定的Scale AI客戶要求更多的專傢數據，還是該公司試圖預測下一代AI需要什麼？她稱兩者兼而有之，並解釋說，專業承包商正為眾多客戶培訓數據，而不僅僅是為單一客戶服務。

對於這一轉變的影響，行業研究人員給出自己的解釋。德國魏森鮑姆研究所的數據、算法系統和倫理研究小組負責人米拉格羅斯·米塞利（Milagros Miceli）指出，過去大多數人工智能技術都是在大型、多樣化的數據集上進行訓練的。然而，隨著版權問題的日益突出，許多知名出版商開始禁止數據收集，這使得數據收集變得更加困難。因此，付錢給專業承包商成為一種可行的解決方案。

“去年，很多公司都在創建新的數據，以避免版權投訴。”米塞利解釋道，“如果你雇傭一名作傢專門為訓練你的模型而寫故事，並支付他們薪水，那麼你就擁有這些文本的所有權，也就解決版權問題。”

自ChatGPT等生成式人工智能技術亮相以來，越來越多的研究預測，在美國和歐洲，那些通常由受過大學教育的人占據的職業將面臨顛覆性的變革，而這些人以前通常被認為不會受到技術變革的影響。盡管存在這些擔憂，但專業承包商提供的高薪工作仍然極具吸引力，可能讓一些人難以放棄可能導致他們失業的培訓工作。

目前，專業職位的薪酬因專業知識而異。根據最新的招聘信息，傳染病專傢在遠程培訓任務上的時薪最高可達40美元，而歷史學傢的時薪為32美元。然而，受雇於特定語言訓練算法的人往往得到的報酬更少。例如，一份招聘保加利亞作傢的廣告給出的時薪為5.64美元，而會說芬蘭語的專傢的時薪幾乎是保加利亞作傢的五倍，達到23美元。

最近剛大學畢業的安娜（Ana）住在西班牙，她認為Remotasks為像她這樣的作傢提供17美元時薪“非常高”。這項工作包括監督名為Catalan的聊天機器人，然後對其回答進行排序或糾正。安娜說：“我們必須糾正拼寫錯誤，還要看看答案是否過於美國化。”

當提示與色情或暴力有關時，由安娜來確保機器人拒絕回答。她還被要求確保人工智能不能回答諸如“我應該把畢生的積蓄投資在哪裡?”之類的問題。

對安娜來說，這份工作很劃算。因為地處偏遠，她可以在媽媽靠近海灘的房子裡工作。“我度過最美好的夏天，”她說，並解釋她在2023年5月、6月和7月為遠程任務采用的靈活時間表。“在20個小時內，我賺的錢比以前工作40個小時還多。”她被告知要工作六個月左右。但到8月焚滅，僅僅三個半月後，任務開始減少。最終，她的經理也不再回復她的信息。

安娜的經歷表明，雖然白領“數據標註工”的薪資可能高於東南亞同行，但他們仍然面臨著不確定性。傑伊和安娜都說，Remotasks突然切斷他們的聯系，他們覺得自己被拋棄，而原因他們並不完全解。工作一年之後，傑伊說他突然無法再領取平臺上的任務。普裡馬克也稱，當被問及項目為何突然終止時，Remotasks的解釋是，他們有時會暫停一個項目，以評估數據集的質量。但普裡馬克承認，這種情況相當罕見。

那年夏天，安娜的朋友們圍繞她的新職業展開深入的討論，擔憂這一趨勢是否預示著人工智能將逐漸取代他們的工作。但今天，她認為這隻是人類進步的又一個篇章，一個她也可以利用的篇章。對她而言，人工智能不是威脅，而是助力，是她可以積極利用的工具。她說：“假設你不想在烈日下在土豆地裡工作9個小時。你要想出一種技術，讓它變得更容易。”

安娜現在把這些反思運用到自己的工作中，成為一名文案，利用人工智能來為她出謀劃策。（小小）

AI外包正轉向歐美地區尋找各類專業人才訓練大模型

相關推薦

谷歌深夜放復仇殺器Gemini：最強原生多模態史詩級碾壓GPT-4 語言理解首超人類

Sora“炸場” 中美AI差距有多大？

Cerebras打破在單個設備上訓練大規模AI模型的紀錄

狂飆的ChatGPT，為什麼是OpenAI最先做出來？

“AI訓練師”培訓，盯上小城市

超越GPT4！谷歌大殺器終於來最大規模Gemini震撼發佈

高盛測算：生成式AI將搶走全球3億崗位律師和行政風險最大

普華永道美國豪擲10億美元開發AI “財務的末日”更近？

AI產業的灰暗面：OpenAI、谷歌、Meta如何獲取訓練語料

OpenAI秘史公開：馬斯克和奧特曼的戰爭與錢無關

OpenAI把微軟電網搞崩 GPT-6被曝25年發佈訓練刷爆10萬張H100

阿裡版ChatGPT已開啟內側：有望在4月11日亮相

生成式AI會搶走你的飯碗嗎？

ChatGPT背後的外包工人：在美時薪超15美元幹的都是苦力活

AI外包正轉向歐美地區 尋找各類專業人才訓練大模型

相關推薦

AI外包正轉向歐美地區尋找各類專業人才訓練大模型