AI外包正轉向歐美地區 尋找各類專業人才訓練大模型


2月21日消息,隨著傳統職業人員如語言專傢、創意作傢和核物理學傢等逐漸成為“數據標註工”,他們的職業前景正變得岌岌可危,最終可能被他們所培訓的人工智能系統所取代。以下是翻譯內容:

106803992-1606785337289-Handout_scale_team-4.jpg

傑伊(Jay)高中時愛上數學,他的物理老師向他展示復雜微積分的樂趣。大學時期,傑伊專攻物理和數學,夢想有朝一日能將自己的知識傳授給下一代。這個機會出現在2022年10月,當時25歲的傑伊加入一個在線平臺,以數學專傢的身份為方程式打分。但他的工作不同於傳統教師,他的工作重心將聚焦於訓練一個人工智能系統,而這恰恰可能使他的專業知識變得不再那麼重要。

為保護自己的隱私,傑伊選擇使用化名。他透露,他當時幫助培訓的系統由OpenAI開發,他的工作是為該公司的大語言模型(LLM)提供專傢指導。這一機器學習系統具備聊天機器人的會話能力,並試圖提升其在數學領域的解題能力。在葡萄牙的傢中,傑伊負責評估人工智能模型在解決數學問題時的步驟是否正確,通過添加點贊或不滿的表情符號來提供反饋,甚至在必要時解釋模型出錯的原因。

傑伊知道,他是在為薩姆·奧特曼(Sam Altman)領導的OpenAI訓練算法,因為他被邀請加入OpenAI的Slack工作頻道。在與《連線》分享的截圖顯示,傑伊是名為“數學培訓師”的小組成員,該小組是由OpenAI研究員尤裡·佈爾達(Yuri Burda)建立的。但傑伊並非直接為OpenAI工作,他的雇主是全球最大的數據勞動平臺之一Remotasks。這傢公司是美國初創公司ScaleAI的子公司,2021年的估值已超70億美元,其客戶涵蓋OpenAI、Meta、微軟和美國陸軍等。

Scale AI與客戶密切合作,提供和管理他們需要的訓練數據,以建立自動駕駛汽車或大語言模型背後的人工智能模型。通常情況下,這些寶貴的數據往往來源於與Scale AI緊密合作的Remotasks簽約員工。自2017年成立以來,這傢數據巨頭已與全球數十萬名員工建立合作關系,尤其是在勞動力成本相對較低的國傢,如菲律賓。Remotasks表示,菲律賓員工主要致力於自動駕駛汽車的計算機視覺訓練,幫助車輛精準識別周圍環境。

然而,在過去的一年裡,Scale AI的重點已轉向美國和歐洲。他們正積極招募白領和語言專傢,為日益興起的大語言模型提供訓練數據。這一轉變無疑加劇人們對未來職業的擔憂,這些白領和語言專傢正在訓練將來可能取代他們職業的人工智能競爭對手。

傑伊對自己在未來工作中充當的角色進行深入反思。他承認自己在傳遞知識給人工智能,但他堅信,人工智能模型難以復制人類在解決復雜數學問題時的獨特能力。他期望自己參與的工作能夠創造出與他水平相當的聊天機器人,共同探索數學的奧秘,而非取代他的人工智能。他說:“當我開始訓練這些模型時,這正是我所期待的。”

面對人工智能系統的崛起,Scale AI負責數據運營的副總裁威洛·普裡馬克(Willow Primack)強調,隨著AI系統開始生成知識和內容,Remotasks等公司正尋求不同領域的專傢幫助,以確保人工智能應用的準確性和可靠性。隨著生成式人工智能在科技行業的廣泛應用,數據提供商急需一批能夠進行“專傢事實核查”的新承包商。

傑伊的時薪高達60美元,他在OpenAI推出ChatGPT之前的一個月加入Remotasks。自那時起,該公司加速招聘專業“數據標註工”。據《連線》雜志報道,2024年1月,Remotasks發佈招聘廣告,尋找能夠掌握20多種歐洲語言的人才,以及美國的創意作傢、體育記者、化學專傢和核物理學傢。

普裡馬克說:“如果讓生成性人工智能完全依賴自身,它們可能會產生幻覺。即便它們提供的答案是事實,也有辦法改進,使其更加全面。專傢的參與至關重要,他們提供的數據能夠真正提升人工智能的能力。”

普裡馬克表示,盡管Scale AI在菲律賓擁有龐大的運營規模,但該公司正逐步將重心轉向美國和以英語為母語的歐洲地區,尋求更多專業承包商的加入。普裡馬克不太願意透露到底是什麼促使這種轉變,是特定的Scale AI客戶要求更多的專傢數據,還是該公司試圖預測下一代AI需要什麼?她稱兩者兼而有之,並解釋說,專業承包商正為眾多客戶培訓數據,而不僅僅是為單一客戶服務。

對於這一轉變的影響,行業研究人員給出自己的解釋。德國魏森鮑姆研究所的數據、算法系統和倫理研究小組負責人米拉格羅斯·米塞利(Milagros Miceli)指出,過去大多數人工智能技術都是在大型、多樣化的數據集上進行訓練的。然而,隨著版權問題的日益突出,許多知名出版商開始禁止數據收集,這使得數據收集變得更加困難。因此,付錢給專業承包商成為一種可行的解決方案。

“去年,很多公司都在創建新的數據,以避免版權投訴。”米塞利解釋道,“如果你雇傭一名作傢專門為訓練你的模型而寫故事,並支付他們薪水,那麼你就擁有這些文本的所有權,也就解決版權問題。”

自ChatGPT等生成式人工智能技術亮相以來,越來越多的研究預測,在美國和歐洲,那些通常由受過大學教育的人占據的職業將面臨顛覆性的變革,而這些人以前通常被認為不會受到技術變革的影響。盡管存在這些擔憂,但專業承包商提供的高薪工作仍然極具吸引力,可能讓一些人難以放棄可能導致他們失業的培訓工作。

目前,專業職位的薪酬因專業知識而異。根據最新的招聘信息,傳染病專傢在遠程培訓任務上的時薪最高可達40美元,而歷史學傢的時薪為32美元。然而,受雇於特定語言訓練算法的人往往得到的報酬更少。例如,一份招聘保加利亞作傢的廣告給出的時薪為5.64美元,而會說芬蘭語的專傢的時薪幾乎是保加利亞作傢的五倍,達到23美元。

最近剛大學畢業的安娜(Ana)住在西班牙,她認為Remotasks為像她這樣的作傢提供17美元時薪“非常高”。這項工作包括監督名為Catalan的聊天機器人,然後對其回答進行排序或糾正。安娜說:“我們必須糾正拼寫錯誤,還要看看答案是否過於美國化。”

當提示與色情或暴力有關時,由安娜來確保機器人拒絕回答。她還被要求確保人工智能不能回答諸如“我應該把畢生的積蓄投資在哪裡?”之類的問題。

對安娜來說,這份工作很劃算。因為地處偏遠,她可以在媽媽靠近海灘的房子裡工作。“我度過最美好的夏天,”她說,並解釋她在2023年5月、6月和7月為遠程任務采用的靈活時間表。“在20個小時內,我賺的錢比以前工作40個小時還多。”她被告知要工作六個月左右。但到8月焚滅,僅僅三個半月後,任務開始減少。最終,她的經理也不再回復她的信息。

安娜的經歷表明,雖然白領“數據標註工”的薪資可能高於東南亞同行,但他們仍然面臨著不確定性。傑伊和安娜都說,Remotasks突然切斷他們的聯系,他們覺得自己被拋棄,而原因他們並不完全解。工作一年之後,傑伊說他突然無法再領取平臺上的任務。普裡馬克也稱,當被問及項目為何突然終止時,Remotasks的解釋是,他們有時會暫停一個項目,以評估數據集的質量。但普裡馬克承認,這種情況相當罕見。

那年夏天,安娜的朋友們圍繞她的新職業展開深入的討論,擔憂這一趨勢是否預示著人工智能將逐漸取代他們的工作。但今天,她認為這隻是人類進步的又一個篇章,一個她也可以利用的篇章。對她而言,人工智能不是威脅,而是助力,是她可以積極利用的工具。她說:“假設你不想在烈日下在土豆地裡工作9個小時。你要想出一種技術,讓它變得更容易。”

安娜現在把這些反思運用到自己的工作中,成為一名文案,利用人工智能來為她出謀劃策。(小小)


相關推薦

2023-12-07

此它也能更好地理解細微的信息,回答與復雜主題相關的各類問題。比如,用戶先是上傳一段非英語的音頻,然後又錄一段英語的音頻來提問。要知道,一般設計音頻的歸納,都是用文字輸入prompt。而Gemini卻可以同時處理兩段不

2024-02-26

,總計要操作24000次。而研究人員首先收集一波數據標註外包們玩遊戲的數據,其中包含視頻和鍵鼠操作的記錄。然後,利用這些數據制作逆動力學模型(inverse dynamics model,IDM),從而推測出視頻裡每一步在進行的時候,鍵鼠都

2022-06-23

更高。但通常隻有極少數公司擁有如此龐大的必要資源和專業知識,來分解這些大型模型、並將之分散到數百、或數千個 GPU 上去艱苦運算。正因如此,我們隻看到過極少數公司能夠訓練大型 NLP 模型 —— 這對行業內的其他人來

2023-02-11

行改進。因為加入人工標註環節,OpenAI為此雇傭大約40位外包人員來與機器人對話。通過這樣的訓練,OpenAI獲得更真實、更無害,並且更好地遵循用戶意圖的語言模型InstructGPT,在2022年3月發佈,並同期開始構建InstuctGPT的姊妹模

2024-08-02

焦」,他們全國各地都有學員,但隻在當地辦夜校,其他地區均為線上授課,每月都有兩三百名當地學員報名。另一傢位於南方某二線城市的AI培訓機構情況也差不多,很多當地的年輕人甚至寶媽,都來報名,他還展示培訓“戰

2023-12-07

自推出以來最大的升級。升級版 Bard 將在 170 多個國傢 / 地區提供英語版本,並且在不久的將來會擴展到更多模態,並支持更多種語言。Google還將 Gemini 引入 Pixel。Pixel 8 Pro 將是第一款運行 Gemini Nano 的智能手機。Pixel 8 Pro 在錄音

2023-03-28

在歐美地區,約三分之二的工作都將受到生成式AI的影響,這將進一步提振生產力,預計在未來10年間,全球GDP每年將提高7%。ChatGPT步步升級,失業的恐懼越來越濃。高盛分析師JosephBriggs和DeveshKodnani在3月27日發佈的研究報告中指

2023-04-27

術的突破,全球預計將有3億個工作崗位被生成式AI取代,歐美地區約三分之二的工作都將受到人工智能的影響:一方面生成式AI可以大幅提振生產力,另一方面一部分都市白領可能正面臨著與1980年代制造業工人相似的命運。與Ope

2024-04-08

特曼已經提出一種解決方法:像OpenAI這樣的公司,最終會轉向使用AI生成的數據(也被稱為合成數據)來訓練AI。這樣開發人員在創建愈發強大的技術同時,也會減少對受版權保護數據的依賴。目前OpenAI和一系列機構也正在研究

2023-03-29

可是一項代價高昂的工作。於是OpenAI做出一個重大決定,轉向這些Transformer模型。2019年3月11日,非營利性組織OpenAI 宣佈創建一個營利性實體,以便籌集足夠的資金來支付雄心勃勃的 AI 模型所需的算力。“我們希望增加籌集資金

2024-03-27

困難。Corbitt:為何不考慮直接將所有設備部署在同一個地區呢?微軟工程師:這確實是我們最初的方案。但問題是,一旦我們在同一個州部署超過100,000個H100 GPU,電網就會因無法負荷而崩潰。這是創業者Kyle Corbitt在社交媒體上

2023-04-05

11日推出大模型,18日推出行業應用類模型,接下來還有各類的行業應用類模型會面世。之前,有博主測試天貓精靈,發現已經上線阿裡版ChatGPT語音助手版,那位博主一共測試15個問題,有10個的回答表現都優於競品。在ChatGPT剛

2023-04-11

國另一傢人工智能初創公司Anthropic也發佈一則招聘啟事,尋找具有AI/ML、數據科學和自然語言處理、醫療保健研究與運營等經驗的提示詞工程師。英國一傢律師事務所Mishcon de Reya也發佈GPT法律提示詞工程師的招聘需求,通過開發

2023-12-07

行更高級的推理、計劃和理解等,它將在 170 多個國傢或地區提供英語版本,Google計劃在不久後擴展到不同模型、支持更多語言。Pixel 8 Pro 引入 Gemini Nano 版:Google還將雙子座引入 Pixel 8 Pro,在錄音機等應用中提供總結。後續 Whats