揭秘真實的「AI民工」：為生存機械地「做任務」時薪低至1美元

2023-06-27 03:34:26 來源: 鳳凰網(wǎng)

核心提示：

【資料圖】

1.即使是最厲害的AI背后也是人，它需要大量人力標注數(shù)據(jù)來訓練它。AI標注員是人們希望自動化的工作，而且通常認為它們已經(jīng)自動化了，但是仍需要人類的輔助。

2.他們把這份工作稱為“做任務”，自己也不知道干的是什么。

3.收入微薄，時薪低至1-3美元。

4.標注員抱怨稱“如果我讓某人成為億萬富翁，而我每周只賺幾美元，我真的是在浪費生命?！?/p>

人工智能(AI)的火熱不僅取代了一批工作崗位，也造就了新的產(chǎn)業(yè)，一支以“做任務”為生的龐大AI民工大軍正在悄然崛起中。

喬(Joe)今年30歲，幾個月前從肯尼亞首都內(nèi)羅畢的一所大學畢業(yè)，找到了一份數(shù)據(jù)標注員的工作。這份工作單調(diào)乏味，整天就是處理用于訓練AI的原始信息。AI通過在海量數(shù)據(jù)中尋找模式來學習，但是這些數(shù)據(jù)首先必須由人類進行分類和標記。人類就是隱藏在這些機器背后的龐大勞動力。

以喬為例，他的工作就是為自動駕駛汽車標記視頻，一幀一幀地從每個可能的攝像頭角度標記每輛車、行人、騎自行車的人以及任何車主需要注意的東西。這是一項艱難而又重復性的勞動。一個只有幾秒鐘的視頻片段需要8個小時來標注，喬忙活半天只能賺到大約10美元(約合72元人民幣)。

不過，到了2019年，喬迎來了一個“發(fā)財機會”。由于一家新公司迫切需要標注員，他們成立了一個訓練營，培養(yǎng)新的標注員。喬成了這個訓練營的負責人，報酬是之前做標注員的四倍。

每隔兩周時間，50名新手就會排隊進入內(nèi)羅畢的一棟辦公樓，開始他們的學徒生涯，這讓人感覺市場對標注員的需求似乎是無限的。他們被要求從那些對著鏡子自拍的照片中看到的衣服進行分類，通過機器人吸塵器的視角來確定他們所在的房間，并在激光雷達掃描的摩托車周圍畫出正方形。

喬的一半以上學生通常在訓練營結(jié)束前就退學了?！坝行┤瞬恢廊绾伍L時間待在一個地方。”他委婉地解釋道。他承認，“這很無聊”。

稀里糊涂“做任務”

但是，在一個工作稀缺的地方，這好歹是一份能夠糊口的工作。最終，喬還是培養(yǎng)出了數(shù)百名畢業(yè)生。訓練營結(jié)束后，這些學生回到家里，獨自在臥室和廚房里工作，被禁止告訴任何人他們在做什么。其實，保密性并不是什么問題，因為他們也幾乎不知道自己在干什么。

對于這些剛出師的學生來說，為自動駕駛汽車標記障礙物很好明白，但是對那些不知道是機器人還是人類說的扭曲對話片段進行分類，就沒那么輕松了。他們要上傳自己的照片：先是一臉茫然地盯著攝像頭，然后咧著嘴笑，還要戴上摩托車頭盔。每個項目都是某個更大程序的一個很小組成部分，所以很難說他們到底在訓練AI做什么。他們也無法從這些項目的名稱中尋找蛛絲馬跡：“蟹的傳人”、“鯨魚段”、“林地陀螺儀”和“藥盒香腸”，這些都是不著邊際的項目代號。

那么，他們到底是在為誰打工呢？大多數(shù)人只知道它叫Remotasks，是一家面向英語流利者提供工作的網(wǎng)站。和大多數(shù)標注員一樣，喬并不知道Remotasks是美國AI標注公司Scale AI旗下的外包公司。Scale AI是一家價值數(shù)十億美元的硅谷數(shù)據(jù)供應商，客戶包括OpenAI和美國軍方。不過，Remotasks和Scale AI的網(wǎng)站都沒有提到雙方的關系。

許多人對于ChatGPT等大語言模型的關注都集中在AI通過自動化取代的工作崗位上。但是，即使是最厲害的AI背后也是人，它需要大量人力標注數(shù)據(jù)來訓練它，并在它感到“困惑”時對數(shù)據(jù)進行澄清。只有那些有錢購買這些數(shù)據(jù)的公司才能參與競爭，這些公司在得到數(shù)據(jù)后會極力防止數(shù)據(jù)外泄。結(jié)果就是，除了少數(shù)例外情況以外，人們對于塑造AI系統(tǒng)行為的信息知之甚少，對于塑造這些系統(tǒng)行為的人就更不了解了。

對喬的學生來說，這是一份“十分不正?！钡墓ぷ鳎簺]有時間表、沒有同事、不知道自己在做什么、也不知道為誰工作。實際上，他們很少把這項勞動稱之為工作，只是稱之為“任務”，他們是任務工作者。

人類學家大衛(wèi)·格雷伯(David Graeber)曾經(jīng)給那些沒有意義的工作起了一個名字：“狗屁工作”，指的是那些本應該被自動化取代，但由于官僚主義、地位或惰性等原因而沒有自動化的工作。AI標注員的工作則與之相反：這是人們希望自動化的工作，而且通常認為它們已經(jīng)自動化了，但是仍需要人類代替。這些工作確實有一個目的，只是工作者通常不知道它是什么。

標注大生意

當前的AI熱潮，就是源自這種前所未有的大規(guī)模單調(diào)乏味、重復性勞動。

2007年，時任普林斯頓大學教授的AI研究員李飛飛懷疑，改善圖像識別神經(jīng)網(wǎng)絡的關鍵是使用更多數(shù)據(jù)進行訓練，需要數(shù)百萬標記圖像而不是數(shù)萬張。但問題是，她的本科生團隊需要花費數(shù)十年時間和數(shù)百萬美元才能給這么多照片貼上標簽。

不過，當時亞馬遜已經(jīng)擁有了一個眾包平臺Mechanical Turk，世界各地的人們在這里以低廉的價格完成小任務。于是，李飛飛在Mechanical Turk上找到了數(shù)千名數(shù)據(jù)標注工作者，創(chuàng)造了標注數(shù)據(jù)集ImageNet。它讓機器學習取得了突破，讓這一領域煥發(fā)新機，迎來了十年進步。

如今，標注仍然是AI開發(fā)的基礎組成部分。但是，工程師們經(jīng)常覺得，對于構(gòu)建大模型這一更迷人的工作而言，標注是一個短暫的、不方便的先決條件。你可以盡可能便宜地收集盡可能多的標記數(shù)據(jù)來訓練模型，如果它有效，至少在理論上你就不再需要標注員了。但是，標注永遠不會真正完成。在研究人員眼里，機器學習系統(tǒng)是“脆弱的”。當遇到訓練數(shù)據(jù)中沒有充分解釋的東西時，它很容易失敗。這些失敗被稱為“邊緣情況”，可能會產(chǎn)生嚴重的后果。

例如，2018年，網(wǎng)約車巨頭Uber的一輛自動駕駛測試車撞死了一名女性。盡管該汽車的自動駕駛系統(tǒng)被進行了編程，要求避開騎自行車的人和行人，但它不知道該如何對待騎自行車過馬路的人。隨著越來越多的AI系統(tǒng)被投入到世界中提供法律咨詢和醫(yī)療幫助，它們面臨的邊緣情況就越多，需要更多人類來協(xié)助解決。這已經(jīng)催生了一個全球性產(chǎn)業(yè)，由像喬這樣的人組成，他們用自己獨特的人類能力來幫助機器。

標注是一門大生意。Scale AI由當年19歲的亞歷山大·王(Alexandr Wang)在2016年創(chuàng)立，2021年的估值已達到73億美元，這讓他登上了《福布斯》“最年輕的白手起家億萬富翁”榜單。不過，自那以后，他的股份在二級市場的價值已經(jīng)下跌。

“標注生意擁有一套完整的供應鏈，”非營利組織AI伙伴關系(Partnership on AI)的項目和研究負責人索南·金達爾(Sonam Jindal)表示，“業(yè)內(nèi)普遍認為，標注不是開發(fā)的關鍵部分，也不會長時間需要它。所有的興奮之情都圍繞著人工智能，一旦我們建立了它，就不再需要標注，所以為什么要考慮它呢？但標注是AI的基礎設施。人類智慧是AI的基礎，我們需要將其視為AI經(jīng)濟中的真正工作，這些工作將在一段時間內(nèi)存在。”

OpenAI、谷歌和微軟等知名AI公司都有各自的數(shù)據(jù)供應商。一些私人外包公司擁有類似呼叫中心的辦公室，比如肯尼亞和尼泊爾的CloudFactory。喬就是在那里做標注，每小時1.2美元，之后他才轉(zhuǎn)投Remotasks。還有像Mechanical Turk和Clickworker這樣的“眾包”網(wǎng)站，任何人都可以注冊來完成任務。中間層是Scale AI之類的服務，任何人都可以注冊，但每個人都必須通過資格考試和培訓課程，并接受績效監(jiān)控。

怎么接活？

今年早些時候，記者在Scale AI的外包公司Remotasks網(wǎng)站上進行了注冊。過程很簡單，輸入電腦配置、網(wǎng)速和一些基本的聯(lián)系信息后，記者就來到了“培訓中心”。為了獲得付費任務，記者首先必須完成一個相關的無償入門課程。

培訓中心展示了一系列課程，但是這些課程的名字令人費解，比如“膠水泳衣”和“海報夏威夷”。記者點開了一個叫“GFD模塊化”的課程，這項課程是給社交媒體照片中的衣物進行標注。

不過，課程的指令很奇怪。例如，它們基本上是由相同的指令組成的，并用特殊的顏色和大寫字體進行強調(diào)，旁邊是用來警示的炸彈威脅拼貼畫。

“一定要給真實的、可以讓人類穿著或打算給真人穿著的物品貼上標簽。”指令是這么要求的。

“下面的所有物品都應該貼上標簽，因為它們是真實的，可以被現(xiàn)實生活中的人穿著。”指令再次強調(diào)。這些物品來自一個AJ品牌廣告、一個戴著星球大戰(zhàn)凱洛倫頭盔的人，以及一個穿著裙子的人體模型。這些圖片上面有一個石灰綠色的方框，里面的文字再次解釋說，“給真實的人可以穿的真實物品貼上標簽”。

對于不能被標記的物品，指令也給了醒目的提示：“以下物品不應該被貼上標簽，因為人類在實際生活中不可能穿著這些物品！”

記者對于自己的分辨能力感到自信，于是就開始了測試。首先是一張雜志的照片，上面的女人穿著裙子。照片上的服裝是真實的服裝的嗎？記者認為不是，因為人不能穿照片中的服裝。但是，錯了！在AI看來，真實服裝的照片就是真實服裝。接下來是一張在昏暗臥室中，一個女人站在全身鏡子前自拍的照片。她穿著的襯衫和短褲是真實的。那么倒影呢？同樣是真實的！真實服裝的倒影也是真實服裝。

經(jīng)過尷尬的大量嘗試和錯誤后，記者終于開始了實際工作，卻驚恐地發(fā)現(xiàn)他一直在努力遵循的指令已經(jīng)被更新和澄清了很多次，現(xiàn)在已經(jīng)變成了一本有43頁的指令書：不要標記裝滿衣服而且打開的行李箱；標記鞋子但不要標記腳蹼；標記緊身褲但不要標記連緊身褲襪；即使有人穿著毛巾也不要標記它；標記服裝但不要標記盔甲。

收入微薄

Remotasks上的大部分工作都是按件計酬的，一項任務的收入從幾美分到幾美元不等。因為任務可能需要幾秒鐘或幾個小時，所以工資很難預測。標注員們稱，當Remotasks剛進入肯尼亞時，他們的報酬相對較高。根據(jù)任務的不同，平均每小時大約為5到10美元。但隨著時間的推移，報酬會下降。

Scale AI發(fā)言人安娜·弗蘭科(Anna Franko)表示，該公司的經(jīng)濟學家會分析項目的細節(jié)、所需的技能、地區(qū)生活成本和其他因素，“以確保公平和有競爭力的薪酬”。Scale AI的前員工還表示，標注員的薪酬是通過一種類似動態(tài)定價的機制確定的，該機制根據(jù)可用的標注員數(shù)量和數(shù)據(jù)需要的迫切度進行調(diào)整。

根據(jù)記者的采訪和招聘公告，美國的Remotasks標注員通常每小時能掙10到25美元，一些專業(yè)標注領域的專家報酬更高。今年年初時，接受采訪的肯尼亞標注員的報酬已經(jīng)降到了每小時1到3美元。

這還是能賺錢的時候。標注員對于Remotasks的工作最常見的抱怨就是它的不穩(wěn)定性。它或許能在很長一段時間內(nèi)給標注員提供足夠穩(wěn)定的工作，可以作為全職工作，但也充滿了不可預測性，使人無法依賴它。標注員花費數(shù)小時閱讀指令和完成無償培訓，結(jié)果只能完成幾十個任務，隨后項目就結(jié)束了。接著，標注員可能幾天都沒有新任務，然后再突然出現(xiàn)一項完全不同的任務，可能持續(xù)幾個小時到幾周時間不等。任何任務都有可能是他們的最后一項任務，他們永遠不知道下一個任務何時到來。

工程師和數(shù)據(jù)供應商稱，這種時有時無的工作取決于AI開發(fā)的節(jié)奏。訓練一個大模型需要大量標注，然后是更多的迭代更新。工程師們希望所有這些都盡可能快地完成，這樣他們就能趕上目標發(fā)布日期，可能在幾個月的時間里就需要數(shù)千名標注員，然后減少到幾百名，接著只需要十幾名特定類型的專家，然后又需要數(shù)千名?！皢栴}是，誰來承擔這些需求波動的成本?”AI伙伴關系的金達爾說，“因為目前承擔這些成本的是標注員們?！?/p>

抱團取暖

為了取得成功，標注員們會相互合作。維克多(Victor)在內(nèi)羅畢上大學時就開始為Remotasks工作。當記者告訴他自己在交通導向員任務中遇到的困難時，他表示大家都知道要遠離那個任務：任務太棘手、報酬還低，不值得做。

和許多標注員一樣，維克多使用非官方的WhatsApp群聊，在有好任務時通知大家。當他弄清楚一個新任務時，他會即興使用谷歌視頻會議服務Meets與其他人分享如何完成任務。任何人都可以加入會議，一起研究，分享技巧?！斑@是我們培養(yǎng)起來的相互幫助的文化，因為我們知道，單憑一個人是無法掌握所有技巧的?！彼f道。

由于工作會毫無征兆地出現(xiàn)又消失，所以標注員們總是需要保持警惕。維克多發(fā)現(xiàn)，項目會在深夜突然出現(xiàn)，所以他習慣每三個小時左右醒來檢查一下他的任務隊列。當有任務時，他會保持清醒，只要能讓自己工作。有一次，他熬夜36個小時，在人群照片中給肘部、膝蓋和頭部做標記，他也不知道這么做是干什么。還有一次，他熬夜太久，媽媽問他眼睛怎么了。他照鏡子后才發(fā)現(xiàn)，眼睛腫了。

標注員通常只是模糊地知道他們正在為其他地方的企業(yè)訓練AI，但有時這種神秘感會消失，因為指令中提到了某個品牌或聊天機器人說得太多了。“我讀了一些資料，并通過谷歌搜索發(fā)現(xiàn)，我正在為一位25歲的億萬富翁工作?！币幻麊T工說，他當時正在給打電話訂購達美樂披薩的人的情緒貼標簽。

“如果我讓某人成為億萬富翁，而我每周只賺幾美元，我真的是在浪費我的生命?！彼粷M地說。

沒人會記住我們

維克多自稱是一名AI“狂熱者”。他開始做標注，是因為他想幫助實現(xiàn)一個完全自動化的后工作未來。但是今年早些時候，有人在他的WhatsApp群里發(fā)了一篇《時代》雜志的報道，內(nèi)容是標注員訓練ChatGPT識別有毒內(nèi)容，但是Scale AI支付給他們的時薪不到2美元。

“這些公司利潤豐厚，但支付給標注員的薪酬卻如此之低，這讓人感到憤怒?！本S克多說。當被告知Remotasks與Scale的關系時，他才知道自己參與的其中一項任務的指令與OpenAI使用的幾乎相同，這意味著他可能也在訓練ChatGPT，時薪大約3美元。

“我記得有人發(fā)帖說，我們將來會被人銘記，”他說，“然后，另一個人回復說，我們的待遇比步兵還差，未來我們什么也不會被記住。這段話我記得很清楚。沒有人會認可我們所做的工作和付出的努力?！?/p>

關鍵詞：

揭秘真實的「AI民工」：為生存機械地「做任務」時薪低至1美元

您可能也感興趣:

今日熱點

河南南陽：中心城區(qū)買首套新房契稅補貼50%

青海全面推進社區(qū)矯正社會化建設

再添文旅新地標世界級城市潛水項目落地兩江新區(qū)

更多

更多

排行

最近更新

今日要聞

揭秘真實的「AI民工」：為生存機械地「做任務」 時薪低至1美元

您可能也感興趣:

今日熱點

河南南陽：中心城區(qū)買首套新房契稅補貼50%

青海全面推進社區(qū)矯正社會化建設

再添文旅新地標 世界級城市潛水項目落地兩江新區(qū)

為您推薦

中鋼協(xié)：6月中旬重點統(tǒng)計鋼鐵企業(yè)粗鋼日產(chǎn)226.27萬噸 環(huán)比增長1.42%

摩爾多瓦卡胡爾區(qū)發(fā)生非洲豬瘟疫情 摩爾多瓦疫情實時動態(tài)

港交所與寧波市人民政府簽訂合作備忘錄 支持寧波企業(yè)到港上市|世界熱消息

共繪兩岸一家親的和美畫卷

更多

更多

排行

最近更新

今日要聞

揭秘真實的「AI民工」：為生存機械地「做任務」時薪低至1美元

再添文旅新地標世界級城市潛水項目落地兩江新區(qū)

中鋼協(xié)：6月中旬重點統(tǒng)計鋼鐵企業(yè)粗鋼日產(chǎn)226.27萬噸環(huán)比增長1.42%

摩爾多瓦卡胡爾區(qū)發(fā)生非洲豬瘟疫情摩爾多瓦疫情實時動態(tài)

港交所與寧波市人民政府簽訂合作備忘錄支持寧波企業(yè)到港上市|世界熱消息