首頁 資訊 > 創(chuàng)新 > 正文

揭秘真實的「AI民工」:為生存機械地「做任務」 時薪低至1美元

核心提示:


【資料圖】

1.即使是最厲害的AI背后也是人,它需要大量人力標注數(shù)據(jù)來訓練它。AI標注員是人們希望自動化的工作,而且通常認為它們已經(jīng)自動化了,但是仍需要人類的輔助。

2.他們把這份工作稱為“做任務”,自己也不知道干的是什么。

3.收入微薄,時薪低至1-3美元。

4.標注員抱怨稱“如果我讓某人成為億萬富翁,而我每周只賺幾美元,我真的是在浪費生命?!?/p>

人工智能(AI)的火熱不僅取代了一批工作崗位,也造就了新的產(chǎn)業(yè),一支以“做任務”為生的龐大AI民工大軍正在悄然崛起中。

喬(Joe)今年30歲,幾個月前從肯尼亞首都內(nèi)羅畢的一所大學畢業(yè),找到了一份數(shù)據(jù)標注員的工作。這份工作單調(diào)乏味,整天就是處理用于訓練AI的原始信息。AI通過在海量數(shù)據(jù)中尋找模式來學習,但是這些數(shù)據(jù)首先必須由人類進行分類和標記。人類就是隱藏在這些機器背后的龐大勞動力。

以喬為例,他的工作就是為自動駕駛汽車標記視頻,一幀一幀地從每個可能的攝像頭角度標記每輛車、行人、騎自行車的人以及任何車主需要注意的東西。這是一項艱難而又重復性的勞動。一個只有幾秒鐘的視頻片段需要8個小時來標注,喬忙活半天只能賺到大約10美元(約合72元人民幣)。

不過,到了2019年,喬迎來了一個“發(fā)財機會”。由于一家新公司迫切需要標注員,他們成立了一個訓練營,培養(yǎng)新的標注員。喬成了這個訓練營的負責人,報酬是之前做標注員的四倍。

每隔兩周時間,50名新手就會排隊進入內(nèi)羅畢的一棟辦公樓,開始他們的學徒生涯,這讓人感覺市場對標注員的需求似乎是無限的。他們被要求從那些對著鏡子自拍的照片中看到的衣服進行分類,通過機器人吸塵器的視角來確定他們所在的房間,并在激光雷達掃描的摩托車周圍畫出正方形。

喬的一半以上學生通常在訓練營結(jié)束前就退學了?!坝行┤瞬恢廊绾伍L時間待在一個地方。”他委婉地解釋道。他承認,“這很無聊”。

稀里糊涂“做任務”

但是,在一個工作稀缺的地方,這好歹是一份能夠糊口的工作。最終,喬還是培養(yǎng)出了數(shù)百名畢業(yè)生。訓練營結(jié)束后,這些學生回到家里,獨自在臥室和廚房里工作,被禁止告訴任何人他們在做什么。其實,保密性并不是什么問題,因為他們也幾乎不知道自己在干什么。

對于這些剛出師的學生來說,為自動駕駛汽車標記障礙物很好明白,但是對那些不知道是機器人還是人類說的扭曲對話片段進行分類,就沒那么輕松了。他們要上傳自己的照片:先是一臉茫然地盯著攝像頭,然后咧著嘴笑,還要戴上摩托車頭盔。每個項目都是某個更大程序的一個很小組成部分,所以很難說他們到底在訓練AI做什么。他們也無法從這些項目的名稱中尋找蛛絲馬跡:“蟹的傳人”、“鯨魚段”、“林地陀螺儀”和“藥盒香腸”,這些都是不著邊際的項目代號。

那么,他們到底是在為誰打工呢?大多數(shù)人只知道它叫Remotasks,是一家面向英語流利者提供工作的網(wǎng)站。和大多數(shù)標注員一樣,喬并不知道Remotasks是美國AI標注公司Scale AI旗下的外包公司。Scale AI是一家價值數(shù)十億美元的硅谷數(shù)據(jù)供應商,客戶包括OpenAI和美國軍方。不過,Remotasks和Scale AI的網(wǎng)站都沒有提到雙方的關系。

許多人對于ChatGPT等大語言模型的關注都集中在AI通過自動化取代的工作崗位上。但是,即使是最厲害的AI背后也是人,它需要大量人力標注數(shù)據(jù)來訓練它,并在它感到“困惑”時對數(shù)據(jù)進行澄清。只有那些有錢購買這些數(shù)據(jù)的公司才能參與競爭,這些公司在得到數(shù)據(jù)后會極力防止數(shù)據(jù)外泄。結(jié)果就是,除了少數(shù)例外情況以外,人們對于塑造AI系統(tǒng)行為的信息知之甚少,對于塑造這些系統(tǒng)行為的人就更不了解了。

對喬的學生來說,這是一份“十分不正?!钡墓ぷ鳎簺]有時間表、沒有同事、不知道自己在做什么、也不知道為誰工作。實際上,他們很少把這項勞動稱之為工作,只是稱之為“任務”,他們是任務工作者。

人類學家大衛(wèi)·格雷伯(David Graeber)曾經(jīng)給那些沒有意義的工作起了一個名字:“狗屁工作”,指的是那些本應該被自動化取代,但由于官僚主義、地位或惰性等原因而沒有自動化的工作。AI標注員的工作則與之相反:這是人們希望自動化的工作,而且通常認為它們已經(jīng)自動化了,但是仍需要人類代替。這些工作確實有一個目的,只是工作者通常不知道它是什么。

標注大生意

當前的AI熱潮,就是源自這種前所未有的大規(guī)模單調(diào)乏味、重復性勞動。

2007年,時任普林斯頓大學教授的AI研究員李飛飛懷疑,改善圖像識別神經(jīng)網(wǎng)絡的關鍵是使用更多數(shù)據(jù)進行訓練,需要數(shù)百萬標記圖像而不是數(shù)萬張。但問題是,她的本科生團隊需要花費數(shù)十年時間和數(shù)百萬美元才能給這么多照片貼上標簽。

不過,當時亞馬遜已經(jīng)擁有了一個眾包平臺Mechanical Turk,世界各地的人們在這里以低廉的價格完成小任務。于是,李飛飛在Mechanical Turk上找到了數(shù)千名數(shù)據(jù)標注工作者,創(chuàng)造了標注數(shù)據(jù)集ImageNet。它讓機器學習取得了突破,讓這一領域煥發(fā)新機,迎來了十年進步。

如今,標注仍然是AI開發(fā)的基礎組成部分。但是,工程師們經(jīng)常覺得,對于構(gòu)建大模型這一更迷人的工作而言,標注是一個短暫的、不方便的先決條件。你可以盡可能便宜地收集盡可能多的標記數(shù)據(jù)來訓練模型,如果它有效,至少在理論上你就不再需要標注員了。但是,標注永遠不會真正完成。在研究人員眼里,機器學習系統(tǒng)是“脆弱的”。當遇到訓練數(shù)據(jù)中沒有充分解釋的東西時,它很容易失敗。這些失敗被稱為“邊緣情況”,可能會產(chǎn)生嚴重的后果。

例如,2018年,網(wǎng)約車巨頭Uber的一輛自動駕駛測試車撞死了一名女性。盡管該汽車的自動駕駛系統(tǒng)被進行了編程,要求避開騎自行車的人和行人,但它不知道該如何對待騎自行車過馬路的人。隨著越來越多的AI系統(tǒng)被投入到世界中提供法律咨詢和醫(yī)療幫助,它們面臨的邊緣情況就越多,需要更多人類來協(xié)助解決。這已經(jīng)催生了一個全球性產(chǎn)業(yè),由像喬這樣的人組成,他們用自己獨特的人類能力來幫助機器。

標注是一門大生意。Scale AI由當年19歲的亞歷山大·王(Alexandr Wang)在2016年創(chuàng)立,2021年的估值已達到73億美元,這讓他登上了《福布斯》“最年輕的白手起家億萬富翁”榜單。不過,自那以后,他的股份在二級市場的價值已經(jīng)下跌。

“標注生意擁有一套完整的供應鏈,”非營利組織AI伙伴關系(Partnership on AI)的項目和研究負責人索南·金達爾(Sonam Jindal)表示,“業(yè)內(nèi)普遍認為,標注不是開發(fā)的關鍵部分,也不會長時間需要它。所有的興奮之情都圍繞著人工智能,一旦我們建立了它,就不再需要標注,所以為什么要考慮它呢?但標注是AI的基礎設施。人類智慧是AI的基礎,我們需要將其視為AI經(jīng)濟中的真正工作,這些工作將在一段時間內(nèi)存在。”

OpenAI、谷歌和微軟等知名AI公司都有各自的數(shù)據(jù)供應商。一些私人外包公司擁有類似呼叫中心的辦公室,比如肯尼亞和尼泊爾的CloudFactory。喬就是在那里做標注,每小時1.2美元,之后他才轉(zhuǎn)投Remotasks。還有像Mechanical Turk和Clickworker這樣的“眾包”網(wǎng)站,任何人都可以注冊來完成任務。中間層是Scale AI之類的服務,任何人都可以注冊,但每個人都必須通過資格考試和培訓課程,并接受績效監(jiān)控。

怎么接活?

今年早些時候,記者在Scale AI的外包公司Remotasks網(wǎng)站上進行了注冊。過程很簡單,輸入電腦配置、網(wǎng)速和一些基本的聯(lián)系信息后,記者就來到了“培訓中心”。為了獲得付費任務,記者首先必須完成一個相關的無償入門課程。

培訓中心展示了一系列課程,但是這些課程的名字令人費解,比如“膠水泳衣”和“海報夏威夷”。記者點開了一個叫“GFD模塊化”的課程,這項課程是給社交媒體照片中的衣物進行標注。

不過,課程的指令很奇怪。例如,它們基本上是由相同的指令組成的,并用特殊的顏色和大寫字體進行強調(diào),旁邊是用來警示的炸彈威脅拼貼畫。

“一定要給真實的、可以讓人類穿著或打算給真人穿著的物品貼上標簽。”指令是這么要求的。

“下面的所有物品都應該貼上標簽,因為它們是真實的,可以被現(xiàn)實生活中的人穿著。”指令再次強調(diào)。這些物品來自一個AJ品牌廣告、一個戴著星球大戰(zhàn)凱洛倫頭盔的人,以及一個穿著裙子的人體模型。這些圖片上面有一個石灰綠色的方框,里面的文字再次解釋說,“給真實的人可以穿的真實物品貼上標簽”。

對于不能被標記的物品,指令也給了醒目的提示:“以下物品不應該被貼上標簽,因為人類在實際生活中不可能穿著這些物品!”

記者對于自己的分辨能力感到自信,于是就開始了測試。首先是一張雜志的照片,上面的女人穿著裙子。照片上的服裝是真實的服裝的嗎?記者認為不是,因為人不能穿照片中的服裝。但是,錯了!在AI看來,真實服裝的照片就是真實服裝。接下來是一張在昏暗臥室中,一個女人站在全身鏡子前自拍的照片。她穿著的襯衫和短褲是真實的。那么倒影呢?同樣是真實的!真實服裝的倒影也是真實服裝。

經(jīng)過尷尬的大量嘗試和錯誤后,記者終于開始了實際工作,卻驚恐地發(fā)現(xiàn)他一直在努力遵循的指令已經(jīng)被更新和澄清了很多次,現(xiàn)在已經(jīng)變成了一本有43頁的指令書:不要標記裝滿衣服而且打開的行李箱;標記鞋子但不要標記腳蹼;標記緊身褲但不要標記連緊身褲襪;即使有人穿著毛巾也不要標記它;標記服裝但不要標記盔甲。

收入微薄

Remotasks上的大部分工作都是按件計酬的,一項任務的收入從幾美分到幾美元不等。因為任務可能需要幾秒鐘或幾個小時,所以工資很難預測。標注員們稱,當Remotasks剛進入肯尼亞時,他們的報酬相對較高。根據(jù)任務的不同,平均每小時大約為5到10美元。但隨著時間的推移,報酬會下降。

Scale AI發(fā)言人安娜·弗蘭科(Anna Franko)表示,該公司的經(jīng)濟學家會分析項目的細節(jié)、所需的技能、地區(qū)生活成本和其他因素,“以確保公平和有競爭力的薪酬”。Scale AI的前員工還表示,標注員的薪酬是通過一種類似動態(tài)定價的機制確定的,該機制根據(jù)可用的標注員數(shù)量和數(shù)據(jù)需要的迫切度進行調(diào)整。

根據(jù)記者的采訪和招聘公告,美國的Remotasks標注員通常每小時能掙10到25美元,一些專業(yè)標注領域的專家報酬更高。今年年初時,接受采訪的肯尼亞標注員的報酬已經(jīng)降到了每小時1到3美元。

這還是能賺錢的時候。標注員對于Remotasks的工作最常見的抱怨就是它的不穩(wěn)定性。它或許能在很長一段時間內(nèi)給標注員提供足夠穩(wěn)定的工作,可以作為全職工作,但也充滿了不可預測性,使人無法依賴它。標注員花費數(shù)小時閱讀指令和完成無償培訓,結(jié)果只能完成幾十個任務,隨后項目就結(jié)束了。接著,標注員可能幾天都沒有新任務,然后再突然出現(xiàn)一項完全不同的任務,可能持續(xù)幾個小時到幾周時間不等。任何任務都有可能是他們的最后一項任務,他們永遠不知道下一個任務何時到來。

工程師和數(shù)據(jù)供應商稱,這種時有時無的工作取決于AI開發(fā)的節(jié)奏。訓練一個大模型需要大量標注,然后是更多的迭代更新。工程師們希望所有這些都盡可能快地完成,這樣他們就能趕上目標發(fā)布日期,可能在幾個月的時間里就需要數(shù)千名標注員,然后減少到幾百名,接著只需要十幾名特定類型的專家,然后又需要數(shù)千名?!皢栴}是,誰來承擔這些需求波動的成本?”AI伙伴關系的金達爾說,“因為目前承擔這些成本的是標注員們?!?/p>

抱團取暖

為了取得成功,標注員們會相互合作。維克多(Victor)在內(nèi)羅畢上大學時就開始為Remotasks工作。當記者告訴他自己在交通導向員任務中遇到的困難時,他表示大家都知道要遠離那個任務:任務太棘手、報酬還低,不值得做。

和許多標注員一樣,維克多使用非官方的WhatsApp群聊,在有好任務時通知大家。當他弄清楚一個新任務時,他會即興使用谷歌視頻會議服務Meets與其他人分享如何完成任務。任何人都可以加入會議,一起研究,分享技巧?!斑@是我們培養(yǎng)起來的相互幫助的文化,因為我們知道,單憑一個人是無法掌握所有技巧的?!彼f道。

由于工作會毫無征兆地出現(xiàn)又消失,所以標注員們總是需要保持警惕。維克多發(fā)現(xiàn),項目會在深夜突然出現(xiàn),所以他習慣每三個小時左右醒來檢查一下他的任務隊列。當有任務時,他會保持清醒,只要能讓自己工作。有一次,他熬夜36個小時,在人群照片中給肘部、膝蓋和頭部做標記,他也不知道這么做是干什么。還有一次,他熬夜太久,媽媽問他眼睛怎么了。他照鏡子后才發(fā)現(xiàn),眼睛腫了。

標注員通常只是模糊地知道他們正在為其他地方的企業(yè)訓練AI,但有時這種神秘感會消失,因為指令中提到了某個品牌或聊天機器人說得太多了。“我讀了一些資料,并通過谷歌搜索發(fā)現(xiàn),我正在為一位25歲的億萬富翁工作?!币幻麊T工說,他當時正在給打電話訂購達美樂披薩的人的情緒貼標簽。

“如果我讓某人成為億萬富翁,而我每周只賺幾美元,我真的是在浪費我的生命?!彼粷M地說。

沒人會記住我們

維克多自稱是一名AI“狂熱者”。他開始做標注,是因為他想幫助實現(xiàn)一個完全自動化的后工作未來。但是今年早些時候,有人在他的WhatsApp群里發(fā)了一篇《時代》雜志的報道,內(nèi)容是標注員訓練ChatGPT識別有毒內(nèi)容,但是Scale AI支付給他們的時薪不到2美元。

“這些公司利潤豐厚,但支付給標注員的薪酬卻如此之低,這讓人感到憤怒?!本S克多說。當被告知Remotasks與Scale的關系時,他才知道自己參與的其中一項任務的指令與OpenAI使用的幾乎相同,這意味著他可能也在訓練ChatGPT,時薪大約3美元。

“我記得有人發(fā)帖說,我們將來會被人銘記,”他說,“然后,另一個人回復說,我們的待遇比步兵還差,未來我們什么也不會被記住這段話我記得很清楚。沒有人會認可我們所做的工作和付出的努力?!?/p>

關鍵詞:

最近更新

關于本站 管理團隊 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.mallikadua.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖ICP備2022009963號-3