首頁 新聞 > 創(chuàng)新 > 正文

“人工智能訓(xùn)練師”究竟做些啥

最近,人社部公布了一批新職業(yè),其中有個(gè)新職業(yè)叫作“人工智能訓(xùn)練師”。聽起來高大上的人工智能還要人來訓(xùn)練?誰能訓(xùn)練這些看不見、摸不著的人工智能?“人工智能訓(xùn)練師”究竟做些啥?關(guān)鍵是,掙得多不多?

帶著這些問題,經(jīng)濟(jì)日?qǐng)?bào)記者近日走訪了百度(山西)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地。這里是目前國內(nèi)從業(yè)人員與產(chǎn)值規(guī)模第一的單體數(shù)據(jù)標(biāo)注基地,入駐企業(yè)35家,AI數(shù)據(jù)標(biāo)注師從業(yè)人員超過2300人。

“我是數(shù)據(jù)標(biāo)注員,中專學(xué)歷,每天工作8小時(shí),大概能掙300多元。”面對(duì)記者的問題,山西麟諾網(wǎng)絡(luò)科技有限公司的李宇龍自豪地給出了答案。這個(gè)收入對(duì)在太原生活的年輕人來說算高水平了——數(shù)據(jù)顯示,2019年,太原市城鎮(zhèn)居民人均可支配收入36362元。不過,李宇龍說自己不算最高的,“我有的同事一天能掙1000多元”。

李宇龍學(xué)歷不高,原本與人工智能沒什么關(guān)系。2018年,山西麟諾網(wǎng)絡(luò)科技有限公司成立,李宇龍經(jīng)朋友介紹來到這家公司。

“當(dāng)時(shí)我也不知道數(shù)據(jù)標(biāo)注員是做啥的,更沒聽說過人工智能。老板就交給我一套規(guī)則,讓我按照規(guī)則在電腦上認(rèn)車道線。”那時(shí)20歲出頭的李宇龍正是肯學(xué)的時(shí)候,短時(shí)間內(nèi)就熟悉了規(guī)則,還總結(jié)出標(biāo)注車道的新規(guī)律。

作為這項(xiàng)新職業(yè)的老員工,李宇龍已轉(zhuǎn)型培訓(xùn)師,除了日常工作,還承擔(dān)起公司新員工的培訓(xùn)教學(xué),“有的同事會(huì)轉(zhuǎn)型做項(xiàng)目或者內(nèi)容審核員,還是有上升空間的”。

“數(shù)據(jù)標(biāo)注技術(shù)門檻低,招工人群范圍廣泛,對(duì)于促進(jìn)就業(yè)作用顯著。”山西麟諾網(wǎng)絡(luò)科技有限公司負(fù)責(zé)人李應(yīng)維告訴記者,目前公司招聘的員工以大專生為主;標(biāo)注規(guī)則由百度與相關(guān)領(lǐng)域?qū)<夜餐贫?,并形成可操作軟件平臺(tái)提供給企業(yè),對(duì)員工簡(jiǎn)單培訓(xùn)就能上手。以人臉為例,目前他們能實(shí)現(xiàn)對(duì)約150個(gè)特征點(diǎn)的標(biāo)注。大致標(biāo)注規(guī)則是數(shù)據(jù)標(biāo)注師看到雙眼皮就標(biāo)記雙眼皮,看到獅子鼻就標(biāo)記獅子鼻,讓機(jī)器自己理解與學(xué)習(xí)。標(biāo)注特征點(diǎn)越多,AI就越能精確識(shí)別人臉。

看似簡(jiǎn)單的工作,背后是龐大數(shù)據(jù)基礎(chǔ)做支持。算法、算力與數(shù)據(jù)是人工智能發(fā)展的三大要素,其中數(shù)據(jù)是人工智能發(fā)展的燃料。每天,人類社會(huì)產(chǎn)生的海量數(shù)據(jù)必須經(jīng)過清洗與標(biāo)注,換成人工智能熟悉的語言才有價(jià)值。因此,人工智能訓(xùn)練師主要任務(wù)就是數(shù)據(jù)采集和標(biāo)注,特別是數(shù)據(jù)標(biāo)注。如果說人工智能是個(gè)孩子,數(shù)據(jù)標(biāo)注師就是帶領(lǐng)這個(gè)孩子認(rèn)識(shí)世界的啟蒙老師。有了足夠多、足夠好的數(shù)據(jù),AI才能學(xué)會(huì)像人一樣去感知、思考和決策,更好地為人類服務(wù)。

人工智能產(chǎn)業(yè)發(fā)展之初,數(shù)據(jù)采集與標(biāo)注需要人力完成的部分比較多,現(xiàn)在數(shù)據(jù)平臺(tái)已有了持續(xù)學(xué)習(xí)能力,大部分采集與標(biāo)注工作人工智能自己就可完成,實(shí)現(xiàn)預(yù)標(biāo)注與自動(dòng)標(biāo)注。因此,目前數(shù)據(jù)標(biāo)注工作以機(jī)器輔助與人工標(biāo)注結(jié)合為主。除了眼底檢查片、肺部X光片等技術(shù)含量較高有專業(yè)要求,大多數(shù)員工均能按照規(guī)則,在平臺(tái)上完成語音、人臉、道路的標(biāo)注操作,只要能熟練操作電腦即可。

郭梅是新職業(yè)的受益者。34歲的她原本在山西一家煤礦做監(jiān)控員,為照顧到太原上學(xué)的孩子,她到學(xué)校附近的數(shù)據(jù)標(biāo)注基地求職。經(jīng)過公司崗前培訓(xùn)與團(tuán)隊(duì)幫助,她從起初每天標(biāo)注兩三百張圖,提升到每天能完成1300多張。

數(shù)據(jù)標(biāo)注員的工作隨著人工智能發(fā)展需求不斷調(diào)整。前幾年人工智能發(fā)展伊始,語音識(shí)別、人臉、圖像等識(shí)別需求大;近幾年無人駕駛進(jìn)入發(fā)展快車道,郭梅與李宇龍的主要工作就改成無人車、地圖、3D點(diǎn)云等數(shù)據(jù)標(biāo)注,天天看的是車道線、行人、障礙物。

“還有一些語音識(shí)別項(xiàng)目,比如我們接了一些方言語音數(shù)據(jù)標(biāo)注項(xiàng)目,這就需要招聘當(dāng)?shù)厝藖硗瓿闪恕?rdquo;李應(yīng)維說。

有了足夠技術(shù)基礎(chǔ),數(shù)據(jù)標(biāo)注員還能教會(huì)人工智能新任務(wù)。疫情期間,戴口罩的人臉識(shí)別需求激增。“根據(jù)客戶需求,山西數(shù)據(jù)標(biāo)注基地采集了大量戴口罩人臉照片,由數(shù)據(jù)標(biāo)注師對(duì)眉毛、眼鏡、顴骨等人臉關(guān)鍵點(diǎn)精準(zhǔn)標(biāo)注,訓(xùn)練人工智能完成了戴口罩人臉圖像識(shí)別。”百度(山西)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地負(fù)責(zé)人尉赤說,“人們能在不摘口罩情況下實(shí)現(xiàn)精確體溫測(cè)量,或是通過人臉閘機(jī),背后就是這些數(shù)據(jù)標(biāo)注員在訓(xùn)練人工智能。”

艾瑞咨詢發(fā)布的《中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)白皮書》預(yù)測(cè),隨著全球人工智能產(chǎn)業(yè)、物聯(lián)網(wǎng)、5G的爆發(fā)式增長(zhǎng),到2025年,全球每年產(chǎn)生的數(shù)據(jù)量將從2016年的16.1ZB猛增至2025年的163ZB,其中80%至90%是非結(jié)構(gòu)化數(shù)據(jù),需要經(jīng)過清洗與標(biāo)注才能被喚醒價(jià)值。在我國,每年需要標(biāo)注的語音數(shù)據(jù)超過200萬小時(shí),圖片則有數(shù)億張。因此,人工智能數(shù)據(jù)標(biāo)注師的崗位需求將持續(xù)增長(zhǎng)。尉赤透露,今年基地新招了500多人,未來5年計(jì)劃培養(yǎng)5萬名AI數(shù)據(jù)訓(xùn)練師,并引入更多AI合作伙伴。李應(yīng)維也預(yù)計(jì),到明年自家企業(yè)用工將翻一番,從160多人擴(kuò)展到300人左右。未來,數(shù)據(jù)標(biāo)注將成為創(chuàng)造大量就業(yè)需求的新興職業(yè)領(lǐng)域。(佘 穎)

關(guān)鍵詞: 人工智能訓(xùn)練師

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - www.mallikadua.com All rights reserved
聯(lián)系我們:33 92 950@qq.com
豫ICP備2020035879號(hào)-12