在黃土高原與關(guān)中平原交界的宜君縣,深秋時(shí)節(jié)的景色宛如一幅灰黃交織的畫(huà)卷。正是在這片土地上,阿娟開(kāi)啟了她職業(yè)生涯的新篇章——成為一名人工智能訓(xùn)練師。
阿娟的工作地點(diǎn)是一個(gè)規(guī)模不大的辦公室,里面僅有二十來(lái)名員工。她的日常任務(wù)是給電腦屏幕上的店鋪門頭圖片打上標(biāo)簽。那些曝光過(guò)度、店名虛化或門頭反光的圖片,都被她一一剔除。這些標(biāo)注過(guò)的圖片將被用于AI的學(xué)習(xí),幫助它識(shí)別并審核商家上傳的門頭圖片。盡管工作看似簡(jiǎn)單,但阿娟在熟練后,能在十幾秒內(nèi)處理一張圖片,一天下來(lái),她能標(biāo)注近兩千張圖片。
然而,阿娟所從事的數(shù)據(jù)標(biāo)注工作,在過(guò)去兩三年間,常常與“低門檻”、“勞動(dòng)密集型”等詞匯聯(lián)系在一起。從業(yè)者們對(duì)自動(dòng)駕駛、人工智能等概念知之甚少,只是機(jī)械地完成點(diǎn)擊鼠標(biāo)的任務(wù)。但如今,隨著ChatGPT等生成式AI的爆火,人工智能的發(fā)展邁入了新階段,數(shù)據(jù)標(biāo)注行業(yè)也悄然發(fā)生了變化。
劉到閑,一位985高校的碩士畢業(yè)生,便是這一變化的見(jiàn)證者。他轉(zhuǎn)行成為了一名數(shù)據(jù)標(biāo)注師,就職于一家互聯(lián)網(wǎng)大廠,月薪超過(guò)1.5萬(wàn)元。與阿娟不同,劉到閑的工作更多地涉及與產(chǎn)品、算法團(tuán)隊(duì)的溝通,以及制定數(shù)據(jù)標(biāo)注規(guī)則。他需要把專業(yè)的知識(shí)“翻譯”成大白話,讓一線標(biāo)注員也能輕松理解。他的目標(biāo)是,把AI培養(yǎng)成一個(gè)專家。
在劉到閑看來(lái),培養(yǎng)AI的過(guò)程就像培養(yǎng)一個(gè)孩子。一開(kāi)始,需要教給AI最基礎(chǔ)的知識(shí),比如識(shí)別鳥(niǎo)、花、車等物體。但要讓AI完成人類的工作,就需要教給它更專業(yè)的知識(shí)和技能。這就需要像劉到閑這樣的高學(xué)歷年輕人加入,他們不僅具備專業(yè)知識(shí),還能制定高質(zhì)量的標(biāo)注規(guī)則。
隨著AI的發(fā)展,數(shù)據(jù)標(biāo)注工作的要求也在不斷提高。如今,即便是最基礎(chǔ)的一線數(shù)據(jù)標(biāo)注員,也需要具備大專以上的學(xué)歷。而像百度智能云這樣的大公司,在招聘數(shù)據(jù)標(biāo)注師時(shí),更是偏好211高校的畢業(yè)生。這意味著,阿娟這樣的基礎(chǔ)標(biāo)注員正面臨著職業(yè)挑戰(zhàn)。
阿娟親身經(jīng)歷了數(shù)據(jù)標(biāo)注行業(yè)的變化。她最初加入這個(gè)行業(yè)時(shí),招聘要求簡(jiǎn)單,只要會(huì)用辦公軟件就行。但隨著時(shí)間的推移,任務(wù)難度不斷提升,公司招聘的學(xué)歷要求也越來(lái)越高。阿娟和同事們開(kāi)始接觸形式更豐富、標(biāo)注規(guī)則更復(fù)雜的項(xiàng)目。比如,在視頻侵權(quán)類項(xiàng)目的標(biāo)注中,他們需要判斷給定的關(guān)鍵詞和視頻內(nèi)容的關(guān)聯(lián)度,并按照標(biāo)注規(guī)范一一對(duì)應(yīng)標(biāo)注。
然而,對(duì)于阿娟和同事們來(lái)說(shuō),他們并不清楚這些變化是如何發(fā)生的。他們只是按照經(jīng)理給的項(xiàng)目和標(biāo)注規(guī)范去完成工作,很少好奇這些標(biāo)注完的數(shù)據(jù)會(huì)用到哪里。但無(wú)論如何,他們都在為AI的發(fā)展貢獻(xiàn)著自己的力量。
在數(shù)據(jù)標(biāo)注行業(yè),一個(gè)共識(shí)正在形成:要想在專業(yè)領(lǐng)域落地,高質(zhì)量的垂類數(shù)據(jù)是競(jìng)爭(zhēng)的核心。比如醫(yī)療場(chǎng)景中的影像識(shí)別,需要臨床醫(yī)生進(jìn)行標(biāo)注;法律場(chǎng)景中的合同條款,需要律師標(biāo)注條款中的邏輯關(guān)聯(lián)和司法解釋。這導(dǎo)致像劉到閑這樣具備垂直領(lǐng)域?qū)I(yè)知識(shí)的AI訓(xùn)練師成為了香餑餑。
劉到閑所在的公司也意識(shí)到了這一點(diǎn)。他們開(kāi)始投入大筆資金,邀請(qǐng)專業(yè)的錄音師錄制一手的聲音數(shù)據(jù),以提升AI模型的準(zhǔn)確性。同時(shí),他們也在探索如何更好地利用專家型AI訓(xùn)練師來(lái)獲取真實(shí)數(shù)據(jù),以提升模型的質(zhì)量。
但這條道路并不平坦。為了確保工作質(zhì)量,大型AI公司越來(lái)越多地把高質(zhì)量數(shù)據(jù)標(biāo)注的工作放到了內(nèi)部,或直接雇傭?qū)<?,而不是以往的外包。這導(dǎo)致數(shù)據(jù)標(biāo)注行業(yè)的競(jìng)爭(zhēng)日益激烈,阿娟這樣的基礎(chǔ)標(biāo)注員面臨著更大的職業(yè)挑戰(zhàn)。
盡管如此,阿娟并沒(méi)有放棄。她憑借著自己的努力和勤奮,從一名基礎(chǔ)標(biāo)注員晉升為小組長(zhǎng),負(fù)責(zé)組員們的標(biāo)注準(zhǔn)確率和效率。她計(jì)劃繼續(xù)提升自己的職業(yè)能力,爭(zhēng)取在未來(lái)晉升為項(xiàng)目經(jīng)理。
而對(duì)于劉到閑來(lái)說(shuō),他也在思考著自己的未來(lái)。盡管他目前享受著高薪和穩(wěn)定的職業(yè)發(fā)展,但他也感受到了行業(yè)的波動(dòng)和不確定性。他開(kāi)始尋找其他的工作機(jī)會(huì),考慮是否回到媒體行業(yè)或轉(zhuǎn)崗做AI產(chǎn)品經(jīng)理。
在人工智能的浪潮中,阿娟和劉到閑都是不可或缺的角色。他們用自己的雙手和智慧,為AI的發(fā)展貢獻(xiàn)著力量。但與此同時(shí),他們也在面對(duì)著行業(yè)的挑戰(zhàn)和不確定性。未來(lái),他們將何去何從?這仍然是一個(gè)未知數(shù)。