到2027年數(shù)據(jù)標(biāo)注產(chǎn)業(yè)年均增幅將超過(guò)20%
國(guó)家發(fā)展改革委等四部門(mén)近日聯(lián)合發(fā)布《關(guān)于促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展的實(shí)施意見(jiàn)》(以下簡(jiǎn)稱(chēng)《意見(jiàn)》)?!兑庖?jiàn)》提出,到2027年,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)專(zhuān)業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產(chǎn)業(yè)規(guī)模大幅躍升,年均復(fù)合增長(zhǎng)率超過(guò)20%。
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)是對(duì)數(shù)據(jù)進(jìn)行篩選、清洗、分類(lèi)、注釋、標(biāo)記和質(zhì)量檢驗(yàn)等加工處理的新興產(chǎn)業(yè)。培育壯大數(shù)據(jù)標(biāo)注產(chǎn)業(yè)對(duì)于提升數(shù)據(jù)供給質(zhì)量、推動(dòng)人工智能創(chuàng)新發(fā)展具有重要支撐作用。
為促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展,《實(shí)施意見(jiàn)》圍繞深化需求牽引、增強(qiáng)創(chuàng)新驅(qū)動(dòng)、繁榮產(chǎn)業(yè)生態(tài)、優(yōu)化產(chǎn)業(yè)支撐等四方面提出13條具體政策舉措。
比如,在深挖企業(yè)需求方面,《實(shí)施意見(jiàn)》提出,實(shí)施“國(guó)有企業(yè)數(shù)據(jù)效能提升行動(dòng)”,加大企業(yè)數(shù)據(jù)開(kāi)發(fā)利用,釋放企業(yè)數(shù)據(jù)標(biāo)注需求。加強(qiáng)交通、醫(yī)療、金融、科學(xué)、制造和農(nóng)業(yè)等重點(diǎn)行業(yè)領(lǐng)域數(shù)據(jù)標(biāo)注,建設(shè)行業(yè)高質(zhì)量數(shù)據(jù)集,支撐人工智能在行業(yè)領(lǐng)域的應(yīng)用賦能。圍繞醫(yī)療健康、人力資源、數(shù)字貿(mào)易、自動(dòng)駕駛和低空經(jīng)濟(jì)等場(chǎng)景,以業(yè)務(wù)創(chuàng)新拉動(dòng)數(shù)據(jù)標(biāo)注需求。
在開(kāi)展關(guān)鍵技術(shù)攻關(guān)方面,《實(shí)施意見(jiàn)》要求,依托國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家科技重大專(zhuān)項(xiàng)等,加強(qiáng)跨領(lǐng)域跨模態(tài)語(yǔ)義對(duì)齊、4D標(biāo)注、大模型標(biāo)注等數(shù)據(jù)標(biāo)注領(lǐng)域的關(guān)鍵技術(shù)攻關(guān)應(yīng)用。支持多模態(tài)標(biāo)注、標(biāo)注審查、質(zhì)量評(píng)估、基于思維鏈的專(zhuān)家標(biāo)注等智能化工具研發(fā)。支持建設(shè)集數(shù)據(jù)、模型、工具、場(chǎng)景為一體的數(shù)據(jù)標(biāo)注創(chuàng)新平臺(tái),推動(dòng)數(shù)據(jù)標(biāo)注技術(shù)融合創(chuàng)新。
“數(shù)據(jù)標(biāo)注的核心目的是提取原始數(shù)據(jù)中的關(guān)鍵信息,為訓(xùn)練人工智能大模型提供支持?!北本┦猩鐣?huì)科學(xué)院管理研究所副研究員王鵬認(rèn)為,隨著人工智能技術(shù)的迅猛發(fā)展,數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的必要環(huán)節(jié),其上游產(chǎn)業(yè)需求大增。與此同時(shí),當(dāng)前數(shù)據(jù)標(biāo)注行業(yè)發(fā)展存在一些亟待突破的難點(diǎn),如缺乏統(tǒng)一的行業(yè)標(biāo)準(zhǔn)、標(biāo)注質(zhì)量參差不齊、人力資源與技術(shù)水平不匹配等。因此,推動(dòng)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展的重要性日益凸顯。
談到未來(lái)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的前景,王鵬分析,在農(nóng)業(yè)領(lǐng)域,氣象、農(nóng)業(yè)病蟲(chóng)害防治、農(nóng)產(chǎn)品檢測(cè)等方面的數(shù)據(jù)標(biāo)注需求將不斷增加;智能制造領(lǐng)域,對(duì)于工業(yè)設(shè)備的狀態(tài)監(jiān)測(cè)、故障診斷以及質(zhì)量防控等方面的數(shù)據(jù)標(biāo)注需求也在增大;隨著人工智能和大數(shù)據(jù)技術(shù)的發(fā)展,自然語(yǔ)言處理、圖像識(shí)別、語(yǔ)音識(shí)別等方面的數(shù)據(jù)標(biāo)注需求進(jìn)一步擴(kuò)大;此外,自動(dòng)駕駛和低空經(jīng)濟(jì)的發(fā)展,對(duì)環(huán)境識(shí)別以及車(chē)輛行為預(yù)測(cè),都有著巨大的數(shù)據(jù)標(biāo)注需求。
王鵬指出,繁榮數(shù)據(jù)標(biāo)注產(chǎn)業(yè)生態(tài),關(guān)鍵是做好“標(biāo)準(zhǔn)制定”,應(yīng)制定符合各行業(yè)特點(diǎn)的管理規(guī)范,以滿(mǎn)足不同行業(yè)對(duì)數(shù)據(jù)標(biāo)注的需求。同時(shí),要提前布局?jǐn)?shù)據(jù)標(biāo)注的多模態(tài)融合,確保標(biāo)注過(guò)程合法合規(guī),保障數(shù)據(jù)安全。
下一步,國(guó)家發(fā)展改革委、國(guó)家數(shù)據(jù)局、財(cái)政部、人力資源和社會(huì)保障部將強(qiáng)化數(shù)據(jù)標(biāo)注產(chǎn)業(yè)頂層規(guī)劃,協(xié)調(diào)解決產(chǎn)業(yè)發(fā)展過(guò)程中存在的重大問(wèn)題。加強(qiáng)政策解讀和案例征集等宣傳推廣,營(yíng)造數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展的良好氛圍。(王 君)