但稍有不同的是,后者都只是在提供勢(shì)能,而對(duì)于數(shù)據(jù)而言,它看似簡(jiǎn)單,卻影響人工智能最終效果,只有高質(zhì)量準(zhǔn)確的數(shù)據(jù)才能夠給AI帶來(lái)價(jià)值,幫助AI落地,在這其中,高效的,高質(zhì)量的AI訓(xùn)練數(shù)據(jù)服務(wù)則是必不可少的。

AI訓(xùn)練數(shù)據(jù)服務(wù)也需工具加持
我們需要先理解一下什么是數(shù)據(jù)標(biāo)注?
對(duì)于AI算法而言,從面世到成熟的這一個(gè)過(guò)程就如同一個(gè)人的成長(zhǎng),數(shù)據(jù)標(biāo)注解決的問(wèn)題就是教會(huì)AI認(rèn)知。比如我們要教AI認(rèn)識(shí)一個(gè)蘋果,我們得現(xiàn)有蘋果的圖片,標(biāo)注好這個(gè)物體叫蘋果,然后通過(guò)學(xué)習(xí)了大量的圖片中的特征,AI才能知道什么是蘋果。
機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等都需要大量數(shù)據(jù)的進(jìn)行AI算法模型訓(xùn)練、迭代與支持。相關(guān)AI數(shù)據(jù)的采集、標(biāo)注與價(jià)值挖掘是人工智能技術(shù)得以在實(shí)際應(yīng)用場(chǎng)景中大展拳腳的重要基石。
據(jù)IDC統(tǒng)計(jì)數(shù)據(jù)顯示,全球每年生產(chǎn)的數(shù)據(jù)量將從2016年的16.1ZB猛增至2025年的163ZB。2020年,中國(guó)能夠保存下來(lái)的數(shù)據(jù)大約在10EB左右,其中80%—90%是非結(jié)構(gòu)化數(shù)據(jù)。
伴隨數(shù)據(jù)指數(shù)級(jí)爆發(fā)而來(lái)的是人工智能在智慧城市、自動(dòng)駕駛、智慧醫(yī)療、智慧金融、工業(yè)互聯(lián)網(wǎng)等多個(gè)領(lǐng)域的大規(guī)模落地,數(shù)據(jù)標(biāo)注質(zhì)量的差異,已成為不同AI細(xì)分領(lǐng)域行業(yè)落地的重中之重。
如何通過(guò)技術(shù)層、工具層的優(yōu)化,在最大限度提升人效比的同時(shí)提升數(shù)據(jù)標(biāo)注準(zhǔn)確性,做好數(shù)據(jù)標(biāo)注這件“人機(jī)協(xié)作”的事,已經(jīng)成為AI應(yīng)用落地的重要課題。
數(shù)據(jù)標(biāo)注平臺(tái)要有哪些“硬實(shí)力”
當(dāng)前,各個(gè)領(lǐng)域最高質(zhì)量AI訓(xùn)練數(shù)據(jù)需求也十分迫切。AI在各種各樣垂直領(lǐng)域進(jìn)行落地,比如說(shuō)教育、法律、智能駕駛、銀行金融等,每個(gè)領(lǐng)域都有細(xì)分專業(yè)化的要求。
其中,尤其智能化轉(zhuǎn)型的傳統(tǒng)企業(yè)和科技企業(yè)相比,更需要有項(xiàng)目經(jīng)驗(yàn)豐富的AI訓(xùn)練數(shù)據(jù)服務(wù)商的協(xié)助,幫忙他們進(jìn)行AI訓(xùn)練數(shù)據(jù)需求梳理、并引導(dǎo)企業(yè)數(shù)據(jù)需求,來(lái)獲取更加貼合使用場(chǎng)景的高質(zhì)AI數(shù)據(jù),以縮減研發(fā)周期、加快落地進(jìn)程,助力企業(yè)更快更好的智能化轉(zhuǎn)型。
在此背景之下,云測(cè)數(shù)據(jù)總經(jīng)理賈宇航認(rèn)為,當(dāng)前優(yōu)秀的AI訓(xùn)練數(shù)據(jù)服務(wù)提供方,必須至少具備三種能力:對(duì)場(chǎng)景深度的還原能力、作業(yè)協(xié)同化能力、專業(yè)化能力。和荒蠻時(shí)期的勞動(dòng)密集型數(shù)據(jù)標(biāo)注公司不同,云測(cè)數(shù)據(jù)配備有專業(yè)搭建場(chǎng)景的實(shí)驗(yàn)室、數(shù)據(jù)標(biāo)注基地和集成前沿技術(shù)的數(shù)據(jù)標(biāo)注平臺(tái),通過(guò)有完善的數(shù)據(jù)生產(chǎn)流程、抽檢和質(zhì)檢環(huán)節(jié)并嚴(yán)格把控生產(chǎn)效率,保證AI訓(xùn)練數(shù)據(jù)的質(zhì)量和效率。

以云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)4.0為例,相比傳統(tǒng)的采集數(shù)據(jù)、訓(xùn)練模型的方式,云測(cè)數(shù)據(jù)采用了“數(shù)據(jù)在環(huán)和模型迭代在環(huán)新方式”,將數(shù)據(jù)在環(huán)開(kāi)發(fā)打通,將數(shù)據(jù)采集、處理、標(biāo)注、訓(xùn)練、模型輸出進(jìn)行持續(xù)迭代集成。
通過(guò)云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)4.0的工具賦能,在為AI提供了企業(yè)處理大規(guī)模感知數(shù)據(jù)的能力同時(shí),可以減少數(shù)據(jù)采集周期,提升數(shù)據(jù)標(biāo)注效率,并大幅降低AI模型訓(xùn)練成本,并幫助企業(yè)在數(shù)據(jù)識(shí)別準(zhǔn)確率提升上達(dá)到傳統(tǒng)方式無(wú)法達(dá)到的高度,極大地加速了人工智能的落地迭代周期,節(jié)省大量研發(fā)時(shí)間和成本。
相比傳統(tǒng)的數(shù)據(jù)標(biāo)注工具,云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)4.0具有自研網(wǎng)絡(luò)傳輸工具加密傳輸數(shù)據(jù)、支持S3協(xié)議OSS私有安全存儲(chǔ)、支持多用戶訪問(wèn)權(quán)限管理、支持全類型數(shù)據(jù)標(biāo)注、AI智能輔助標(biāo)注、多道數(shù)據(jù)質(zhì)量控制流程、完善的績(jī)效數(shù)據(jù)統(tǒng)計(jì)、支持私有化安全部署等多個(gè)能力。有AI訓(xùn)練數(shù)據(jù)需求的企業(yè),通過(guò)云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)4.0可以極大提升數(shù)據(jù)處理效率,結(jié)合數(shù)據(jù)在環(huán),通過(guò)引入模型輸出預(yù)識(shí)別結(jié)果,可進(jìn)一步降低人員處理投入,迭代后期,人員只處理關(guān)鍵高價(jià)值數(shù)據(jù)和對(duì)AI輔助標(biāo)注結(jié)果進(jìn)行審核驗(yàn)證,人力成本逐步下降。
同時(shí),云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)4.0具有極強(qiáng)的易用性,標(biāo)注人員只需查看操作手冊(cè)或簡(jiǎn)單的指導(dǎo)就可以使用平臺(tái)的各種功能及標(biāo)注工具。
綜合各種優(yōu)勢(shì)來(lái)看,云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)4.0可以助力企業(yè)AI數(shù)據(jù)訓(xùn)練綜合效率提升200%、服務(wù)成本降低60% 、標(biāo)注精準(zhǔn)度最高達(dá)99.99%。

AI也需要“幫手”
三年前,麥肯錫發(fā)布了一份長(zhǎng)達(dá)80頁(yè)的《人工智能:下一個(gè)數(shù)字前沿》的報(bào)告,其中的核心觀點(diǎn)就是,傳統(tǒng)企業(yè)如果不及時(shí)進(jìn)行人工智能轉(zhuǎn)型,就會(huì)被人工智能的早期使用者越甩越遠(yuǎn)。
三年時(shí)間過(guò)去,當(dāng)時(shí)的積極轉(zhuǎn)型者都已經(jīng)在走在行業(yè)前端,進(jìn)行人工智能自我革命的企業(yè)已經(jīng)越來(lái)越多。因?yàn)樗鼈兌济靼滓粋(gè)普世真理,如果你不自我進(jìn)化,終將被世界的優(yōu)勝劣汰準(zhǔn)則所拋棄。
然而對(duì)于人工智能這項(xiàng)技術(shù)而言,則也需要一個(gè)好的幫手為其助力。可喜的是,經(jīng)歷過(guò)人工智能領(lǐng)域草莽斗爭(zhēng)后,脫穎而出的專業(yè)化AI訓(xùn)練數(shù)據(jù)服務(wù)商,已經(jīng)能夠幫助企業(yè)大幅度縮短人工智能應(yīng)用落地的進(jìn)程,減少智能化改革的成本,加速AI時(shí)代到來(lái)。