您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

AI模型訓(xùn)練提效200%!云測數(shù)據(jù)造“史上最強(qiáng)”數(shù)據(jù)標(biāo)注平臺?

2021-05-28 17:02:28   作者:   來源:CTI論壇   評論:0  點擊:


  伴隨著數(shù)字經(jīng)濟(jì)的向前發(fā)展,人工智能已經(jīng)滲透了人們生活、工作所接觸的每個場景之中。隨著而來,數(shù)據(jù)也正呈現(xiàn)出指數(shù)級的增長。作為人工智能發(fā)展中的關(guān)鍵因素,數(shù)據(jù)對于AI來說,就像煤炭之于蒸汽機(jī),電能之于燈泡,汽油之于汽車。
  但稍有不同的是,后者都只是在提供勢能,而對于數(shù)據(jù)而言,它看似簡單,卻影響人工智能最終效果,只有高質(zhì)量準(zhǔn)確的數(shù)據(jù)才能夠給AI帶來價值,幫助AI落地,在這其中,高效的,高質(zhì)量的AI訓(xùn)練數(shù)據(jù)服務(wù)則是必不可少的。
  AI訓(xùn)練數(shù)據(jù)服務(wù)也需工具加持
  我們需要先理解一下什么是數(shù)據(jù)標(biāo)注?
  對于AI算法而言,從面世到成熟的這一個過程就如同一個人的成長,數(shù)據(jù)標(biāo)注解決的問題就是教會AI認(rèn)知。比如我們要教AI認(rèn)識一個蘋果,我們得現(xiàn)有蘋果的圖片,標(biāo)注好這個物體叫蘋果,然后通過學(xué)習(xí)了大量的圖片中的特征,AI才能知道什么是蘋果。
  機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等都需要大量數(shù)據(jù)的進(jìn)行AI算法模型訓(xùn)練、迭代與支持。相關(guān)AI數(shù)據(jù)的采集、標(biāo)注與價值挖掘是人工智能技術(shù)得以在實際應(yīng)用場景中大展拳腳的重要基石。
  據(jù)IDC統(tǒng)計數(shù)據(jù)顯示,全球每年生產(chǎn)的數(shù)據(jù)量將從2016年的16.1ZB猛增至2025年的163ZB。2020年,中國能夠保存下來的數(shù)據(jù)大約在10EB左右,其中80%—90%是非結(jié)構(gòu)化數(shù)據(jù)。
  伴隨數(shù)據(jù)指數(shù)級爆發(fā)而來的是人工智能在智慧城市、自動駕駛、智慧醫(yī)療、智慧金融、工業(yè)互聯(lián)網(wǎng)等多個領(lǐng)域的大規(guī)模落地,數(shù)據(jù)標(biāo)注質(zhì)量的差異,已成為不同AI細(xì)分領(lǐng)域行業(yè)落地的重中之重。
  如何通過技術(shù)層、工具層的優(yōu)化,在最大限度提升人效比的同時提升數(shù)據(jù)標(biāo)注準(zhǔn)確性,做好數(shù)據(jù)標(biāo)注這件“人機(jī)協(xié)作”的事,已經(jīng)成為AI應(yīng)用落地的重要課題。
  數(shù)據(jù)標(biāo)注平臺要有哪些“硬實力”
  當(dāng)前,各個領(lǐng)域最高質(zhì)量AI訓(xùn)練數(shù)據(jù)需求也十分迫切。AI在各種各樣垂直領(lǐng)域進(jìn)行落地,比如說教育、法律、智能駕駛、銀行金融等,每個領(lǐng)域都有細(xì)分專業(yè)化的要求。
  其中,尤其智能化轉(zhuǎn)型的傳統(tǒng)企業(yè)和科技企業(yè)相比,更需要有項目經(jīng)驗豐富的AI訓(xùn)練數(shù)據(jù)服務(wù)商的協(xié)助,幫忙他們進(jìn)行AI訓(xùn)練數(shù)據(jù)需求梳理、并引導(dǎo)企業(yè)數(shù)據(jù)需求,來獲取更加貼合使用場景的高質(zhì)AI數(shù)據(jù),以縮減研發(fā)周期、加快落地進(jìn)程,助力企業(yè)更快更好的智能化轉(zhuǎn)型。
  在此背景之下,云測數(shù)據(jù)總經(jīng)理賈宇航認(rèn)為,當(dāng)前優(yōu)秀的AI訓(xùn)練數(shù)據(jù)服務(wù)提供方,必須至少具備三種能力:對場景深度的還原能力、作業(yè)協(xié)同化能力、專業(yè)化能力。和荒蠻時期的勞動密集型數(shù)據(jù)標(biāo)注公司不同,云測數(shù)據(jù)配備有專業(yè)搭建場景的實驗室、數(shù)據(jù)標(biāo)注基地和集成前沿技術(shù)的數(shù)據(jù)標(biāo)注平臺,通過有完善的數(shù)據(jù)生產(chǎn)流程、抽檢和質(zhì)檢環(huán)節(jié)并嚴(yán)格把控生產(chǎn)效率,保證AI訓(xùn)練數(shù)據(jù)的質(zhì)量和效率。
  以云測數(shù)據(jù)標(biāo)注平臺4.0為例,相比傳統(tǒng)的采集數(shù)據(jù)、訓(xùn)練模型的方式,云測數(shù)據(jù)采用了“數(shù)據(jù)在環(huán)和模型迭代在環(huán)新方式”,將數(shù)據(jù)在環(huán)開發(fā)打通,將數(shù)據(jù)采集、處理、標(biāo)注、訓(xùn)練、模型輸出進(jìn)行持續(xù)迭代集成。
  通過云測數(shù)據(jù)標(biāo)注平臺4.0的工具賦能,在為AI提供了企業(yè)處理大規(guī)模感知數(shù)據(jù)的能力同時,可以減少數(shù)據(jù)采集周期,提升數(shù)據(jù)標(biāo)注效率,并大幅降低AI模型訓(xùn)練成本,并幫助企業(yè)在數(shù)據(jù)識別準(zhǔn)確率提升上達(dá)到傳統(tǒng)方式無法達(dá)到的高度,極大地加速了人工智能的落地迭代周期,節(jié)省大量研發(fā)時間和成本。
  相比傳統(tǒng)的數(shù)據(jù)標(biāo)注工具,云測數(shù)據(jù)標(biāo)注平臺4.0具有自研網(wǎng)絡(luò)傳輸工具加密傳輸數(shù)據(jù)、支持S3協(xié)議OSS私有安全存儲、支持多用戶訪問權(quán)限管理、支持全類型數(shù)據(jù)標(biāo)注、AI智能輔助標(biāo)注、多道數(shù)據(jù)質(zhì)量控制流程、完善的績效數(shù)據(jù)統(tǒng)計、支持私有化安全部署等多個能力。有AI訓(xùn)練數(shù)據(jù)需求的企業(yè),通過云測數(shù)據(jù)標(biāo)注平臺4.0可以極大提升數(shù)據(jù)處理效率,結(jié)合數(shù)據(jù)在環(huán),通過引入模型輸出預(yù)識別結(jié)果,可進(jìn)一步降低人員處理投入,迭代后期,人員只處理關(guān)鍵高價值數(shù)據(jù)和對AI輔助標(biāo)注結(jié)果進(jìn)行審核驗證,人力成本逐步下降。
  同時,云測數(shù)據(jù)標(biāo)注平臺4.0具有極強(qiáng)的易用性,標(biāo)注人員只需查看操作手冊或簡單的指導(dǎo)就可以使用平臺的各種功能及標(biāo)注工具。
  綜合各種優(yōu)勢來看,云測數(shù)據(jù)標(biāo)注平臺4.0可以助力企業(yè)AI數(shù)據(jù)訓(xùn)練綜合效率提升200%、服務(wù)成本降低60% 、標(biāo)注精準(zhǔn)度最高達(dá)99.99%。
  AI也需要“幫手”
  三年前,麥肯錫發(fā)布了一份長達(dá)80頁的《人工智能:下一個數(shù)字前沿》的報告,其中的核心觀點就是,傳統(tǒng)企業(yè)如果不及時進(jìn)行人工智能轉(zhuǎn)型,就會被人工智能的早期使用者越甩越遠(yuǎn)。
  三年時間過去,當(dāng)時的積極轉(zhuǎn)型者都已經(jīng)在走在行業(yè)前端,進(jìn)行人工智能自我革命的企業(yè)已經(jīng)越來越多。因為它們都明白一個普世真理,如果你不自我進(jìn)化,終將被世界的優(yōu)勝劣汰準(zhǔn)則所拋棄。
  然而對于人工智能這項技術(shù)而言,則也需要一個好的幫手為其助力?上驳氖,經(jīng)歷過人工智能領(lǐng)域草莽斗爭后,脫穎而出的專業(yè)化AI訓(xùn)練數(shù)據(jù)服務(wù)商,已經(jīng)能夠幫助企業(yè)大幅度縮短人工智能應(yīng)用落地的進(jìn)程,減少智能化改革的成本,加速AI時代到來。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)