隨著行業(yè)高速數(shù)字化發(fā)展及AI技術(shù)創(chuàng)新應(yīng)用的涌現(xiàn),人工智能產(chǎn)業(yè)正在迎來(lái)一個(gè)新的黃金發(fā)展期,人工智能研發(fā)運(yùn)營(yíng)一體化(Model/MLOps)開始備受關(guān)注,旨在以高質(zhì)量AI數(shù)據(jù)為燃料推動(dòng)AI模型快速迭代,高效交付優(yōu)質(zhì)AI模型推理服務(wù),助力企業(yè)機(jī)構(gòu)提升AI研發(fā)運(yùn)營(yíng)效能,驅(qū)動(dòng)自身智能化轉(zhuǎn)型。 雖然國(guó)內(nèi)外很多科技企業(yè)有意識(shí)地推出MLOps平臺(tái)或工具,但Model/MLOps的管理體系尚處于發(fā)展初期,這種形勢(shì)下為了規(guī)避行業(yè)的無(wú)序發(fā)展,構(gòu)建開發(fā)管理規(guī)范化體系,提升流程規(guī)范性、過(guò)程自動(dòng)化、標(biāo)準(zhǔn)一致性變得尤為重要。 云測(cè)數(shù)據(jù)參與新標(biāo)準(zhǔn)編寫,推動(dòng)AI數(shù)據(jù)服務(wù)未來(lái)有序發(fā)展 2022年4月底,中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所(中國(guó)信通院云大所)重磅發(fā)布全球首個(gè)AI模型開發(fā)管理標(biāo)準(zhǔn)——《人工智能研發(fā)運(yùn)營(yíng)一體化(Model/MLOps)能力成熟度模型第一部分:開發(fā)管理》,這是《人工智能研發(fā)運(yùn)營(yíng)一體化(Model/MLOps)能力成熟度模型》系列的首個(gè)標(biāo)準(zhǔn),為企業(yè)機(jī)構(gòu)在機(jī)器學(xué)習(xí)項(xiàng)目開發(fā)管理上提供能力成熟度參考依據(jù)。
其中,云測(cè)數(shù)據(jù)作為唯一一家AI數(shù)據(jù)服務(wù)領(lǐng)域頭部企業(yè),與華為、百度、京東、中原銀行等數(shù)十家領(lǐng)先科技公司,大型金融機(jī)構(gòu)、運(yùn)營(yíng)商共同參與了本次標(biāo)準(zhǔn)編寫,對(duì)企業(yè)機(jī)構(gòu)發(fā)展人工智能研發(fā)運(yùn)營(yíng)管理體系具有重要的引導(dǎo)和借鑒作用。 尤其在AI數(shù)據(jù)服務(wù)領(lǐng)域,數(shù)據(jù)質(zhì)量的好壞是決定AI應(yīng)用落地效果的重要因素。云測(cè)數(shù)據(jù)參與編寫的“數(shù)據(jù)處理”部分有力地推動(dòng)了AI數(shù)據(jù)服務(wù)領(lǐng)域構(gòu)建標(biāo)準(zhǔn)化體系,為AI模型快速獲取高質(zhì)量訓(xùn)練數(shù)據(jù)提供了科學(xué)方法論。 高質(zhì)量數(shù)據(jù)是如何煉成的? 開發(fā)AI模型需要基于模型訓(xùn)練要求“定制”大量數(shù)據(jù),但這些數(shù)據(jù)不是AI應(yīng)用所需的高質(zhì)量訓(xùn)練數(shù)據(jù)。在云測(cè)數(shù)據(jù)參與編寫的數(shù)據(jù)處理部分指出,數(shù)據(jù)需要經(jīng)過(guò)處理過(guò)程,包括預(yù)處理、標(biāo)注和版本管理,以便減少數(shù)據(jù)異常、缺失、冗余等問(wèn)題,保證模型訓(xùn)練效果。 數(shù)據(jù)預(yù)處理指數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)增強(qiáng)的過(guò)程。通過(guò)人工或機(jī)器輔助篩選方式,再基于特定規(guī)則,篩選出有價(jià)值的數(shù)據(jù),然后轉(zhuǎn)換成適合數(shù)據(jù)處理的描述形式,再基于現(xiàn)有數(shù)據(jù)變換出更多新的數(shù)據(jù),提高模型泛化能力。 接下來(lái)是數(shù)據(jù)標(biāo)注,數(shù)據(jù)標(biāo)注是把像素、語(yǔ)音信號(hào)、文本等內(nèi)容轉(zhuǎn)換成機(jī)器可理解的數(shù)據(jù),再進(jìn)行識(shí)別處理,是AI模型能學(xué)習(xí)和準(zhǔn)確預(yù)測(cè)的關(guān)鍵。支撐AI應(yīng)用質(zhì)量的背后是算法精度,因此數(shù)據(jù)標(biāo)注的精確度能直接影響AI應(yīng)用的質(zhì)量。 實(shí)際上,AI數(shù)據(jù)服務(wù)市場(chǎng)最初就是圍繞數(shù)據(jù)標(biāo)注產(chǎn)業(yè)延展壯大,而隨著AI數(shù)據(jù)選擇標(biāo)準(zhǔn)的形成,數(shù)據(jù)質(zhì)量,行業(yè)經(jīng)驗(yàn)和日漸豐富的場(chǎng)景對(duì)AI應(yīng)用有所影響,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)也開始走向細(xì)分市場(chǎng)。
作為AI數(shù)據(jù)服務(wù)市場(chǎng)的領(lǐng)頭羊,云測(cè)數(shù)據(jù)也在同步完善整體AI數(shù)據(jù)生態(tài),細(xì)化和規(guī)范數(shù)據(jù)服務(wù)。面向智能駕駛、智慧城市、智能家居、智慧金融、新零售等眾多領(lǐng)域提供一站式數(shù)據(jù)處理服務(wù),提供通用數(shù)據(jù)集、數(shù)據(jù)標(biāo)注平臺(tái)&數(shù)據(jù)管理系統(tǒng)等生產(chǎn)工具,實(shí)現(xiàn)“數(shù)據(jù)原料”到最后的“數(shù)據(jù)成品”全鏈條打通,持續(xù)為計(jì)算機(jī)視覺、語(yǔ)音識(shí)別、自然語(yǔ)言處理、知識(shí)圖譜等AI主流技術(shù)領(lǐng)域提供高價(jià)值數(shù)據(jù)支持。實(shí)現(xiàn)場(chǎng)景數(shù)據(jù)專業(yè)化、高質(zhì)量交付,幫助科技企業(yè)更快更好地實(shí)現(xiàn)AI應(yīng)用成功落地。 總結(jié) 隨著數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng),我們的新型人工智能應(yīng)用開發(fā)將要求更高的數(shù)據(jù)質(zhì)量來(lái)作為使用標(biāo)準(zhǔn),加速縮短我們與未來(lái)的距離,期待云測(cè)數(shù)據(jù)助力更多AI應(yīng)用場(chǎng)景化落地、更多傳統(tǒng)企業(yè)完成智能化轉(zhuǎn)型的精彩表現(xiàn)!
|