數(shù)據(jù)是訓(xùn)練AI能力的“原料”之一。在第八屆數(shù)字中國建設(shè)峰會29日舉行的“高質(zhì)量數(shù)據(jù)集和數(shù)據(jù)標(biāo)注”主題交流活動上,由國家數(shù)據(jù)局指導(dǎo)的全國數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù)委員會提出,將強化標(biāo)準(zhǔn)引領(lǐng),分三類建設(shè)高質(zhì)量數(shù)據(jù)集。一類為“通識數(shù)據(jù)集”,包含面向社會公眾、無需專業(yè)背景即可理解的通用知識,主要用于支撐通用模型落地應(yīng)用。一類為“行業(yè)通識數(shù)據(jù)集”,包含面向行業(yè)從業(yè)人員、需要一定專業(yè)背景才能理解的行業(yè)領(lǐng)域通用知識,主要用于支撐行業(yè)模型落地應(yīng)用。一類為“行業(yè)專識數(shù)據(jù)集”,包含面向特定業(yè)務(wù)場景相關(guān)人員、需要較深的專業(yè)背景才能理解的行業(yè)領(lǐng)域?qū)I(yè)知識,主要用于支撐業(yè)務(wù)場景模型落地應(yīng)用。簡單舉例,互聯(lián)網(wǎng)百科、問答等為“通識數(shù)據(jù)集”;行業(yè)研究機構(gòu)報告等為“行業(yè)通識數(shù)據(jù)集”;醫(yī)院科室特定疾病病例等為“行業(yè)專識數(shù)據(jù)集”。國家數(shù)據(jù)局相關(guān)負責(zé)人表示,從發(fā)展趨勢來看,人工智能模型對數(shù)據(jù)集的需求正從“通用知識”向“專業(yè)知識”延伸拓展,經(jīng)過專家精細化標(biāo)注的數(shù)據(jù)集已成為AI價值實現(xiàn)過程中不可或缺的基石,下一步將積極引導(dǎo)做好高質(zhì)量數(shù)據(jù)集和數(shù)據(jù)標(biāo)注建設(shè)工作,為人工智能技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用提供堅實的數(shù)據(jù)基礎(chǔ)。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點或證實其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。