久久最新最好视频|精品福利视频在线|狠狠狠干在线播放|色尼玛亚洲综合网|日韩加勒比无码AV|亚洲AV人人澡人人爽人人爱|国产精品免费怡红院|婷婷一区二区XXX|日韩成人一区二区三|欧美熟妇另类AAAAAA

歡迎訪問智慧醫(yī)療網(wǎng) | 網(wǎng)站首頁(yè)
 
當(dāng)前位置:首頁(yè) > 資訊 > 觀點(diǎn)

專家解讀 | 推進(jìn)高質(zhì)量數(shù)據(jù)集建設(shè),聚焦醫(yī)療等數(shù)據(jù)密集且有明確需求的重點(diǎn)行業(yè)

發(fā)布時(shí)間:2025-08-21 來(lái)源:國(guó)家數(shù)據(jù)局 瀏覽量: 字號(hào):【加大】【減小】 手機(jī)上觀看

打開手機(jī)掃描二維碼
即可在手機(jī)端查看

文 | 清華大學(xué)人工智能國(guó)際治理研究院副院長(zhǎng) 梁正

《全國(guó)數(shù)據(jù)資源調(diào)查報(bào)告(2024年)》顯示,2024年我國(guó)高質(zhì)量數(shù)據(jù)集數(shù)量同比增長(zhǎng)27.4%,標(biāo)志高質(zhì)量數(shù)據(jù)集建設(shè)進(jìn)入加速期。隨著人工智能技術(shù)更進(jìn)一步發(fā)展,對(duì)高質(zhì)量數(shù)據(jù)集的需求缺口必將繼續(xù)增大。加強(qiáng)優(yōu)質(zhì)數(shù)據(jù)供給,以高質(zhì)量數(shù)據(jù)驅(qū)動(dòng)人工智能創(chuàng)新發(fā)展變得愈發(fā)關(guān)鍵。


01
明確高質(zhì)量數(shù)據(jù)集建設(shè)的戰(zhàn)略意義
習(xí)近平總書記圍繞“發(fā)揮數(shù)據(jù)的基礎(chǔ)資源作用和創(chuàng)新引擎作用”做過多項(xiàng)重要的戰(zhàn)略部署,近日發(fā)布的《人工智能全球治理行動(dòng)計(jì)劃》《關(guān)于深入實(shí)施“人工智能+”行動(dòng)的意見》也對(duì)“數(shù)據(jù)供給”議題予以特別關(guān)注。當(dāng)前正值人工智能引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的歷史性窗口,數(shù)據(jù)作為新型生產(chǎn)要素的重要作用空前凸顯,已經(jīng)成為推動(dòng)傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、培育新質(zhì)生產(chǎn)力的中堅(jiān)力量,數(shù)據(jù)領(lǐng)域的新技術(shù)、新模式、新業(yè)態(tài)不斷涌現(xiàn),數(shù)據(jù)要素對(duì)于經(jīng)濟(jì)社會(huì)發(fā)展的乘數(shù)效應(yīng)進(jìn)一步放大。在此背景下,高質(zhì)量數(shù)據(jù)集建設(shè)的戰(zhàn)略意義已經(jīng)遠(yuǎn)超技術(shù)與應(yīng)用層面。
一方面,高質(zhì)量數(shù)據(jù)集是構(gòu)筑國(guó)家核心競(jìng)爭(zhēng)力的關(guān)鍵要素和維護(hù)國(guó)家安全的重要屏障。掌握高質(zhì)量、主權(quán)可控的優(yōu)質(zhì)數(shù)據(jù)資源,不僅關(guān)乎我國(guó)是否能在全球數(shù)字經(jīng)濟(jì)版圖占據(jù)有利地位,更是直接影響產(chǎn)業(yè)鏈、供應(yīng)鏈的韌性與安全。尤其是對(duì)于金融、能源、交通、國(guó)防等關(guān)鍵領(lǐng)域,高質(zhì)量數(shù)據(jù)集的建設(shè)與治理更是保障經(jīng)濟(jì)社會(huì)穩(wěn)定運(yùn)行、提升國(guó)家治理體系和治理能力現(xiàn)代化的內(nèi)在要求,是國(guó)家安全體系不可或缺的組成部分。
另一方面,高質(zhì)量數(shù)據(jù)集是驅(qū)動(dòng)產(chǎn)業(yè)深度轉(zhuǎn)型和催生重大科技突破的根本前提。產(chǎn)業(yè)應(yīng)用方面,海量、優(yōu)質(zhì)、多樣的數(shù)據(jù)集是人工智能性能躍升的基礎(chǔ)。隨著人工智能模型不斷變“大”,數(shù)據(jù)供給不足已經(jīng)成為亟待解決的問題。數(shù)據(jù)質(zhì)量更是成為制約人工智能從“可用”向“好用”跨越,更深入賦能實(shí)體經(jīng)濟(jì)的瓶頸。只有通過建設(shè)面向具體場(chǎng)景的高質(zhì)量數(shù)據(jù)集,才能真正打通技術(shù)落地的“最后一公里”。而在科技創(chuàng)新方面,未來(lái)的科學(xué)發(fā)現(xiàn)愈發(fā)依賴數(shù)據(jù)驅(qū)動(dòng)的研究范式。蘊(yùn)含深刻領(lǐng)域知識(shí)“更聰明”的數(shù)據(jù)集,是科學(xué)家探索、發(fā)現(xiàn)新規(guī)律的“創(chuàng)新燃料”。

02
阻礙高質(zhì)量數(shù)據(jù)集建設(shè)的三重挑戰(zhàn)
盡管我國(guó)高質(zhì)量數(shù)據(jù)集建設(shè)已經(jīng)取得初步進(jìn)展,但其未來(lái)發(fā)展仍然面臨許多挑戰(zhàn)。供給側(cè)層面,結(jié)構(gòu)性矛盾尤為突出。一是當(dāng)前支撐前沿科研與關(guān)鍵行業(yè)應(yīng)用的中文,以及垂類領(lǐng)域高質(zhì)量數(shù)據(jù)集總量不足;二是跨部門、行業(yè)和地區(qū)的數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一與互操作性缺失,導(dǎo)致海量異構(gòu)數(shù)據(jù)資源整合困難、處理成本高;三是現(xiàn)有數(shù)據(jù)質(zhì)量評(píng)估大多止于完整性、一致性等基礎(chǔ)維度,普遍缺乏對(duì)于科學(xué)知識(shí)內(nèi)涵與工程指標(biāo)洞察的深度挖掘能力。所以,很多時(shí)候存在“量大質(zhì)低”現(xiàn)象。
技術(shù)底座層面,高質(zhì)量數(shù)據(jù)集建設(shè)的關(guān)鍵環(huán)節(jié)存在明顯薄弱點(diǎn)。當(dāng)前的數(shù)據(jù)加工、處理的自動(dòng)化水平較低,多依賴傳統(tǒng)的人工密集型方式。如此不僅成本高昂、效率低下,倘若標(biāo)注者自身的學(xué)歷、能力參差不齊,數(shù)據(jù)集的實(shí)際效用也會(huì)大打折扣——這樣的情況會(huì)在醫(yī)療、建筑等專業(yè)性較強(qiáng)的領(lǐng)域尤為突出。面向復(fù)雜場(chǎng)景的數(shù)據(jù)合成、數(shù)據(jù)蒸餾等關(guān)鍵技術(shù)有待突破,盡管部分算法具備自主性的學(xué)習(xí)能力,但在很大程度上仍需要人來(lái)引導(dǎo),難以規(guī)?;a(chǎn)專業(yè)領(lǐng)域所需的“高質(zhì)量”數(shù)據(jù)。更為關(guān)鍵的一點(diǎn)是,目前各個(gè)行業(yè)普遍缺乏廣泛認(rèn)可的高質(zhì)量數(shù)據(jù)集評(píng)估標(biāo)準(zhǔn)、認(rèn)證體系以及配套工具鏈。這不僅使數(shù)據(jù)價(jià)值難被客觀、科學(xué)地度量,更使高質(zhì)量數(shù)據(jù)集建設(shè)的目標(biāo)定位變得模糊,進(jìn)而,導(dǎo)致“為數(shù)據(jù)而數(shù)據(jù)”的本末倒置行為出現(xiàn)。
管理機(jī)制層面,高質(zhì)量數(shù)據(jù)集建設(shè)的系統(tǒng)規(guī)劃與協(xié)同能力仍有不足。一方面,從原始資源到高質(zhì)量數(shù)據(jù)集的轉(zhuǎn)化路徑缺乏清晰的實(shí)施框架。因此,部分高質(zhì)量數(shù)據(jù)集的建設(shè)呈現(xiàn)一定程度的碎片化、形式化。另一方面,跨部門、跨行業(yè)的協(xié)同機(jī)制缺位,致使難以匯聚資源合力,引起重復(fù)建設(shè)與資源分散問題。此外,由于數(shù)據(jù)要素本身兼具商業(yè)價(jià)值與社會(huì)價(jià)值,權(quán)屬界定、利益分配等機(jī)制不明本身即對(duì)高質(zhì)量數(shù)據(jù)集建設(shè)造成制度性阻礙。

03
推進(jìn)高質(zhì)量數(shù)據(jù)集建設(shè)的實(shí)施路徑
首先,要盡快完善針對(duì)數(shù)據(jù)集質(zhì)量的評(píng)價(jià)體系。針對(duì)通識(shí)類、行業(yè)通用類、行業(yè)專用類數(shù)據(jù)集制定分級(jí)分類標(biāo)準(zhǔn)與質(zhì)量評(píng)估、認(rèn)證體系,確保數(shù)據(jù)集質(zhì)量能夠符合應(yīng)用場(chǎng)景的真實(shí)需求。特別是對(duì)于行業(yè)專用類數(shù)據(jù)集的質(zhì)量評(píng)估、認(rèn)證,需要緊密切合場(chǎng)景需求進(jìn)行專門設(shè)計(jì),避免簡(jiǎn)單追求所謂的完整性、一致性、正確性。此舉將為各個(gè)參與方提供清晰的指引,并確保數(shù)據(jù)集建設(shè)的合規(guī)性、安全性與可用性。其次,要堅(jiān)持場(chǎng)景驅(qū)動(dòng)與示范先行的策略。聚焦工業(yè)、農(nóng)業(yè)、醫(yī)療、金融等數(shù)據(jù)密集且有明確需求的重點(diǎn)行業(yè),基此開展試點(diǎn)示范工程。通過將該行業(yè)的高質(zhì)量數(shù)據(jù)集建設(shè)成果與具體業(yè)務(wù)產(chǎn)品緊密結(jié)合,以點(diǎn)帶面形成可復(fù)制、可推廣的成功模式。再者,要深化人工智能技術(shù)的應(yīng)用。逐步推進(jìn)數(shù)據(jù)清洗、標(biāo)注直至質(zhì)量評(píng)估實(shí)現(xiàn)全流程智能化,保障數(shù)據(jù)完整性、一致性、可用性的同時(shí),大幅提高效率、降低成本。面對(duì)冷門學(xué)科等“低資源”場(chǎng)景,則更應(yīng)當(dāng)發(fā)揮人工智能用于數(shù)據(jù)合成、數(shù)據(jù)增強(qiáng)方面的獨(dú)特優(yōu)勢(shì),補(bǔ)齊數(shù)據(jù)多樣性短板。最后,要大力建設(shè)開源與多方協(xié)同平臺(tái)。借助開源機(jī)制匯聚集體智慧、打破“數(shù)據(jù)孤島”,提升數(shù)據(jù)集的規(guī)模與質(zhì)量。
為進(jìn)一步確保我國(guó)高質(zhì)量數(shù)據(jù)集建設(shè)的有效推進(jìn),還須同步構(gòu)建三位一體的支撐體系。一是資源支持上,應(yīng)設(shè)立國(guó)家人工智能數(shù)據(jù)集專項(xiàng)基金。加大對(duì)于數(shù)據(jù)合成、隱私計(jì)算等關(guān)鍵共性技術(shù)的研發(fā)支持,建設(shè)國(guó)家級(jí)的數(shù)據(jù)技術(shù)“測(cè)試場(chǎng)”與中試基地,加速新興技術(shù)的驗(yàn)證、轉(zhuǎn)化與應(yīng)用推廣。二是能力建設(shè)上,應(yīng)高度重視跨學(xué)科人才的培養(yǎng)。尤其是注重吸納應(yīng)用場(chǎng)景的相關(guān)專家,為數(shù)據(jù)集價(jià)值評(píng)估和治理提供全面的視角。此外,還應(yīng)積極推動(dòng)國(guó)際交流。借鑒全球先進(jìn)經(jīng)驗(yàn),參與國(guó)際數(shù)據(jù)治理規(guī)則制定。三是保障措施上,應(yīng)建立明確的目標(biāo)分解與責(zé)任機(jī)制。其一,需要統(tǒng)籌協(xié)調(diào),避免重復(fù)建設(shè)與資源分散等問題。其二,需要通過常態(tài)化的效果評(píng)估與優(yōu)化機(jī)制確保高質(zhì)量數(shù)據(jù)集建設(shè)工作能夠持續(xù)、穩(wěn)定推進(jìn)。其三,需要加快數(shù)據(jù)權(quán)屬、數(shù)據(jù)合規(guī)等制度建設(shè)。明確相關(guān)主體的權(quán)利與義務(wù),保障數(shù)據(jù)能在穩(wěn)定、可預(yù)期的框架之內(nèi)得到高效的流通利用。

特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時(shí)并不代表贊成其觀點(diǎn)或證實(shí)其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請(qǐng)聯(lián)系我們刪除。

凡來(lái)源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。

智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有   ICP備案號(hào):滬ICP備17004559號(hào)-5