11月7日,北京市衛(wèi)生健康委發(fā)布《關(guān)于開展醫(yī)療領(lǐng)域人工智能應(yīng)用評測工作的通知》,正式向各企業(yè)、研究機構(gòu)提供評測服務(wù),這標志著北京的國家人工智能應(yīng)用中試基地(醫(yī)療領(lǐng)域)對外服務(wù)能力正持續(xù)拓展和深化。

隨著近年來人工智能技術(shù)的飛速進步,醫(yī)療AI正在加速向輔助醫(yī)生、承擔部分醫(yī)生技術(shù)勞動的方向發(fā)展。如何堅持科技為民、科技向善,確保醫(yī)療AI應(yīng)用的規(guī)范安全有效,成為公眾關(guān)注和行業(yè)關(guān)心的問題。衛(wèi)生健康部門作為守護人民生命健康的政府部門,承擔著保障醫(yī)療安全質(zhì)量、保護公眾生命健康安全的根本職責,對醫(yī)生的教育、培訓(xùn)、考核、準入和執(zhí)業(yè)履行著嚴格監(jiān)管職責。對于輔助醫(yī)生或承擔部分醫(yī)生技術(shù)勞動的醫(yī)療AI也應(yīng)該像醫(yī)生一樣開展科學嚴謹?shù)脑u測,規(guī)范其應(yīng)用,從而防范醫(yī)療風險、確保技術(shù)造福于民,保障人民生命健康安全。
醫(yī)療AI的評測是一項高度專業(yè)性的工作,必須依托深厚的醫(yī)學知識與臨床經(jīng)驗開展,需要頂尖醫(yī)療專家的深度參與,需要匯聚醫(yī)療行業(yè)領(lǐng)域內(nèi)最前沿的智慧,確保評測工作既科學嚴謹又切合臨床實際。為此,北京市衛(wèi)生健康委在國家基地建設(shè)中專門設(shè)立了醫(yī)療人工智能應(yīng)用評測中心(以下稱評測中心),旨在建立醫(yī)療AI評測的制度體系與規(guī)范標準,依托首都高水平醫(yī)院和專家隊伍、高質(zhì)量醫(yī)療數(shù)據(jù),驗證醫(yī)療AI的臨床輔助決策能力和效果,筑牢醫(yī)療人工智能應(yīng)用安全底線,同時助力醫(yī)療人工智能產(chǎn)品迭代優(yōu)化。
由于醫(yī)療行為關(guān)乎公眾生命健康,醫(yī)療AI的評測必須堅持高標準、嚴要求,至少具有三個方面的要求。
評測內(nèi)容的全面性 醫(yī)療人工智能應(yīng)用不僅要看“準確率”這一個指標,從患者角度來說,還需要考慮到倫理和信息安全,從醫(yī)生角度來說,除了一個準確的結(jié)果,醫(yī)生更關(guān)注他的推理過程,也就是“為什么得出這個結(jié)論”。所以醫(yī)療人工智能應(yīng)用要從“安全(合規(guī)倫理)、專業(yè)(醫(yī)學知識)、實用(流程適配)”等多個角度一起測。 評測數(shù)據(jù)的權(quán)威性 應(yīng)用在真實世界,特別是臨床診療場景下的人工智能產(chǎn)品,光靠掌握海量甚至全量的醫(yī)學教材、文獻資料等書本知識是遠遠不夠的,這就好比一個學得再好的醫(yī)學生,考試可以滿分,但是不經(jīng)過臨床鍛煉也無法成為醫(yī)生一樣。因此,醫(yī)療領(lǐng)域的人工智能應(yīng)用評測要用“真案例、真標準”去測,要用臨床上真實的、有明確診療方案的,甚至是一些罕見、疑難案例,還要參考國內(nèi)外最新的診療指南去評測,才能區(qū)分出人工智能應(yīng)用在嚴肅醫(yī)療場景下的真實差異。 評測結(jié)果的科學性 我們都知道,考試中如果只靠專家憑經(jīng)驗打分,可能會有主觀偏差;只靠選擇題的準確率或者得分點的計分,又會漏掉對思考過程的評價。因此,對醫(yī)療人工智能應(yīng)用的評測,不能只看答案,還要對它的思考和答題過程進行評價,防止“蒙”對了結(jié)果,邏輯卻錯了。 針對上述這幾個醫(yī)療領(lǐng)域人工智能應(yīng)用評測的重點難點問題,北京市衛(wèi)生健康委委托北京市衛(wèi)生健康大數(shù)據(jù)與政策研究中心,配合醫(yī)療領(lǐng)域國家人工智能應(yīng)用中試基地建設(shè),聯(lián)合全國重點醫(yī)院與頂尖專家團隊,拿出了破題方案,打造了北京醫(yī)療人工智能應(yīng)用評測中心。 首先,在評測內(nèi)容上,評測中心專門建了一套多維度考核標準,從百姓和醫(yī)生最關(guān)心的角度出發(fā),形成了6個核心維度(醫(yī)學合規(guī)倫理、醫(yī)學循證與知識、通用輔助能力、??圃\療質(zhì)控管理、診療流程適配性、診療決策準確性)的評測指標體系,包含70多項具體評測任務(wù),全面覆蓋了看“安全”,查有沒有泄露隱私、有沒有違背醫(yī)學倫理;看“專業(yè)”,測會不會用最新的醫(yī)學教材、診療指南;看“適用”,查是否符合醫(yī)生的思考邏輯和日常工作流程;看“準確”,看AI診斷對不對,給的治療建議合不合理。 其次,在評測數(shù)據(jù)上,評測中心聯(lián)合重點醫(yī)院、科研機構(gòu)及權(quán)威專家團隊,用臨床案例、國內(nèi)外權(quán)威醫(yī)學教材和最新臨床診療指南,共同構(gòu)建高質(zhì)量評測數(shù)據(jù)集。權(quán)威醫(yī)學教材確?;A(chǔ)知識扎實,臨床診療指南保證與臨床實踐同步,典型案例覆蓋常見病、罕見病及疑難病。“考題”由國內(nèi)頂級??聘吣曩Y醫(yī)師全程深度參與編撰與審核而成,確保評測的科學性和權(quán)威性。 最后,在評測方法上,評測中心嚴格實施用戶申請、系統(tǒng)評測、專家復(fù)核三個環(huán)節(jié),系統(tǒng)根據(jù)應(yīng)用類型自動匹配評測任務(wù)并生成評測報告,由臨床專家進行復(fù)核。在計分方式上,除采用國際通用基礎(chǔ)評測指標外,評測中心還創(chuàng)新引入了基于人工智能的評分機制,也就是用一個“裁判模型”來判卷,綜合“考生”的診療思路、推理邏輯、答題結(jié)果進行量化打分,避免只看最終結(jié)果的片面性。比如兩款人工智能應(yīng)用都診斷對了,評測系統(tǒng)會給推理邏輯更嚴謹、依據(jù)更充分的那款打更高分,確保評測結(jié)果客觀公正、科學可信。 《通知》中還提到,本次評測服務(wù)是醫(yī)療領(lǐng)域國家人工智能應(yīng)用中試基地首次提供對外評測服務(wù),主要聚焦胸外科診療領(lǐng)域開展專項評測。評測結(jié)果將根據(jù)參評單位意愿適時公布,評測表現(xiàn)優(yōu)秀的應(yīng)用將優(yōu)先納入國家人工智能應(yīng)用中試基地推廣渠道,向各級醫(yī)療機構(gòu)重點推薦。后續(xù),評測中心將陸續(xù)開展更多醫(yī)學領(lǐng)域的評測服務(wù),覆蓋內(nèi)科、外科、兒科等專業(yè)領(lǐng)域,助力醫(yī)療人工智能產(chǎn)業(yè)健康發(fā)展,更好地服務(wù)人民群眾健康需求。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點或證實其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。
Copyright ? 2022 上??评讜狗?wù)有限公司 旗下「智慧醫(yī)療網(wǎng)」版權(quán)所有 ICP備案號:滬ICP備17004559號-5