你是不是覺得AI現(xiàn)在越來越厲害了?新聞天天吹,什么大模型、智能體、通用人工智能,似乎隨時就要顛覆一切。但你有沒有想過:下一個10年,AI到底靠什么產(chǎn)生實(shí)際價(jià)值?醫(yī)療行業(yè)又會發(fā)生什么?我們是不是已經(jīng)到了一個“只會刷分?jǐn)?shù)、卷參數(shù)”的死胡同?
最近,OpenAI研究員姚順雨的一篇深夜blog在圈內(nèi)炸開了鍋。這不是普通的學(xué)術(shù)雞湯,而是一篇讓無數(shù)AI從業(yè)者“靈魂震顫”的真心話。我花時間通讀了全篇,現(xiàn)在給你提煉一版,醫(yī)生也能看懂——尤其適合關(guān)注醫(yī)療AI、醫(yī)療創(chuàng)新的你,絕對值得你花5分鐘認(rèn)真看完!
回顧過去10年AI發(fā)展史,從DeepBlue下棋、AlphaGo圍棋到現(xiàn)在的GPT-4,這些劃時代的突破,背后都是新算法+大算力。那時候,誰能在benchmark(測試榜單)上刷出高分,誰就是業(yè)界大佬。
醫(yī)療AI領(lǐng)域也類似:影像識別、輔助診斷、醫(yī)學(xué)NLP,幾乎都在拼“誰的準(zhǔn)確率更高,誰能在國際榜單上得第一”。然而,這些榜單背后的測試集和現(xiàn)實(shí)中的患者有多大差別?真正落地到臨床、改變診療流程的案例有多少?一大堆高分AI系統(tǒng),最終卡在醫(yī)院難以部署,或者對醫(yī)生、患者的真實(shí)幫助有限。
姚順雨說得很直白:“ImageNet那么牛的benchmark,引用量都沒頂級模型高。”醫(yī)療領(lǐng)域也一樣,論文里刷分?jǐn)?shù),臨床落地卻困難重重。
問題一:我們是在讓AI變得有用,還是只是刷分游戲?醫(yī)療AI到底幫了醫(yī)生和患者什么?
曾經(jīng)強(qiáng)化學(xué)習(xí)(RL)被稱為“煉丹術(shù)”,做出來的AI只能在某些游戲里超神,換個場景就拉胯。直到大語言模型(LLM)出現(xiàn),才有了“先預(yù)訓(xùn)練語言和常識,再用RL微調(diào)”的新范式。AI變得更通用,能解決更復(fù)雜的現(xiàn)實(shí)任務(wù)。
醫(yī)療AI正好面臨同樣的問題。影像識別模型能看CT、X光,NLP模型能“看懂”病歷,但能否真正“理解”疾病、治療、患者需求,做出類似醫(yī)生的綜合判斷?以前的模型只會機(jī)械分類,“黑箱”嚴(yán)重?,F(xiàn)在的大模型能整合大量醫(yī)學(xué)知識、教科書、指南、病例,把“推理”作為一種能力,跨越數(shù)據(jù)孤島。
姚順雨講了個有趣的點(diǎn):Reasoning(推理)本身就是一種行動。過去AI只能做“具體動作”,比如識別腫瘤、標(biāo)記病灶,但醫(yī)生診斷時,先要問診、思考、推理,再下結(jié)論。AI只有會“推理”,才能更像一個合格的醫(yī)療助手,幫助醫(yī)生制定個性化診療方案、輔助復(fù)雜決策,甚至參與科研創(chuàng)新。
諷刺的是:如今RL算法本身反倒變成最不重要的部分,數(shù)據(jù)、規(guī)模、先驗(yàn)知識才是王道!
姚順雨大膽預(yù)測:未來AI的主戰(zhàn)場不再是卷模型、卷參數(shù),而是卷“問題定義”和“評估體系”!
這對于醫(yī)療AI,絕對是最重要的啟示!
1. 算法范式已高度標(biāo)準(zhǔn)化,再怎么改進(jìn),提升都很有限。
? 醫(yī)學(xué)影像識別的AUC、F1-score,已經(jīng)高到接近醫(yī)生水平。再提升2%,現(xiàn)實(shí)臨床的價(jià)值很有限。
2. 就算新benchmark出來,巨型模型+大數(shù)據(jù)很快就“碾壓通關(guān)”,沒啥壁壘。
? 醫(yī)學(xué)問答榜單、病歷推理競賽,短期內(nèi)會被大模型“通關(guān)”,但這些場景距離真實(shí)臨床流程還差得遠(yuǎn)。
? 定義“真實(shí)世界任務(wù)”:AI不是用來刷榜,而是要能輔助醫(yī)生問診、幫助患者自我管理、支持醫(yī)院高效運(yùn)轉(zhuǎn)。
? 例如:能不能根據(jù)患者完整的病歷、檢查結(jié)果、實(shí)時數(shù)據(jù),輔助多學(xué)科醫(yī)生聯(lián)合決策?能不能提前預(yù)測病情惡化,主動干預(yù)?
? 重塑“評估體系”:不再只看準(zhǔn)確率,而要看“實(shí)際效用”。
? 比如:AI輔助診斷后,患者結(jié)局是否更好?醫(yī)療資源是否更優(yōu)化?醫(yī)生負(fù)擔(dān)是否減輕?患者體驗(yàn)是否提升?
? 以“產(chǎn)品經(jīng)理”思維創(chuàng)新:圍繞患者、醫(yī)生、醫(yī)院的真實(shí)痛點(diǎn),定義AI能解決的“有價(jià)值場景”,從研發(fā)到落地全流程評估。
姚順雨犀利指出:現(xiàn)在AI在各種考試、棋類比賽、學(xué)術(shù)榜單上早就無敵了,但普通人的生活其實(shí)沒啥變化——因?yàn)檫@些評估和現(xiàn)實(shí)世界脫節(jié)!醫(yī)療領(lǐng)域更是如此,刷分AI遠(yuǎn)遠(yuǎn)不能解決一線醫(yī)療難題。
大模型的下一個10年,不是比誰的模型大,而是誰能解決真正有價(jià)值的問題。
評估體系、任務(wù)定義,才是醫(yī)療AI創(chuàng)業(yè)和創(chuàng)新的“新高地”。比如:
? 能否把AI嵌入電子病歷,實(shí)現(xiàn)智能問答、風(fēng)險(xiǎn)提示、臨床路徑優(yōu)化?
? 能否實(shí)現(xiàn)“數(shù)字主治醫(yī)師”,真正陪伴慢病患者全程管理,給出個性化、可落地的健康建議?
? 能否打造醫(yī)療智能體,輔助醫(yī)生完成繁瑣事務(wù),讓他們更專注于高價(jià)值醫(yī)療決策?
? 能否讓AI參與新藥研發(fā)、基因組分析,加速醫(yī)學(xué)科學(xué)創(chuàng)新?
? 能否通過智能輔助診斷、質(zhì)控、病案管理,提升醫(yī)院整體運(yùn)營效率?
這才是真正的“下半場”戰(zhàn)場,也是醫(yī)療AI萬億級公司誕生的土壤。
AI下半場,別再卷模型了,卷價(jià)值,卷場景,卷用戶體驗(yàn),才有未來!尤其在醫(yī)療行業(yè),只有解決醫(yī)生和患者的真實(shí)問題,才是最大的紅利。
醫(yī)療AI,能給世界帶來什么實(shí)際改變?能不能真正提升患者體驗(yàn)、改善醫(yī)療結(jié)局、減輕醫(yī)生負(fù)擔(dān)?
別再迷信刷榜分?jǐn)?shù)和論文參數(shù)了,從真實(shí)場景和產(chǎn)品需求出發(fā),才是醫(yī)療AI的正確打開方式。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點(diǎn)或證實(shí)其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。
智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有 ICP備案號:滬ICP備17004559號-5