醫(yī)生與AI大模型的協(xié)同診療,正從技術(shù)概念走向臨床現(xiàn)實。普林斯頓大學(xué)團隊基于強化學(xué)習(xí)開發(fā)的ICU決策優(yōu)化模型,結(jié)合近期DeepSeek-R1、GPT-5等大模型在診斷環(huán)節(jié)的突破性表現(xiàn),共同勾勒出“人機協(xié)同”的新范式——人類醫(yī)生的全局經(jīng)驗與AI的高維計算能力互補,形成“1+1>2”的臨床決策升級。以下從核心技術(shù)、應(yīng)用場景及未來挑戰(zhàn)三方面展開分析!
在高風(fēng)險的醫(yī)療診斷領(lǐng)域,單純依賴大型語言模型(LLMs)或人類醫(yī)生都存在局限——LLMs 會幻覺、缺乏常識且有偏見;人類則受經(jīng)驗局限與知識覆蓋面的限制。本研究提出一種混合集體智能(Hybrid Collective Intelligence, HCI)方法,將醫(yī)生的臨床推理與 LLM 的信息處理能力結(jié)合,對 2,133 個真實感病例(含 40,762 份醫(yī)生診斷與 5 個最先進(jìn) LLM 的診斷輸出)進(jìn)行加權(quán)融合。結(jié)果顯示,混合集體在所有專業(yè)與經(jīng)驗層級下的診斷準(zhǔn)確率均顯著優(yōu)于人類單獨、AI 單獨及各自的集體形式。
每年美國約 79.5 萬例死亡或永久傷殘與診斷錯誤相關(guān)。盡管 LLM 在自然語言處理與多領(lǐng)域問答中表現(xiàn)出色,包括醫(yī)學(xué)在內(nèi)的眾多場景,但它們的結(jié)構(gòu)性缺陷(如幻覺、偏見、缺乏常識讓其在臨床高風(fēng)險應(yīng)用中存在安全隱患。
研究表明,“集體智能”能通過不同專家獨立判斷的組合提升整體準(zhǔn)確性。本研究創(chuàng)新地將人類專家與多個 LLM 視為“同臺評審”,利用各自優(yōu)勢與互補性,構(gòu)建混合集體智能體系。
Human Diagnosis Project (Human Dx)
標(biāo)準(zhǔn)化處理
加權(quán)多數(shù)投票
交叉驗證
將多個 LLM 輸出組合成 AI 集體,在 Top-5 與 Top-3 準(zhǔn)確率上均優(yōu)于任何單一 LLM,并在多個??浦斜3址€(wěn)定領(lǐng)先。
開放性答案的自動標(biāo)準(zhǔn)化
權(quán)重化人機投票機制
跨模態(tài)可遷移性
臨床實地驗證
治療影響評估
偏見與公平性
Prompt 工程優(yōu)化
多模態(tài)融合
決策支持系統(tǒng)化
結(jié)論
混合集體智能不是要取代醫(yī)生,而是利用人類的臨床洞察與 AI 的信息整合能力互補,讓醫(yī)療診斷更精準(zhǔn)、更安全、更公平。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點或證實其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。
智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有 ICP備案號:滬ICP備17004559號-5