自2025年春節(jié)以來,DeepSeek已經(jīng)在超過100家醫(yī)院落地,大模型技術(shù)在提升醫(yī)療質(zhì)量和效率方面發(fā)揮了關(guān)鍵作用。然而,目前大多數(shù)醫(yī)院對大模型仍存在疑惑,對其不同算力版本、智能體應(yīng)用、硬件支持等缺乏足夠的了解。為此,CDSreport圍繞醫(yī)療場景下的大模型部署、應(yīng)用等話題,開展系列分析報道。此前已經(jīng)探討過不同版本DeepSeek與應(yīng)用場景等話題,本期CDSreport將圍繞大模型本地化部署的硬件部署等問題進行深入剖析。
7B、14B、32B、671B這些數(shù)字代表了大型語言模型(LLM)中參數(shù)的數(shù)量,也可以被認(rèn)為是模型在訓(xùn)練過程中學(xué)習(xí)到的“權(quán)重”,它們存儲了模型對語言、知識和模式的理解。一般來說,模型參數(shù)越多,模型就越復(fù)雜,理論上可以學(xué)習(xí)和存儲更豐富的信息,從而捕捉更復(fù)雜的語言模式,在理解和生成文本方面表現(xiàn)更強大。例如,671B甚至更大參數(shù)的模型能夠處理更復(fù)雜的任務(wù),生成更連貫、更細致入微的文本,在知識問答、創(chuàng)意寫作方面表現(xiàn)更出色。其強大的能力能夠支持疑難病癥的診斷、多學(xué)科協(xié)作診療、多模態(tài)數(shù)據(jù)處理,甚至大型科研項目或超大規(guī)模的技術(shù)研究等場景。7B、14B等參數(shù)量較小的模型盡管在推理能力上稍差,但其資源消耗更少,運行速度更快,更適合問診、病歷分析、治療方案推薦等特定場景的應(yīng)用。參數(shù)的大小不同也意味著模型需要不同的計算資源(GPU算力)、內(nèi)存(顯存VRAM和系統(tǒng)內(nèi)存RAM)以及數(shù)據(jù)來進行訓(xùn)練和運行。一般來說,參數(shù)規(guī)模越大,對硬件的計算能力、內(nèi)存、存儲等要求越高。以DeepSeek為例,其1.5B蒸餾版模型使用一臺8GB顯存、16GB內(nèi)存的個人電腦即可使用,而70B則需要160+GB顯存、128+GB的工作站。 DeepSeek系列模型硬件需求對比。來源:CSDN不同參數(shù)的模型需要對應(yīng)部署相應(yīng)算力才能滿足日常診療工作需要,真正用于提升診療質(zhì)量和效率。如果醫(yī)院已經(jīng)部署相應(yīng)服務(wù)器,則需要根據(jù)算力配置選擇能夠支持的模型參數(shù),進而完成訓(xùn)練、微調(diào)和應(yīng)用等工作。不同部署策略體現(xiàn)智慧化建設(shè)布局根據(jù)各家醫(yī)院已經(jīng)公布的完成DeepSeek本地化部署和應(yīng)用的信息,目前大模型在醫(yī)院中的應(yīng)用大多圍繞決策支持、病歷生成、知識檢索等。不同場景的應(yīng)用決定了計算量和同時使用人數(shù)的不同,這也是醫(yī)院部署硬件時需要著重考慮的重要參考指標(biāo)。例如,在分析患者病情時,大模型需要調(diào)用患者病歷信息,并根據(jù)訓(xùn)練和優(yōu)化過程調(diào)用數(shù)據(jù)庫相關(guān)醫(yī)學(xué)知識,同時思考分析步驟并推理分析結(jié)果。該過程的結(jié)果更加依靠訓(xùn)練數(shù)據(jù)和知識庫,對于模型推理能力和計算量需求不算太高,應(yīng)用14B或32B即可滿足推理需要。如果是面向患者的分診、預(yù)問診等功能,可能存在同時使用人數(shù)較多的情況,則需要硬件設(shè)備具備高“并發(fā)路數(shù)”的能力。CDSreport發(fā)現(xiàn),目前醫(yī)院部署算力硬件設(shè)施的策略各不相同。有的醫(yī)院部署了32B、14B等體量相對較小的模型,應(yīng)用場景聚焦在診療工作或管理工作中的某一個單一領(lǐng)域,更關(guān)注實用性和性價比;有的醫(yī)院部署了滿血版DeepSeek和高算力硬件設(shè)施,盡管初步實現(xiàn)的功能也僅限于某一類場景,但為未來智能體部署和功能拓展保留了空間,具備更高的可拓展性;有的醫(yī)院采用“大模型+小模型”部署策略,針對算力需要不同部署相適應(yīng)的硬件設(shè)施,具備更好的靈活性和穩(wěn)定性。綜合來看,醫(yī)院采用的硬件設(shè)施部署策略來源于對應(yīng)用場景的規(guī)劃,而不同的側(cè)重點則體現(xiàn)了醫(yī)院對于智慧醫(yī)院建設(shè)的整體布局。結(jié)合預(yù)算成本:用技術(shù)實現(xiàn)“花小錢辦大事”為滿足不同參數(shù)模型對于算力的需求,硬件設(shè)施的部署也存在較大的差異。例如,7B模型僅使用配置較高的個人電腦即可運行,預(yù)算成本僅需1-2w元;而671B的滿血版DeepSeek則需要進行服務(wù)器集群式建設(shè),成本動輒在7位數(shù)。醫(yī)院常常因此在效果與成本之間糾結(jié),一方面礙于有限的預(yù)算成本,另一方面擔(dān)心小參數(shù)模型無法滿足使用。此前,CDSreport分享過模型參數(shù)與應(yīng)用場景的關(guān)系,發(fā)現(xiàn)模型參數(shù)并非“越高越好”,只有最適合應(yīng)用場景、進行有針對性的優(yōu)化和微調(diào)的模型才能發(fā)揮最好的效果,實現(xiàn)“花小錢辦大事”。例如,將大模型應(yīng)用于病歷質(zhì)量控制工作,不僅需要大模型能夠獲取并理解病歷前后文本,還能準(zhǔn)確指出病歷中存在的問題。該過程不僅對大模型推理能力有較高的要求,還要能夠深入臨床場景和質(zhì)控體系,并建設(shè)相應(yīng)的知識庫和規(guī)則庫,發(fā)揮事中質(zhì)控和多級質(zhì)控等作用。而利用臨床決策支持系統(tǒng)(CDSS),大模型不僅解決了病歷信息不完整的問題,保障了病歷信息的完整性,還能夠通過與醫(yī)生的交互,在診療過程和病歷書寫過程中輔助醫(yī)生、質(zhì)控人員和管理人員及時發(fā)現(xiàn)并修正病歷缺陷,落實多級質(zhì)控體系。在模型的優(yōu)化方面,如何用更低參數(shù)的模型實現(xiàn)更高的推理效果是各家醫(yī)院和醫(yī)療AI廠商共同追求的目標(biāo),越來越多的成功案例正逐步顯現(xiàn)效果。以惠每醫(yī)療大模型Copilot為例,經(jīng)過研發(fā)團隊在DeepSeek-R1 32B模型上的訓(xùn)練和優(yōu)化,其病歷質(zhì)控智能體的準(zhǔn)確性已經(jīng)達到了滿血版DeepSeek的水平,但部署成本僅為1/5,為醫(yī)院的大模型本地化部署提供了更多選擇。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點或證實其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。