自2025年春節(jié)以來,DeepSeek已經(jīng)在超過100家醫(yī)院落地,大模型技術(shù)在提升醫(yī)療質(zhì)量和效率方面發(fā)揮了關(guān)鍵作用。然而,目前大多數(shù)醫(yī)院對(duì)大模型仍存在疑惑,對(duì)其不同算力版本、智能體應(yīng)用、硬件支持等缺乏足夠的了解。為此,CDSreport圍繞醫(yī)療場(chǎng)景下的大模型部署、應(yīng)用等話題,開展系列分析報(bào)道。此前已經(jīng)探討過不同版本DeepSeek與應(yīng)用場(chǎng)景等話題,本期CDSreport將圍繞大模型本地化部署的硬件部署等問題進(jìn)行深入剖析。
7B、14B、32B、671B這些數(shù)字代表了大型語(yǔ)言模型(LLM)中參數(shù)的數(shù)量,也可以被認(rèn)為是模型在訓(xùn)練過程中學(xué)習(xí)到的“權(quán)重”,它們存儲(chǔ)了模型對(duì)語(yǔ)言、知識(shí)和模式的理解。一般來說,模型參數(shù)越多,模型就越復(fù)雜,理論上可以學(xué)習(xí)和存儲(chǔ)更豐富的信息,從而捕捉更復(fù)雜的語(yǔ)言模式,在理解和生成文本方面表現(xiàn)更強(qiáng)大。例如,671B甚至更大參數(shù)的模型能夠處理更復(fù)雜的任務(wù),生成更連貫、更細(xì)致入微的文本,在知識(shí)問答、創(chuàng)意寫作方面表現(xiàn)更出色。其強(qiáng)大的能力能夠支持疑難病癥的診斷、多學(xué)科協(xié)作診療、多模態(tài)數(shù)據(jù)處理,甚至大型科研項(xiàng)目或超大規(guī)模的技術(shù)研究等場(chǎng)景。7B、14B等參數(shù)量較小的模型盡管在推理能力上稍差,但其資源消耗更少,運(yùn)行速度更快,更適合問診、病歷分析、治療方案推薦等特定場(chǎng)景的應(yīng)用。參數(shù)的大小不同也意味著模型需要不同的計(jì)算資源(GPU算力)、內(nèi)存(顯存VRAM和系統(tǒng)內(nèi)存RAM)以及數(shù)據(jù)來進(jìn)行訓(xùn)練和運(yùn)行。一般來說,參數(shù)規(guī)模越大,對(duì)硬件的計(jì)算能力、內(nèi)存、存儲(chǔ)等要求越高。以DeepSeek為例,其1.5B蒸餾版模型使用一臺(tái)8GB顯存、16GB內(nèi)存的個(gè)人電腦即可使用,而70B則需要160+GB顯存、128+GB的工作站。 DeepSeek系列模型硬件需求對(duì)比。來源:CSDN不同參數(shù)的模型需要對(duì)應(yīng)部署相應(yīng)算力才能滿足日常診療工作需要,真正用于提升診療質(zhì)量和效率。如果醫(yī)院已經(jīng)部署相應(yīng)服務(wù)器,則需要根據(jù)算力配置選擇能夠支持的模型參數(shù),進(jìn)而完成訓(xùn)練、微調(diào)和應(yīng)用等工作。結(jié)合應(yīng)用場(chǎng)景:不同部署策略體現(xiàn)智慧化建設(shè)布局根據(jù)各家醫(yī)院已經(jīng)公布的完成DeepSeek本地化部署和應(yīng)用的信息,目前大模型在醫(yī)院中的應(yīng)用大多圍繞決策支持、病歷生成、知識(shí)檢索等。不同場(chǎng)景的應(yīng)用決定了計(jì)算量和同時(shí)使用人數(shù)的不同,這也是醫(yī)院部署硬件時(shí)需要著重考慮的重要參考指標(biāo)。例如,在分析患者病情時(shí),大模型需要調(diào)用患者病歷信息,并根據(jù)訓(xùn)練和優(yōu)化過程調(diào)用數(shù)據(jù)庫(kù)相關(guān)醫(yī)學(xué)知識(shí),同時(shí)思考分析步驟并推理分析結(jié)果。該過程的結(jié)果更加依靠訓(xùn)練數(shù)據(jù)和知識(shí)庫(kù),對(duì)于模型推理能力和計(jì)算量需求不算太高,應(yīng)用14B或32B即可滿足推理需要。如果是面向患者的分診、預(yù)問診等功能,可能存在同時(shí)使用人數(shù)較多的情況,則需要硬件設(shè)備具備高“并發(fā)路數(shù)”的能力。CDSreport發(fā)現(xiàn),目前醫(yī)院部署算力硬件設(shè)施的策略各不相同。有的醫(yī)院部署了32B、14B等體量相對(duì)較小的模型,應(yīng)用場(chǎng)景聚焦在診療工作或管理工作中的某一個(gè)單一領(lǐng)域,更關(guān)注實(shí)用性和性價(jià)比;有的醫(yī)院部署了滿血版DeepSeek和高算力硬件設(shè)施,盡管初步實(shí)現(xiàn)的功能也僅限于某一類場(chǎng)景,但為未來智能體部署和功能拓展保留了空間,具備更高的可拓展性;有的醫(yī)院采用“大模型+小模型”部署策略,針對(duì)算力需要不同部署相適應(yīng)的硬件設(shè)施,具備更好的靈活性和穩(wěn)定性。綜合來看,醫(yī)院采用的硬件設(shè)施部署策略來源于對(duì)應(yīng)用場(chǎng)景的規(guī)劃,而不同的側(cè)重點(diǎn)則體現(xiàn)了醫(yī)院對(duì)于智慧醫(yī)院建設(shè)的整體布局。結(jié)合預(yù)算成本:用技術(shù)實(shí)現(xiàn)“花小錢辦大事”為滿足不同參數(shù)模型對(duì)于算力的需求,硬件設(shè)施的部署也存在較大的差異。例如,7B模型僅使用配置較高的個(gè)人電腦即可運(yùn)行,預(yù)算成本僅需1-2w元;而671B的滿血版DeepSeek則需要進(jìn)行服務(wù)器集群式建設(shè),成本動(dòng)輒在7位數(shù)。醫(yī)院常常因此在效果與成本之間糾結(jié),一方面礙于有限的預(yù)算成本,另一方面擔(dān)心小參數(shù)模型無(wú)法滿足使用。此前,CDSreport分享過模型參數(shù)與應(yīng)用場(chǎng)景的關(guān)系,發(fā)現(xiàn)模型參數(shù)并非“越高越好”,只有最適合應(yīng)用場(chǎng)景、進(jìn)行有針對(duì)性的優(yōu)化和微調(diào)的模型才能發(fā)揮最好的效果,實(shí)現(xiàn)“花小錢辦大事”。例如,將大模型應(yīng)用于病歷質(zhì)量控制工作,不僅需要大模型能夠獲取并理解病歷前后文本,還能準(zhǔn)確指出病歷中存在的問題。該過程不僅對(duì)大模型推理能力有較高的要求,還要能夠深入臨床場(chǎng)景和質(zhì)控體系,并建設(shè)相應(yīng)的知識(shí)庫(kù)和規(guī)則庫(kù),發(fā)揮事中質(zhì)控和多級(jí)質(zhì)控等作用。而利用臨床決策支持系統(tǒng)(CDSS),大模型不僅解決了病歷信息不完整的問題,保障了病歷信息的完整性,還能夠通過與醫(yī)生的交互,在診療過程和病歷書寫過程中輔助醫(yī)生、質(zhì)控人員和管理人員及時(shí)發(fā)現(xiàn)并修正病歷缺陷,落實(shí)多級(jí)質(zhì)控體系。在模型的優(yōu)化方面,如何用更低參數(shù)的模型實(shí)現(xiàn)更高的推理效果是各家醫(yī)院和醫(yī)療AI廠商共同追求的目標(biāo),越來越多的成功案例正逐步顯現(xiàn)效果。以惠每醫(yī)療大模型Copilot為例,經(jīng)過研發(fā)團(tuán)隊(duì)在DeepSeek-R1 32B模型上的訓(xùn)練和優(yōu)化,其病歷質(zhì)控智能體的準(zhǔn)確性已經(jīng)達(dá)到了滿血版DeepSeek的水平,但部署成本僅為1/5,為醫(yī)院的大模型本地化部署提供了更多選擇。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時(shí)并不代表贊成其觀點(diǎn)或證實(shí)其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請(qǐng)聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。