當(dāng)前,如何把DS用好成為一個(gè)關(guān)注點(diǎn),結(jié)合近期使用DS經(jīng)驗(yàn),個(gè)人認(rèn)為,基于AI檢索的知識(shí)庫是一個(gè)不錯(cuò)的嘗試。
首先簡(jiǎn)單定義一下知識(shí)庫:知識(shí)庫通常指的是經(jīng)過組織、系統(tǒng)化存儲(chǔ)的知識(shí)集合,能夠被方便地檢索、查詢和更新。它不僅僅是數(shù)據(jù)的簡(jiǎn)單堆積,而是有結(jié)構(gòu)、有分類,可能還包含元數(shù)據(jù)、索引等,方便用戶高效獲取信息。
前不久,我與醫(yī)院科室進(jìn)行了“AI檢索+知識(shí)庫”的內(nèi)部分享。在分享時(shí),我并沒有使用上面這個(gè)略顯生澀的概念去解釋知識(shí)庫,而是用一個(gè)相對(duì)輕松的問題,幫助大家厘清知識(shí)庫的概念:書架上的一堆書,算不算知識(shí)庫?或者電腦里的一個(gè)文件夾,存著跟你業(yè)務(wù)相關(guān)的教材、文檔、論文,算不算知識(shí)庫?
大家可以思考一下,以下是我給出的答案。
基于AI檢索的知識(shí)庫在醫(yī)院的落地和應(yīng)用,是一個(gè)不錯(cuò)的嘗試。理由是,知識(shí)庫在醫(yī)院的應(yīng)用自帶兩個(gè)優(yōu)勢(shì):一是廣泛的用戶基礎(chǔ),二是良好的內(nèi)部環(huán)境。
廣泛的用戶基礎(chǔ):信息科工程師和醫(yī)生兩個(gè)主力群體,出于對(duì)其職業(yè)特性、工作場(chǎng)景和專業(yè)需求的要求,對(duì)筆記類軟件使用需求高,意愿強(qiáng);盡管筆記類軟件并非專業(yè)知識(shí)庫,但其通過結(jié)構(gòu)化存儲(chǔ)、智能檢索、協(xié)同能力等設(shè)計(jì),已經(jīng)具備了輕量級(jí)知識(shí)庫的特性。在使用筆記本類軟件的過程中,通過功能設(shè)計(jì)和交互引導(dǎo),用戶也可以逐漸領(lǐng)會(huì)知識(shí)庫的核心要義,認(rèn)同知識(shí)庫的理念,培養(yǎng)初步的使用習(xí)慣。
良好的內(nèi)部環(huán)境:這個(gè)“內(nèi)”,指的是醫(yī)院的辦公環(huán)境大多基于封閉的內(nèi)網(wǎng),良好的環(huán)境是指,無論醫(yī)院大小和級(jí)別,都會(huì)將文獻(xiàn)數(shù)據(jù)庫作為知識(shí)基礎(chǔ)設(shè)施去建設(shè)實(shí)施。正是基于這樣的前提,確保了醫(yī)生在工作時(shí)段,被“困”于內(nèi)網(wǎng)時(shí),有一個(gè)相對(duì)專業(yè)、穩(wěn)定的文獻(xiàn)檢索工具,一個(gè)用來對(duì)沖碎片化時(shí)間的專業(yè)學(xué)習(xí)平臺(tái)。
盡管有上述兩個(gè)優(yōu)勢(shì),但筆記類軟件和內(nèi)網(wǎng)文獻(xiàn)庫并沒有發(fā)揮其完全能力,至少與用戶的期盼值有所差距。簡(jiǎn)單說就是,存進(jìn)去容易,查找和整理麻煩,所以知識(shí)庫的價(jià)值沒有得到充分發(fā)揮,事倍功半。
以我為例,出于內(nèi)容創(chuàng)作和學(xué)術(shù)科研需求,用了很多年筆記類軟件,不僅開了會(huì)員,還搭配了微信轉(zhuǎn)存,網(wǎng)頁剪藏,甚至手表端的語音隨記等功能,各種手段都上了,有空時(shí)自己還會(huì)整理和標(biāo)注筆記,不可謂不用心;但盡管如此,我也只是勉強(qiáng)完成了“信息聚合”的上半場(chǎng)工作,從“信息聚合”向“知識(shí)賦能”的下半場(chǎng)工作,一直做得不好。
文獻(xiàn)檢索也是如此,看單篇文獻(xiàn)容易,但是很多場(chǎng)景要求用戶快速切入某一新領(lǐng)域,這時(shí)就需要從一堆文獻(xiàn)、教材、指南中尋找看似孤立的線索,把它們拼接起來;類似于刑偵劇中,辦案人員往往需要從案件卷宗、監(jiān)控錄像、物證檔案以及證人證詞中,抽絲剝繭地梳理出完整的證據(jù)鏈。這其中難度有多大,大家都知道。因此,知識(shí)庫的“吃灰”現(xiàn)象,不能說是用戶懶或者不用心,真的是挖掘知識(shí)價(jià)值這件事,太花時(shí)間和心思,超出了個(gè)體用戶能力范圍。
轉(zhuǎn)機(jī)來源于DS出現(xiàn)后,在使用Cherry studio(一款開源的跨平臺(tái)大模型桌面客戶端)過程中,我驚喜的發(fā)現(xiàn)它自帶知識(shí)庫功能。當(dāng)時(shí),我正在了解某個(gè)新的學(xué)術(shù)研究方向,我一下想到了之前下載的一堆文獻(xiàn)和教材,剛好拿來一試,可惜經(jīng)過測(cè)試,當(dāng)時(shí)Cherry studio 內(nèi)置的 OCR 引擎對(duì)復(fù)雜布局的PDF支持不太好,但我相信這種AI搜索+知識(shí)庫的理念是正確的,足以解決我之前在使用筆記類軟件時(shí),投入一腔熱血去收集了一堆資料,結(jié)果價(jià)值產(chǎn)出只有零星半點(diǎn)的尷尬局面。
最終,在試用了多款不同類型的知識(shí)庫,我梳理了一個(gè)合格的“AI搜索+知識(shí)庫”該有的樣子:
第一步是找得到:即知識(shí)庫的創(chuàng)建。首先通過恰當(dāng)?shù)奶崾驹~,從公開網(wǎng)絡(luò)中提問檢索,找到用戶感興趣的文獻(xiàn),以及相應(yīng)的文獻(xiàn)來源,并且支持一鍵添加到相應(yīng)的知識(shí)庫。
第二步是喂資料:即知識(shí)庫的更新。可以通過多種方式,將用戶專屬的知識(shí)添加到知識(shí)庫,包括網(wǎng)頁、公眾號(hào)文章、教材、論文、任務(wù)書、截圖等等)
第三步是刨根問底:即圍繞知識(shí)庫進(jìn)行提問。圍繞用戶預(yù)先構(gòu)建的知識(shí)庫展開提問、追問和內(nèi)容解釋,不僅可以提升答案的專業(yè)性和準(zhǔn)確度,還能有效避免大模型因?yàn)楣_網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練引起的幻覺問題。更重要的是,一個(gè)合格的“AI檢索+知識(shí)庫”,要能做到將解釋的結(jié)果,以及提問、追問和回答的對(duì)話記錄,也加入知識(shí)庫,正所謂:真理越辯越明,知識(shí)庫越問越清楚。
第四步是分享和協(xié)作。這項(xiàng)功能做好以后,知識(shí)庫就可以從個(gè)人層面拓展到團(tuán)隊(duì)和科室層面,對(duì)于一個(gè)科室的業(yè)務(wù)能力傳承和積累有很大幫助。有了知識(shí)庫的幫助,以后科室和團(tuán)隊(duì)來了新人,就不用指定專人去以老帶新,而是直接用知識(shí)庫輔助新人快速了解該科室/團(tuán)隊(duì)的業(yè)務(wù)范疇、政策依據(jù)、研究?jī)?nèi)容等內(nèi)容。
醫(yī)院良好的信息化基礎(chǔ)結(jié)合醫(yī)療行業(yè)知識(shí)密集型的特點(diǎn),讓知識(shí)庫的本地化部署,不僅限于文獻(xiàn)檢索,可做的事還有很多:比如??朴盟幹改辖Y(jié)合醫(yī)院自研標(biāo)準(zhǔn)操作流程(SOP),搭配知識(shí)庫,可以形成專屬知識(shí)體系;再比如:內(nèi)網(wǎng)文獻(xiàn)庫可作為臨床決策支持系統(tǒng)的數(shù)據(jù)源,通過自然語言處理實(shí)現(xiàn)“癥狀-文獻(xiàn)-診斷”智能推薦,這些都是不錯(cuò)的想法。
關(guān)于知識(shí)庫本地部署的技術(shù)分享,可以參考《解放軍總醫(yī)院DeepSeek部署實(shí)踐經(jīng)驗(yàn)分享》這篇文章,另外,目前公網(wǎng)上有幾家做得不錯(cuò)的“AI檢索+知識(shí)庫”,建議大家可以先體驗(yàn)一下:例如截圖中用到的秘塔AI搜索以及騰訊的IMA知識(shí)庫等等。體驗(yàn)的目的是為了盡可能把好用的“AI檢索+知識(shí)庫”理念從外網(wǎng)帶到內(nèi)網(wǎng),增強(qiáng)內(nèi)網(wǎng)用戶體驗(yàn),讓內(nèi)網(wǎng)的AI應(yīng)用更好地落地生根。
相關(guān)鏈接:
知識(shí)庫 https://docs.cherry-ai.com/knowledge-base/knowledge-base
李楠,CHIMA委員,醫(yī)院信息化工作者,醫(yī)學(xué)統(tǒng)計(jì)學(xué)博士在讀。作者觀點(diǎn)僅代表個(gè)人,純屬技術(shù)交流,與供職單位無關(guān)。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時(shí)并不代表贊成其觀點(diǎn)或證實(shí)其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請(qǐng)聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。
智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有 ICP備案號(hào):滬ICP備17004559號(hào)-5