久久最新最好视频|精品福利视频在线|狠狠狠干在线播放|色尼玛亚洲综合网|日韩加勒比无码AV|亚洲AV人人澡人人爽人人爱|国产精品免费怡红院|婷婷一区二区XXX|日韩成人一区二区三|欧美熟妇另类AAAAAA

歡迎訪問智慧醫(yī)療網 | 網站首頁
 

大數(shù)據環(huán)境下,醫(yī)院如何建設科研專病數(shù)據庫?

發(fā)布時間:2022-08-25 來源:森億AI醫(yī)療 瀏覽量: 字號:【加大】【減小】 手機上觀看

打開手機掃描二維碼
即可在手機端查看

自 20 世紀 80 年代開始,我國將數(shù)據庫技術應用于臨床病例信息管理,科研專病數(shù)據庫應運而生??蒲袑2?shù)據庫是指集中管理某種單一疾病或某一研究主題病例信息的數(shù)據庫,它是臨床醫(yī)生收集整理數(shù)據和進行科學研究的重要工具。隨著醫(yī)院信息化的不斷深入和廣泛開展,醫(yī)院積累了大量以患者為中心的臨床診療數(shù)據,這些數(shù)據面向臨床業(yè)務,有大量非結構化的文本、影像數(shù)據和數(shù)據冗余,無法直接用于特定的科研工作,需要進行病例數(shù)據的收集整理和結構化。大數(shù)據環(huán)境下,利用這些數(shù)據為臨床科研服務是我們面臨的挑戰(zhàn)和未來發(fā)展的方向。


科研數(shù)據收集管理現(xiàn)狀及存在

的主要問題


建設科研專病數(shù)據庫的主要目的是幫助臨床醫(yī)生收集整理數(shù)據。2017 年底,我們對我院各臨床科室收集整理數(shù)據的情況進行了走訪調研。調研發(fā)現(xiàn),臨床科室收集整理數(shù)據主要采用電子表格、科研專病數(shù)據庫和多中心科研專題(專?。?shù)據庫三種方式。電子表格可為臨床醫(yī)生在臨床業(yè)務系統(tǒng)、臨床數(shù)據、科室未聯(lián)網的終端設備(如B超)、科室自行收集整理的數(shù)據、病案室保存的紙質或掃描件的病例資料中查找、摘錄、整理病例數(shù)據提供幫助。電子表格因操作簡單、熟悉度高而得到廣泛應用,但其容易出錯,在收集、整理的數(shù)據項較多時容易串行,且沒有質量檢驗和醫(yī)生常用的統(tǒng)計分析功能。為改變這一現(xiàn)狀,臨床科室和軟件開發(fā)商合作,開發(fā)科研專病數(shù)據庫系統(tǒng),通過可視化的病歷資料填寫人機交互界面,完成數(shù)據的錄入、修改、保存、瀏覽、檢索查詢、統(tǒng)計分析和批量導出。科研專病數(shù)據庫經過多年發(fā)展之后,其功能日益豐富,收集整理的病例主題也多種多樣,專業(yè)性和實用性得到了臨床醫(yī)生的認可,但由于各???、各病種的差異,科研專病數(shù)據庫的結構不同,收集整理的數(shù)據項也不一樣,科研專病數(shù)據庫在滿足科室多樣化的科研數(shù)據需求方面起到了一定的作用,但在克服了電子表格局限性的同時,依然存在以下主要問題 :


1) 科研專病數(shù)據庫系統(tǒng)沒有和醫(yī)院信息系統(tǒng) (hospital information system,HIS)、 實 驗 室 信 息 管 理 系 統(tǒng)(laboratory information management system,LIS)、醫(yī) 學 影 像 存 檔 與 通 訊 系 統(tǒng) (picture archiving and communication systems,PACS)、 放 射 信 息 管 理 系統(tǒng) (radioiogy information system,RIS)、 電 子 病 歷(electronic medical record,EMR) 等 臨 床 業(yè) 務 系 統(tǒng)或臨床數(shù)據庫 (clinical data repository,CDR) 集成,無法實現(xiàn)數(shù)據的批量導入和數(shù)據的同屏對照輔助填寫(無數(shù)據源),數(shù)據的收集整理主要依靠手工完成,存在著工作量大、效率低下等問題,不能支撐大型的科研項目。


2) 臨床醫(yī)生工作任務繁重,難以長期堅持和大范圍開展,部分科室委托第三方收集整理數(shù)據,存在著數(shù)據失泄密風險。


3) 整理后的科研數(shù)據分散存儲于各個課題負責人或臨床醫(yī)生手中,難以共享利用,造成重復收集和人力資源浪費。除此之外,針對多中心大型科研課題相互協(xié)作收集整理共享數(shù)據的需求,臨床科室通常采用單機版協(xié)作和網絡版協(xié)作兩種模式。單機版協(xié)作是為每個單位安裝單機版的數(shù)據庫系統(tǒng),對接各自醫(yī)院的 HIS 系統(tǒng),導入和整理自己的臨床資料,然后通過存儲設備導出上報,實現(xiàn)病例資料的交換和數(shù)據遷移。網絡版協(xié)作是協(xié)作單位在線注冊登錄后通過網頁表單,實現(xiàn)數(shù)據的導入整理和查詢導出,也可通過客戶端軟件(如QQ)、在線電子郵件系統(tǒng)及微信等,實現(xiàn)數(shù)據的填寫上報和共享利用。但多中心科研專題(專?。?shù)據庫同樣存在著數(shù)據手工整理上報效率低下等問題,不適應大數(shù)據環(huán)境下對海量醫(yī)療數(shù)據快速、高效、高質量地收集與整理的科研需求,嚴重阻礙了科研工作的有效開展。


科研專病數(shù)據庫平臺建設實踐


2016 年,我院成立了醫(yī)療大數(shù)據中心,針對科研數(shù)據收集整理中存在的主要問題,進行了數(shù)據集成整合、CRF 表單個性化設計與模板化管理、數(shù)據批量導入、自動化及同屏對照輔助填寫、數(shù)據安全防護等核心關鍵問題的研究,提出了面向全院各科室,建成高效、靈活、方便、安全、一體化的科研專病數(shù)據庫系統(tǒng)平臺的建設思路。


一體化的科研專病數(shù)據庫系統(tǒng)平臺

體系架構

     

我院一體化的科研專病數(shù)據庫系統(tǒng)平臺體系架構如圖 1 所示。其以 HIS、LIS、PACS 等臨床業(yè)務信息系統(tǒng)或集成整合后的臨床數(shù)據庫 CDR 為數(shù)據源,經抽取 - 轉換 -加載 (extract-transform-load,ETL)后 形 成 科 研 數(shù) 據 庫 (research data repository,RDR)。在 RDR 的基礎上,通過CRF 表單設計與制作工具、自然語言處理及數(shù)據的輔助填寫工具、數(shù)據的查詢檢索和患者病例數(shù)據的 360 視圖瀏覽工具的支持,通過胃癌等各病種可視化的 CRF 表單,完成科研病例的篩選和數(shù)據的收集整理填寫,完成胃癌等各專科各病種科研數(shù)據庫的建設和科研數(shù)據的統(tǒng)計分析及選擇性的批量導出,滿足回顧性研究和前瞻性研究對病例數(shù)據提取和快速準確地查詢、統(tǒng)計的科研需求。


微信圖片_20220825164331.jpg
圖 1 我院一體化的科研專病數(shù)據庫系統(tǒng)平臺體系架構


數(shù)據的集成整合 


開展臨床科研通常需要把HIS、LIS、PACS 等多個臨床業(yè)務系統(tǒng)中的數(shù)據進行集成整合。目前,以患者主索引為主線,我院已實現(xiàn)各臨床業(yè)務信息系統(tǒng)數(shù)據在醫(yī)院層面的互聯(lián)互通和集成整合,建成有臨床數(shù)據庫 CDR,部署在計算機室。為避免開展回顧性研究頻繁調用歷史數(shù)據對數(shù)據庫服務器、網絡帶寬和臨床業(yè)務的影響,我們采用 ETL 的方式,將 CDR 中的數(shù)據定時批量地抽取、轉換、標準化、歸一后加載至科研數(shù)據庫 RDR 中。對于前瞻性研究,與臨床業(yè)務系統(tǒng)建立實時的數(shù)據采集接口,每當有符合臨床研究的病例出現(xiàn)時,實時動態(tài)地采集病例數(shù)據,加載至科研數(shù)據庫 RDR 中。RDR 作為科研專病數(shù)據庫的數(shù)據源,部署在醫(yī)療大數(shù)據中心,以全面、標準、統(tǒng)一的格式整合病例數(shù)據并提供統(tǒng)一存儲。RDR 與面向臨床應用的 CDR 物理隔離,互不影響。


CRF 的個性化定制與模板化管理 


科研數(shù)據是對病例數(shù)據進行抽取和整理后的結構化特征數(shù)據,而病例報告表 CRF 正是收集整理科研數(shù)據的載體和工具。CRF 的設計與制作涉及內容與結構設計和界面制作。CRF 的內容與結構隨科研項目變化很大,每個科研課題收集整理的數(shù)據項不同,數(shù)據項的呈現(xiàn)結構不同,為此 CRF 的界面制作通常需要采用個性化、可視化、模塊化的配置方式,通過鼠標點選和拖拽文本標簽、文本框、多行文本、數(shù)字文本、單選、多選、下連列表、時間日期、面板、表格等基本控件,完成 CRF 的界面風格、頁面布局、屬性設置、數(shù)據校驗規(guī)則等相關內容與呈現(xiàn)方式即結構的設定(圖2)。


微信圖片_20220825164337.jpg

圖2 CRF可視化配置界面


設計制作好的 CRF 以文件形式保存,可隨時調用修改,以減少 CRF 設計制作的工作量。設計制作好的 CRF 也可保存為模板,以方便重復調用。模板采用“點”、“線”、“面”、“體”的建設思路?!包c”是一個個字段名和與之關聯(lián)的單個控件,如字段名姓名和與之對應的文本輸入框?!熬€”是與某個“點”有邏輯關系的另一個或幾個“點”,如“是否吸煙”如果選“是”的話,顯示“吸煙多長時間”、“每天吸煙幾根”等相關內容,這些內容關聯(lián)起來形成一個“線”?!懊妗笔前?CRF 表單中的數(shù)據項分類后,將多個連續(xù)的同類數(shù)據項組合為“面”,即一個數(shù)據單元或數(shù)據模塊,如患者基本信息、體格檢查、現(xiàn)病史、檢查結果、檢驗結果、手術記錄、醫(yī)囑用藥等數(shù)據模塊信息等均可作為一個個“面”?!绑w”是某個病種的 CRF 表單,如非小細胞肺癌CRF 表單、心衰 CRF 表單等。設計制作 CRF 表單可通過直接拖拽、組合基本控件的方式快速生成CRF 界面,也可調用已有的 CRF 文件或模板,通過增、刪、改的方式,變已有的 CRF 表單內容為我所用。此方式交互性強,操作簡便,制作高效,但較難應對復雜的數(shù)據結構和邏輯關系,此時可采用 Excel 表格或 XML 格式的配置文件上傳至系統(tǒng)后臺的方式,自動生成 CRF 錄入界面。該方式適應性好,但需依托醫(yī)療大數(shù)據中心的 IT 工程師才能完成,對于沒有數(shù)據庫和編程基礎的用戶有一定難度。以上兩種方式各有優(yōu)缺點,可針對具體情況靈活選擇。


病例篩選及數(shù)據的自動化

及同屏對照輔助填寫 


數(shù)據集成整合后,基于 RDR,可通過我院研發(fā)的多維度數(shù)據綜合搜索引擎,開展復雜條件、遞進式的病例數(shù)據查詢和科研病例篩選,可實現(xiàn)病例信息的全方位、多維度、統(tǒng)一視圖瀏覽,完成病例數(shù)據的全景展示。可通過數(shù)據接口和患者ID(IDentity 的縮寫,身份標識號碼),實現(xiàn)單個或批量入組病例數(shù)據的一鍵式導入,同步完成患者化驗報告等結構化客觀數(shù)據的自動關聯(lián)填寫和數(shù)據質量校驗,減少手工填寫數(shù)據至 CRF 表單的工作量,提高了數(shù)據收集整理的效率和質量。針對大量需要人工篩選、整理和結構化的檢查檢驗結果及文本數(shù)據,可以 RDR 中的數(shù)據為參照源,通過對數(shù)據項及與之相關的診療事件及時間節(jié)點的解析,以視圖方式將參考數(shù)據定位顯示在 CRF 輸入界面的右側,通過同屏對照和鼠標點選、雙擊或拷貝、粘貼的方式,將結構化的表格數(shù)據或非結構化的文本數(shù)據(如病例報告)篩選、填寫左側的 CRF 表單中,操作界面如圖3、圖 4 所示。


微信圖片_20220825164341.jpg

圖3 數(shù)據同屏顯示和結構化數(shù)據關聯(lián)對照填寫


微信圖片_20220825164345.jpg

圖4 數(shù)據同屏顯示和非結構化文本數(shù)據關聯(lián)對照填寫


針對患者有多次檢查、檢驗及治療記錄,但每個患者的次數(shù)可能都不相同的情況,支持用戶在填寫記錄 CRF 表單時動態(tài)添加記錄數(shù),支持填報數(shù)據項的動態(tài)擴展,如患者多個化療記錄的填寫。針對未能集成在 CDR 或 RDR 中的??菩畔⒑碗S訪數(shù)據,提供手動填寫和圖片、PDF、Word 及視音頻文件的附件上傳,在填寫 CRF 時可根據需要,選取附件作為參照,補齊缺失的數(shù)據項內容,確保病例資料的完整性和可靠性。針對電子病歷、檢查報告等需要后結構化的內容,可利用我院研發(fā)的醫(yī)學自然語言處理工具進行詞性標注、分詞、句子邊界識別、句法分析、語義識別、指標識別等進行結構化預處理,處理后的結果以結構化的形式保存,并可批量導入科研專病數(shù)據庫中。


統(tǒng)計分析和數(shù)據導出 


單病種科研專病數(shù)據庫建成后,基于 CRF 中的數(shù)據項,可采用單表單或多表單自由組合的方式進行病例數(shù)據的瀏覽。平臺還提供常規(guī)的統(tǒng)計分析功能,可根據選中的字段,選擇柱狀圖、餅狀圖、折線圖、表格等不同類型的統(tǒng)計圖表展示預覽。針對復雜的個性化統(tǒng)計分析需求,用戶可根據設置好的權限,將需要導出的病例數(shù)據單表或多表聯(lián)合導出為R、SPSS、Python 等其他統(tǒng)計分析軟件兼容的文件格式,方便臨床科研人員用專業(yè)的統(tǒng)計分析軟件做進一步的統(tǒng)計分析和科學研究。不同的課題研究小組也可利用先前其他課題組已整理完成的科研專病數(shù)據庫中的數(shù)據,經授權后導出,實現(xiàn)數(shù)據的共享和再利用,以減少重復收集、重復隨訪和人力資源浪費。


數(shù)據安全 


為確保數(shù)據安全,按專科病種和用戶角色進行用戶權限劃分和分級授權管理。參照國際通用的健康保險攜帶和責任(HIPAA)法案對病例數(shù)據進行脫敏,防止患者隱私數(shù)據泄露,若非特殊需要,對患者的ID、姓名、地址、電話等敏感信息進行轉換或做刪除處理。采用加密強度較高的算法,確保多中心科研協(xié)作通過互聯(lián)網存儲和傳輸時的數(shù)據安全。建立數(shù)據提取、導入、導出的申請和審批流程,加強日志管理,實現(xiàn)數(shù)據的統(tǒng)一管理和對數(shù)據操作的全流程管控。通常情況下,數(shù)據只能在醫(yī)療大數(shù)據中心進行各類操作,不能導出,以確保數(shù)據安全。


應用情況 


目前,依托我院一體化的科研專病數(shù)據庫系統(tǒng)平臺,已建成心衰、肺癌、胃癌、肝癌、老年共病、急診創(chuàng)傷等 10 多個科研專病數(shù)據庫。一體化的科研專病數(shù)據庫系統(tǒng)平臺的建設,縮短了科研專病數(shù)據庫的建庫時間,減少了收集、整理數(shù)據的工作量。以胃癌專病數(shù)據庫為例,過去通過編程方式實現(xiàn) CRF 表單的設計與制作,需要 1~3 個月的時間,現(xiàn)在通過可視化、交互式的 CRF 表單配置界面,3 d 即可完成。在錄入與整理數(shù)據方面,胃癌專病數(shù)據庫共涉及患者基本信息、手術記錄、病理報告等 13 個病例數(shù)據模塊,字段數(shù)多達 344個(表1)。


微信圖片_20220825164349.jpg

表1 胃癌專病數(shù)據庫字段填寫方法途徑


原先手工整理 1 份病例資料通常需要1 h 左右,現(xiàn)在通過一體化的科研專病數(shù)據庫系統(tǒng)平臺的批量導入功能,一次性導入 16 692例歷史數(shù)據共耗時 5 d 14 h 57 min 18 s,其中 165 個字段(占全部字段數(shù)的 48%)通過批量導入、自動計算、基于規(guī)則獲取數(shù)據等方式實現(xiàn)自動填寫,無需臨床醫(yī)生手工輸入。利用我院的醫(yī)學自然語言處理工具,處理涉及手術記錄和病理報告等非結構化的數(shù)據字段 56 個(占全部字段數(shù)的 16%),平均每秒處理病例數(shù) 12.9 個。剩余的 123 個字段中,79個字段通過同屏對照手工填寫的方式完成,44 個字段如隨訪數(shù)據等通過手工填寫補充,可在 20 min以內完成??蒲袑2?shù)據庫系統(tǒng)平臺為我院高質量、高效率地開展臨床研究提供了技術和平臺支撐,滿足了臨床科室多樣化的對科研數(shù)據的提取需求。


問題與改進方法


在科研專病數(shù)據庫系統(tǒng)平臺建設取得初步成效的同時,我們也清楚地看到了不足:


1) 大量不同時期電子病歷文件、檢查報告、病理報告等非結構化的內容需要做結構化處理,但針對醫(yī)學用語的自然語言處理工具還不夠完善,特別是對電子病歷的語義分析有待加強;


2) 現(xiàn)有的科研專病數(shù)據庫系統(tǒng)中缺乏隨訪數(shù)據,后續(xù)還需和我院正在研發(fā)的隨訪系統(tǒng)對接,補齊科研數(shù)據短板,實現(xiàn)隨訪數(shù)據的共享利用;


3) 數(shù)據庫的維護和應用還不理想,建庫容易維護難,課題結束后大部分的科研專病數(shù)據庫處于無人問津的狀態(tài),造成新的資源浪費,需建立長期的數(shù)據采集和維護管理及獎勵機制,鼓勵臨床醫(yī)生和科研專病數(shù)據庫研發(fā)建設的 IT 工程師,堅持不懈,通過持續(xù)不斷、日積月累的平臺功能完善和數(shù)據的補充更新,豐富科研專病數(shù)據庫的內容,彰顯和發(fā)揮醫(yī)療大數(shù)據的價值,為臨床科研服務。


智慧醫(yī)療網 ? 2022 版權所有   ICP備案號:滬ICP備17004559號-5