人工智慧技術如何助力病案智慧化編碼與DRG支付方式變革

動脈網VCBEAT發表於2019-03-28

隨著病案首頁在醫療付費、流程管控中的重要性增加,其編碼資料的準確性引起了越來越多的關注。從各類醫院的真實資料抽驗研究表明,病案首頁編碼資料的準確程度遠未達到監管部門的要求。

為了使各項統計工作、審批基線有據可依,院方應嚴把病案首頁質量關,狠抓全體醫護人員病案書寫質量,並加強醫師的職業素養和專業水平,同時使用技術手段輔助、審查並按資料的準確度與完整性,大力促進病案首頁書寫標準化、規範化,確保統計工作的高質量,實現醫學、統計、資訊、計算機應用四位一體。

同時,也應加強病案、技術部門相互間的溝通與協作,使得人工智慧等先進技術得以輔助日常的醫生工作流程,提高工作效率和工作質量。

人工智慧技術如何助力病案智慧化編碼與DRG支付方式變革

專欄作者:DRG資深專家、復旦大學公共管理博士後劉芷辰博士

個人履歷:復旦大學公共管理後流動站、國家衛計委統計資訊中心博士後工作站博士後。大健康領域資深戰略專家。近10年的網際網路醫療和大健康領域戰略諮詢經驗,曾在國內某上市IT解決方案與服務供應商擔任戰略諮詢和科研業務發展總監職務,主導策劃了面向大健康領域很多具有前瞻性的創新商業模式,曾前瞻性的預測了中國醫療支付尤其是DRG支付方式改革將成為中國十三五深化醫改的關鍵舉措。曾以整體專案牽頭負責人的角色,參與國內某地市級DRG醫保支付方式改革的試點專案。幫助該市醫保局構建了全市DRG支付體系改革的頂層方案設計,並落地資訊化系統的工具支撐。

前期回顧:

DRG專欄系列之一:綜述篇

DRG專欄系列之二:臨床資料篇

DRG專欄系列之三:成本資料篇

DRG專欄系列之四:DRG分組篇

DRG專欄系列之五:DRG定價篇

DRG專欄系列之六:DRG監管篇

一、電子病案智慧化編碼的發展現狀

計算機輔助編碼工具已經存在了多年,但是國內目前對智慧編碼概念的理解程度不一,對智慧實現的方式還停留在比較淺的層面上,現存疾病智慧編碼研究大多基於大夫給出的診斷,在診斷關鍵字基礎上做可能的提示,引導編碼人員一步步操作得出最終編碼(具體見圖1)。

另外一種是在病案管理系統中設定邏輯規則提示編碼(具體見圖2)。以上均不能從根本上解決疾病和編碼的統一,沒有體現編碼過程中所需閱讀病歷的過程,因此是一種偽智慧。

人工智慧技術如何助力病案智慧化編碼與DRG支付方式變革

圖1基於診斷和標準庫查詢編碼

人工智慧技術如何助力病案智慧化編碼與DRG支付方式變革

圖2在病案系統設定規則提示編碼

二、人工智慧技術應用於智慧編碼的原理

隨著計算能力的提升,基於深度學習人工智慧技術出現了井噴。人工智慧技術在很多的領域裡可以模仿人腦進行一定程度的邏輯及非邏輯判斷,最終可以實現類似於人類的決策判斷。

利用先進的人工智慧技術探索在病案首頁質量控制問題,尤其是編碼糾正、輔助上的應用具有了一定的可行性。具體可以實現的功能包括:智慧化ICD自動編碼對應;多診斷情況下自動判別主要診斷;智慧化編碼合併及合理費用優化。

病案首頁資料質控可以使用片面與全面方式分別實現。片面實現方式僅只利用病案首頁內的相關資料,利用相關分析方法進行處理分析,最終可以實現病案資料的修正、優化及稽查。

全面實現方式在可以獲得包括病人電子病歷資料、處方資料、檢查資料等相關其他資訊時可以做出的複雜資料質量評估。

人工智慧技術應用於智慧編碼其演算法的基礎都是自然語言處理(NLP)技術,該技術是通過電腦科學、資訊工程和人工智慧等手段讓計算機實現對非結構化文字的理解、分析和處理工作。

電子病歷中患者的主訴、既往史、症狀、診療過程及臨床診斷等資訊大多以非結構化的自然語言形式儲存,如何能讓計算機利用這些無章但極有價值的資訊來輔助病案首頁編碼是提升醫院管理效率和管理質量的一個重要部分。具體而言,文字處理所包含的步驟包括:

1、分詞

分詞是將文字序列切分成一個個單獨的詞,例如將“糖尿病周圍血管病變”分解為“糖尿病”“周圍血管”“病變”,這需要龐大的醫學知識庫在背後支撐,否則將會影響分詞效果及以後的文字處理步驟。

2、詞嵌入

簡單來說,詞嵌入是一種詞的型別表示,具有相似意義的詞具有相似的表示,是將詞彙對映到實數向量的方法總稱。通過這種方式產生的詞向量不僅維度低,而且包含了語義資訊。例如“癌”和“惡性腫瘤”這兩個詞所對應的向量在空間中距離很近,但“癌”和“汽車”這兩個不搭邊的詞所對應的向量就距離很遠。這樣,通過運算可以使計算機像人一樣“理解”詞彙的意思。

3、命名實體識別

在經過分詞和詞嵌入之後,計算機就可以開始識別文字中具有特定意義的實體了,在醫療中這些實體包括病人基本資訊相關實體(姓名、年齡等)、藥品名、疾病名和手術名等。一些常見的實體可能包含在知識庫當中,識別起來就很簡單。但是對於那些不常見的實體的識別,則需要一些演算法來實現。

通過以上三個步驟,計算機已經可以較好的理解文字的語義,以輔助編碼為例,計算機可以通過“基於規則”和“人工智慧”這兩個手段來達成。

4、基於規則

“基於規則”依靠的是大量醫學知識的沉澱,通過編碼邏輯和編碼規則,將處理好的文字與編碼的標準描述對齊匹配,達到編碼的目的。邏輯和規則的搭建需要依靠電子病歷中不同部分的內容資訊,其中包括:病人基本資訊(性別、年齡)、臨床診斷、手術操作、影像資訊和病理資訊等。“基於規則”智慧編碼系統的搭建需要花費大量的時間和專家資源,且維護的成本高。但是一旦搭建完成,其編碼的效果好、編碼路徑的可解釋性強。

5、人工智慧

人工智慧”途徑則可以在最短時間內搭建出一個較為可靠的編碼模型。它的主要核心是將編碼問題轉化為經典的文字分類問題來解決,只是在智慧編碼這個背景下,輸入的是電子病歷文字,輸出的是該病例編碼。計算機通過大量準確歷史資料的訓練,學習從文字中找特徵,並將這些特徵和編碼標籤聯絡在一起,從而完成學習的流程。

在資料多且質量好的情況下,人工智慧演算法可以達到很好的效果,但是資料少、資料錯誤多都會讓計算機“學錯”,導致效果不佳。另外,相較於“基於規則”的智慧編碼,人工智慧模型的可解釋性不強,這也是人工智慧在醫療很多應用上受限的一大原因。

因此,最理想的病案首頁輔助編碼是以醫學知識為基石、通過人工智慧的演算法賦能來搭建的。這樣的系統既能保留很強的醫學解釋性,又能具有人工智慧演算法的高效和可擴充套件性。

三、人工智慧應用於智慧輔助編碼的關鍵技術

應用先進的自然語言處理技術、機器學習技術等基於人工智慧演算法開發的各類模型,將其應用在以診斷(編碼)為主的病案首頁資料之上。具體技術架構如圖3所示,其包含以下特徵。

人工智慧技術如何助力病案智慧化編碼與DRG支付方式變革

圖3 病案首頁質控框架

1、整合知識庫自然語言處理文字分析

原始出院診斷資訊為病案首頁中的重要資訊來源,而且大多數情況下以自然語言形態出現(即醫生手動輸入的文字型診斷內容)。同時,國家規範的ICD編碼(包含ICD-10以及ICD-9-CM版本),其中的標準診斷書寫方式也是基於自然語言。

一般情況下醫生需要通過自己輸入的關鍵詞或完整診斷內容從系統自動化匹配的ICD編碼中選擇合適的對應編碼。然而很多時候醫生的書寫方式與ICD中的形態完全不同,因而一些情況下通過關鍵字的搜尋無法找到對應的ICD編碼。

然而這一問題可以通過知識庫積累與自然語言處理演算法進行優化。自然語言處理演算法可以將醫生書寫的出院診斷文字進行語義學分析。將其中的核心詞,及對應程度、病因、病理、部位、臨床表現等的修飾詞進行拆分與結構化。因而,不同部分的資訊點可以以不同的方式進行分析。

例如,標為“開放性右肱骨骨折”的主要診斷,自然語言分析可將其拆分為“開放性” “右” “肱骨””骨折”,分別指代診斷的類別、方位、位置及內容。因而可以對不同部分進行詳盡的分析,從ICD編碼中找出對應的大類。

進而,醫學知識庫可以將各類表述同一診斷的不同表述方式進行整理歸一,同時也可以將各類醫學名詞之間的關聯性進行細化。例如上例中,可以通過知識庫分析得知“右肱骨”屬於“肱骨”、“肱骨”位於上臂,因此將會從ICD編碼中排除所有不符合的編碼,對候選結果進行優化。

2、機器學習深度學習模型構建

由於編碼過程除了涉及醫學相關知識外,還要求編碼人員有一定的邏輯判斷能力。例如可以從多個出院診斷中選擇合適的診斷作為主要診斷,或面對多個診斷資訊時可以恰當地將其中可以合併的診斷進行編碼合併。在此前提下,機器學習深度學習演算法可以對該環節進行一定程度的輔助。

計算語言相似度的方法有很多,依據前期探索的經驗,單一方法在自動編碼輔助上的效果都偏差。因而需要探索多種方法整合後生成的模型是否可以具備更高的可用性。同時,應用神經網路將各類單一演算法中有限的變數整合後進行關聯,將可以在原有演算法基礎上形成新的、可支援一定邏輯深度學習模型。一些候選的研究演算法羅列在表1中。

人工智慧技術如何助力病案智慧化編碼與DRG支付方式變革

表1 研究演算法

3、自學習演算法、強誤差容忍度

為實現主診斷的選擇與合併編碼,模型應具備極強的自學習能力與抗噪聲能力。現有院內編碼資料(甚至包括監管部門得到的歷年上傳的資料)的一個特點就是其中依舊有不少難以發現的錯誤與偏差。

因而,在訓練相關的模型時,在無法得到完整的並且無誤的訓練資料的時候如何保證模型具備一定的誤差容忍度就成了極具挑戰性的命題。

四、電子病案智慧化編碼在DRGs支付方式改革中推廣應用的對策建議

伴隨著DRGs支付方式改革的逐步推進,病案首頁質量將越來越重要,編碼的準確性問題需要引起高度重視。市場上的很多資訊化廠商也紛紛開始關注病案首頁質控以及智慧化輔助編碼的技術實現問題。

隨著人工智慧技術的逐步推進,基於人工智慧技術從電子病歷資料來進行智慧輔助編碼將具有更廣闊的前景。

根據筆者的調研目前市場上也已經有一些廠商已經在一定程度上進行了很好的探索和市場化應用推廣,為提升病案首頁的資料質量以及編碼的準確性做出了一定的貢獻。

但是,如果要從國家層面助力醫保深入開展DRGs支付方式改革的全國推廣,還需要進行一定程度的頂層設計,具體建議如下:

1、自上而下的進行臨床資料的統一規範管理

1)、推行統一規範的病案首頁填寫版本

儘管國家已經發布了統一版本的病案首頁填寫要求,但是從各地的實際來看還有很多城市存在病案首頁填寫版本不一致的現象,建議應該首先由衛健委或醫保局統一牽頭推進病案首頁上報的標準版本,並確保該版本所需的資料能夠滿足DRGs分組所需要的全部資料需求。

2)、推行統一的DRGs分組器,併發布與之相適應的編碼體系,形成定期維護更新機制

目前,國內主流的分組器版本有CN-DRGs、C-DRG、上海版DRGs等,為適應不同的DRGs分組器,各不同學派又研發了自己的編碼體系,由於不同版本的編碼體系有較大的差異,在資訊化建設、資料共享和交換等方面不能滿足資訊化建設和醫改提出的要求,加強疾病分類編碼的統一管理、推行統一標準,是當前的大勢所趨。

因此,建議國家能夠從頂層設計的思路考慮,充分吸納借鑑各個學派的優勢,融會貫通,確定國家統一的法定DRGs分組器版本、以及與之相適應的編碼標準、編碼規則,並形成定期維護更新機制。確保分組科學,疾病之間的可比性以及為DRGs支付提供技術支撐。

3)、構建全國統一的病案首頁/電子病歷臨床資料庫,併成立專門的部門進行自上而下統一的資料質量監管

根據國際經驗,各國DRGs支付成功的必要條件是準確的臨床和成本資料。因此,各國在實施DRGs支付體系構建時都會成立專門的部門負責對資料的蒐集、處理、以及監管和稽核等工作。

以德國為例,德國專門責成InEK(Institut für das Entgeltsystem im Krankenhaus,DRGs研究院)進行DRGs的改革與開發工作。InEK的主要職責之一就是對醫療機構的資料進行收集與分析工作,並下設資料中心對醫療機構等提交的資料進行整理與彙總。

臨床資料主要用於診斷分類系統和程式分類系統,由InEK的資料中心收集彙總後提交給DIMDI(Deutsches Institut für medizinische Dokumentation und Information,聯邦醫療資料文獻及資訊研究院)進行診斷和程式編碼(基於InEK資料中心對臨床資料的處理與彙總稽核是確保DIMDI 的正確編碼與分組的重要保障)。

在編碼層面,德國DRGs相關的編碼工作,多數醫院是由醫師或專業編碼人員來做。每一家醫院皆設有醫療控制中心負責編碼的正確性與優化,醫療控制中心同時也負責在專業審查過程與MDK連絡。 

德國DRGs支付制度改革的一個很重要的經驗就是資料基礎建設。DRGs的開發依靠資訊、能力、政策工具等多項基礎條件,而可得、及時、準確的成本、臨床、病案等資料基礎是改革是否成功的決定因素之一。

好的資料基礎需要花時間來構建。一些國家希望在一個月之內就建成DRGs體系,但實際上構建DRGs系統是非常複雜的一項工程。在美國,建立DRGs系統花了15年的時間,先是在部分州作為試點,逐步擴大並完善。準確的資料是合理定價的基礎,以馬里蘭州為例,在資料逐步完善的情況下,至少花了4-5年之後才確定費率。

另外,DRGs系統本身的持續進化和更新本身還需要大量資料的積累,以更好的實現對於病種分類的不斷改進,對於嚴重程度的評價與監督,以及對於存在變異性很大的資料的規律性的總結與驗證等。

2、加強資料標準化和跨部門資料共享機制的建設

DRGs支付體系涉及衛生、人社、發改、醫院和商保等多部門的協同聯動,資料標準化和跨部門的資料共享是推進該支付體系改革順利實施和高效執行的重要保障,需要從國家層面加強對資料標準化的要求,並加強推進跨部門資料共享機制的建設,保障資料互聯互通,更好的推進DRGs支付改革的順利實施。

另外,還應積極通過促進跨部門的資料融合,比如身份資訊可以通過公安或運營商的資料進行補全及真實身份認證,來提升對醫保支付基金的合力支付和使用的有效監管,避免醫保欺詐行為的發生。

3、充分運用最新技術手段

人工智慧物聯網5G等豐富資料來源和資料實時採集功能,不斷通過資料交叉驗證等方式提升對編碼和DRGs分組準確性的判斷。

隨著人工智慧技術的快速發展,可以考慮藉助人工智慧的技術通過“智慧編碼”的應用,從電子病歷中通過語義分析的技術直接提取出關鍵主題資訊,再利用深度學習的技術將主題資訊進行分析對應到出院診斷,醫生對診斷分析結果進行復核,並對應到編碼,從而提升編碼員編碼的準確性,並反向監管編碼與病案首頁資料質量。

但是,醫保局在進行DRGs支付時,主要應用的分組資料來源於病案首頁,儘管有部分廠商現在嘗試利用人工智慧技術,將資料採集從病案首頁擴充套件到電子病歷,無論是病案首頁,還是電子病歷,都是在病人出院後的結果資料,無法對病人在住院過程中的實時資料進行實時採集和過程管控。

建議可以充分利用物聯網手段採集與病案內容相關的護理資料、醫療器械資料、環境資料、患者資料,採用大資料技術對病案內容進行交叉驗證,從而大大提高病案資料的完整性、真實性、及時性和可信度,同時也便於醫院和醫生對病人住院的治療過程進行更精準的臨床過程管理,和使用藥品、耗材等的成本管控。

對於醫保部門來說,還有利於運用這些過程資料與編碼資料進行交叉驗證,有利於結合過程資料對編碼的準確性進行進一步的輔助確認。

4、構建完善的DRGs費用、編碼及資料質量審查及監管機制

編碼決定了DRGs 的分組及費用支付的標準。因此國家醫保局應該成立專門的組織來專職負責構建完善的DRGs費用、編碼及資料質量審查及監管機制。

未來實行DRGs支付制度改革,病案首頁的資料質量將直接關係到醫院的經營收益,從國外經驗來看,實行DRGs支付後,一些醫療可能會存在高編碼傾向,也要求監管部門通過規範臨床資料,加強對病案首頁的稽核監管來避免高編碼行為。這些都要求對病案首頁的資料質量給予高度重視。

5、建立有針對性的高編碼風險監管的獎懲機制

根據國際經驗,實行DRG付費後高編碼的現象會根據不同的制度設計呈現不同的特點,根據對國外的文獻梳理髮現,高編碼風險的可能性和影響因素,因不同市場、控制和病例組合系統而存在不同的特點。具體如下圖所示:

人工智慧技術如何助力病案智慧化編碼與DRG支付方式變革

圖4 DRGs系統高編碼風險的影響因素

因此,建議醫保局結合DRGs支付方式改革的目標、系統的特點,在制度層面綜合考慮設計有針對性的高編碼風險監管的獎懲措施,儘量降低高編碼的風險。

6、加強對專業人才的培養與培訓,特別是對二級醫院編碼的應用培訓

DRG涉及到編碼、病案、分組、權重與費率測算、質量監管等系列專業性極強的關鍵技術環節,從目前我國的人才現狀來看,還需要持續加強對不同領域專業人才的強化培訓與持續培養機制的建設,為DRG支付體系改革的持續發展提供專業的人才保障。

特別是基層醫院、二級醫院、民營醫院等,由於醫院資訊化水平低下,缺乏專業的病案與編碼人才,臨床醫生對臨床資料尤其是編碼的準確性重視不夠等,長期以來資料質量低下,亟需提升與改善。需要通過專業化的培訓以及藉助智慧編碼等資訊化手段,快速提升編碼準確性,確保 DRGs分組的準確性以及支付方式改革的順利開展。

7、智慧編碼應用試點先行,逐步推廣

當前,病案首頁資料質量問題是一個普遍存在的問題,智慧編碼廠商的資訊化軟體系統的應用也是處於研發和試點階段,建議國家醫保局可以充分整合各廠商的產品優勢,尋找基礎條件好的省市及重點醫院開展試點,先行先試,在總結試點經驗的基礎上進行逐步推廣。

8、頒佈專門的法律法規保障DRG支付體系的權威性和順利推進執行

DRG支付體系改革是改變醫療衛生生態體系利益分配格局的一次衛生經濟改革,涉及產業鏈條裡的各方利益博弈,從國外經驗來看,為了更好的保障各方利益,很多頂層設計的規則、制度、標準需要以法律的形式進行明確,以更好的體現DRG 支付改革的權威性,確保改革能夠順利推進執行。

因此,中國需要結合DRG頂層設計方案確定的系列規則、制度、標準及利益主體的談判機制、組織形式及組織保障、資料如DRGs分組及編碼的標準、質量監管等通過立法的方式予以明確。

參考文獻

1.朱明宇. 基於醫學人工智慧技術的病案首頁智慧編碼研究 [J].中國數字醫學,2018(4)。

2.高軼.公眾號:風中小亭——文章:[圍爐品茗話醫保]第十二節:從技術角度看病案首頁輔助編碼系統。

3.陸慧,陳家應. 美、澳、荷三國病例組合系統高編碼風險比較研究[J].國外醫學(衛生經濟分冊),2008,25(3): 120-126。

版權宣告:

本文中的大部分觀點屬於劉芷辰博士個人博士後課題研究成果,所引用的文章及觀點屬於作者在公開渠道獲得的文獻作者的觀點,未經許可,禁止進行轉載、摘編、複製及建立映象等任何使用。

相關文章