結合人工智慧的高效能醫學:現狀、挑戰與未來

機器之心發表於2019-02-16

結合人工智慧的高效能醫學:現狀、挑戰與未來

有標註大資料的使用以及顯著提升的計算能力和雲端儲存實現了人工智慧在各行各業的應用,尤其是其中的深度學習子類別。在醫學領域,人工智慧開始在三個層面產生影響:臨床(主要是透過快速、準確的影像解讀)、健康系統(透過改善工作流程和降低醫療錯誤的潛力)、病人(讓他們能處理自己的資料,從而提升健康狀況)。本文也將會討論當前的侷限性(包括偏差/偏見、隱私和安全、缺乏透明)以及這些應用的未來方向。隨著時間的推移,準確度、生產力和工作流程方面很可能能夠實現顯著的提升,但這會被用於改善醫患關係還是導致其惡化,這一點還有待觀察。

醫學位於兩大主要趨勢的交叉口。第一個趨勢是業務模式的失敗——雖然與醫療保健相關的支出和工作崗位都在增加,但關鍵的結果卻每況愈下,包括美國預期壽命下降以及較高的嬰兒、兒童和孕產婦死亡率。這體現了一個悖論,一個並不僅限於美國醫學界的悖論:投入更多人力資本卻得到了更糟糕的人類健康狀況。第二個趨勢是資料正大規模地生成,其來源包括高解析度醫療成像、具有持續的生理指標輸出的生物感測器、基因組測序和電子病歷。僅靠人類很顯然已經難以分析這些資料,也就必須增加對機器的依賴。因此,為了提供醫療保健,在對人類的依賴超越以往的同時,我們也迫切需要演算法提供幫助。然而,在醫學領域,人類與人工智慧(AI)的整合才剛剛開始。

從更深層次看,醫療保健領域存在顯著的長期缺陷,正是這些缺陷導致其回報越來越低。其中包括大量嚴重的誤診、治療方法錯誤、資源的極大浪費、低效的工作流程、不平等、患者和臨床醫生之間時間不足。帶著改善這些問題的渴望,醫療行業的領軍者與電腦科學家聲稱 AI 也許能幫助解決所有這些問題。也許最後確實會如此,但研究者才剛剛開始使用神經網路來改良醫療實踐中的弊病。在這篇回顧中,我收集了很多在醫學領域使用 AI 的已有證據,並列出了其中的機會和陷阱。

臨床醫生使用的人工智慧 

幾乎每種型別的臨床醫生(從專科醫生到護理人員)未來都將會使用 AI 技術,尤其是深度學習。這很大程度上涉及到使用深度神經網路(DNN)的模式識別,這可以幫助解讀醫療掃描結果、病理切片、皮膚病變、視網膜影像、心電圖、內窺鏡檢查、面部和生命體徵。我們通常使用一種真陽性與假陽性比率的圖表(被稱為受試者工作特徵曲線(ROC))來比較神經網路的解讀結果與醫生的評估,使用該曲線下的面積(AUC)來表示神經網路的準確度水平。

  • 放射科

  • 病理學

  • 皮膚科

  • 眼科

  • 心臟病學

  • 消化內科

  • 心理健康 

結合人工智慧的高效能醫學:現狀、挑戰與未來表 1:與醫生比較的經過同行評議的 AI 演算法論文

結合人工智慧的高效能醫學:現狀、挑戰與未來表 2:美國食品藥品監督管理局(FDA)正在加速審批 AI

人工智慧與健康系統 

理論上而言,預測關鍵性結果的能力能讓醫院更有效和更準確地使用姑息療法。

使用電子病歷資料,機器學習深度學習演算法可以預測很多重要的臨床引數,涵蓋阿爾茨海默病到死亡等許多情況。

結合人工智慧的高效能醫學:現狀、挑戰與未來表 3:這裡選擇性地展示了一些用於預測臨床結果和相關引數機器學習深度學習演算法

除了電子病歷的資料,也可以使用影像來提升預測準確度。有多項研究試圖預測生物學年齡,而結果已經表明使用基於 DNA 甲基化的生物標誌物來完成這一任務是最佳的。

人工智慧與患者 

深度學習演算法的發展讓公眾可以將自己的醫療保健掌控在自己手中,但這方面的工作目前落後於臨床和健康系統。這類演算法中有一些已經獲得了 FDA 的批准,正處於後期臨床開發階段。

結合人工智慧的高效能醫學:現狀、挑戰與未來

圖 2:AI 在人類生命週期中的應用例項。dx 表示診斷;IVF 表示體外受精;K+ 表示血鉀水平


研究者也在尋求透過 AI 藉助智慧手機完成一些醫療診斷,其中包括皮膚病變和皮疹、耳部感染、偏頭痛和視網膜疾病(比如糖尿病性視網膜病變以及與年齡相關的黃斑變性)。

科學家也在研究如何整合有關人體健康狀況的多模態資料。最終,當可以整合一個個體的所有資料與醫療文獻語料庫時,就有可能實現全面系統的預防方法。

結合人工智慧的高效能醫學:現狀、挑戰與未來圖 3:使用多模態資料輸入和演算法的虛擬醫療教練模型,能夠提供個性化的指導。使用來自個體的全面輸入的虛擬醫療教練經過深度學習後,可以為人們提供保持健康的建議。

人工智慧資料分析 

在臨床實踐的上游,生命科學領域內的 AI 進展明顯要快得多,也有廣泛的有同行評議的出版物,這是在沒有監管監督時更容易驗證的道路,而且科研界有遠遠更強的實現意願。正如聽診器是醫生的標誌一樣,顯微鏡是科學家的標誌。科學家目前正在研究一些「無影像的」顯微方法。除了改進無影像顯微方法和細胞分析,深度學習人工智慧也已被用於恢復或修復失焦影像。而且計算機視覺也已經幫助實現了單個細胞內的 40-plex 蛋白質和細胞器的高通量評估。

研究者也在使用 AI 工具來提升對癌症演化方式的理解——他們將一種遷移學習演算法用在了多區域腫瘤測序資料上,將計算機視覺用於透過微流體隔離的在單個細胞解析度上的活體癌細胞分析。

既然我們已經在用「神經網路」描述 AI 了,那麼生物神經科學與人工智慧互相提供靈感也就不足為奇了。

AI 已被用於重建神經迴路,能讓我們根據電子顯微成像理解連線組。AI 帶來的一個最激動人心的進展是理解人類大腦的網格細胞。反過來,神經形態計算(透過對大腦逆向工程來研發計算機晶片)不僅能實現更高效的計算,還能幫助研究者理解大腦回路和構建腦機介面。使用遷移學習演算法實現人類和動物行為的機器視覺跟蹤是另一個正在進行中的進展。

AI 正在多個層面上改寫藥物發現的方式,包括對生物醫學文獻的複雜的自然語言處理搜尋、對數百萬分子結構的資料探勘、設計和製作新的分子、預測脫靶效應和毒性、預測實驗藥物的合適劑量以及進行大規模的細胞檢測分析。

侷限和挑戰 

儘管 AI 技術有望實現所有這些成就,但也存在艱鉅的障礙和陷阱。AI 當前的炒作熱潮已經遠遠超出了 AI 科學的當前現狀,尤其涉及到病患護理中的實現的驗證和可讀性時。IBM Watson Health 的癌症 AI 演算法(被稱為 Watson for Oncology)就是近期的一個案例。這個演算法已被全球數百家醫院用於為癌症患者推薦治療方法,但該演算法卻基於少量合成的、非真實的案例,僅有非常有限的腫瘤專家的輸入(真實資料)。實際輸出的很多治療方法建議都被證明是錯誤的,比如建議嚴重出血的患者使用貝伐珠單抗(Bevacizumab),這是一種明確的禁忌症狀和該藥物的「黑箱」警告。這個例子說明有缺陷的演算法有可能會給患者造成重大的傷害,導致醫療事故。不同於一位醫生的錯誤只會傷害到一位病人,機器演算法有可能帶來巨大的醫源性風險(iatrogenic risk)。因此在將 AI 演算法用於醫療實踐時,需要進行系統性的除錯、審計、廣泛的模擬和驗證以及前瞻性的審查。還需要更多證據和穩健的研究以達到 FDA 近期已經降低了的審批醫療演算法的監管要求。

有關演算法的黑箱的內容已被寫了很多,圍繞這一主題的爭論也有很多;尤其是在 DNN 的情況中,我們有可能無法理解輸出的決定因素。這種不透明帶來了可解釋性需求,比如,歐盟的《一般資料保護條例》要求在將演算法用於患者護理之前需要有透明性——開啟演算法的黑箱。儘管是否可以接受為患者護理使用不透明演算法的爭議尚未解決,但仍需指出醫學實踐的很多方面都是不可解釋的,比如在不知道作用機制的前提下的藥物處方。

不平等是現今最重要的問題之一,尤其是在美國,也就是醫療護理並不向所有公民提供。大家都知道社會經濟地位是過早死亡的一個主要風險因素,有產者和無產者對 AI 的不成比例的應用可能拉大兩者之間的現有差距。這種已經存在的不平等之所以會加大,一個原因是現今很多演算法中嵌入的偏見,這又源自於資料集中缺乏對少數群體的覆蓋。比如,有的診斷黑素瘤的皮膚科演算法沒有覆蓋不同膚色以及使用基因組資料語料庫,這樣的演算法在代表性不足的少數群體上存在嚴重問題。儘管有人認為演算法偏見還比不上人類偏見,但仍然還需要很多工作以消除嵌入的偏見,也需要爭取讓醫療研究提供真正有代表性的人口情況。

AI 在醫學領域的未來的一個最重要問題是能在確保資料的隱私和安全上做到多好。鑑於普遍存在的駭客攻擊和資料洩露問題,人們將不會有什麼興趣使用有風險洩漏患者病歷細節的演算法。此外,也存在故意攻擊演算法以造成大規模傷害的風險,比如為糖尿病過量使用胰島素或刺激除顫器在心臟病患者的胸腔內放電。透過人臉識別或基因序列從大規模資料庫中識別個人身份的可能性正越來越高,這又會進一步阻礙對隱私的保護。與此同時,生成對抗網路也可能模糊真相,幾乎有無限的操縱內容的可能性,從而可能對健康非常不利。我們需要新的個人健康資料所有權模式、高度安全的資料平臺和政府立法(正如愛沙尼亞已經實現的那樣),這樣才能應對迫在眉睫的安全問題,否則 AI 在醫療領域的發展就會遭遇阻礙或失去機會。

考慮未來 

我在這篇回顧中強調的一個關鍵點是將 AI 帶入醫學領域的故事才剛剛開始。對於機器能夠執行的幫助臨床醫生或對健康系統有用的預測臨床結果的任務,前瞻性的驗證真的非常少,對於以使用者為中心的演算法就更少了。這個領域的承諾確實很多,而資料和證明相對較少。錯誤演算法的風險極大高於單個醫生-病患互動的風險,但是降低誤差、低效和成本的回報也很大。因此,醫學領域的 AI 不能有例外——在患者護理中推出和實現之前,它需要嚴格的研究、在有同行評議的期刊上發表結果以及在真實世界環境中的臨床驗證。

結合人工智慧的高效能醫學:現狀、挑戰與未來圖 4:呼籲醫學領域中 AI 研究應有正當的程式。在患者護理中實現之前,必需先在有同行評議的期刊上發表結果,在真實世界醫學場景中驗證。

有了這些警告,對 AI 最終將如何整合進來要有合理的預期,這一點也很重要。現今有一種廣泛的炒作,說是醫生會被機器取代,我們可以將其與現實測試的自動駕駛汽車模型類比看看。大多數人都同意自動汽車是到目前為止 AI 最頂尖的技術成就,但「自動」一詞頗具誤導性。汽車工程師協會(SAE)已經定義了五個自動化層級,其中第 5 級表示在所有情況下都完全由汽車控制,人類沒有任何可能性作為後備或接管汽車。現在普遍認為這種定義的完全自動化很可能永遠無法實現,因為某些環境或道路條件會使得我們無法安全地使用這種車輛。基於同樣的原因,醫學可能永遠無法突破第 3 級,這是一種有條件的自動化,因為其中肯定需要人類來監管演算法對影像和資料的解讀。很難想象在治療病人時僅有非常有限的人類後備(第 4 級)。人類的健康太寶貴了——除了風險極小的日常事務之外,還遠遠不能將其託付給機器。

結合人工智慧的高效能醫學:現狀、挑戰與未來圖 5:自動駕駛汽車與醫學自動化的類比。第 5 級是不存在人類醫生作為後備可能性的完全自動化,這不是目標。第 4 級是僅在非常有限的條件下使用人類備份,這也不是目標。目標是協同,將機器做得最好的功能與那些最適合臨床醫生的工作結合起來。

激動人心的發展就在前方,但可能會比很多人預測的更遠——軟體將快速、準確和低成本地消化和有意義地處理大規模資料,機器將有能力實現人類無法看到或做到的事情。這一能力最終將成為高效能醫學的基礎,這是真正由資料驅動的,能減輕我們對人類資源的依賴,並最終將讓我們超越人類智慧和機器智慧單純相加之和。在生物醫學領域和發現中已經實現的進展在被接受和廣泛實現方面遇到的挫折要小得多,這些上游進展將引領這一人機共生。

原文連結:https://www.nature.com/articles/s41591-018-0300-7

相關文章