3月15日,騰訊AI Lab第二屆學術論壇在深圳舉行,聚焦人工智慧在醫療、遊戲、多媒體內容、人機互動等四大領域的跨界研究與應用。全球30位頂級AI專家出席,對多項前沿研究成果進行了深入探討與交流。騰訊AI Lab還宣佈了2018三大核心戰略,以及同頂級研究與出版機構自然科研的戰略合作(點選 這裡 檢視詳情)。
騰訊AI Lab希望將論壇打造為一個具有國際影響力的頂級學術平臺,推動前沿、原創、開放的研究與應用探討與交流,讓企業、行業和學界「共享AI+未來」。
Pep Pàmies
國際頂級科學期刊《自然·生物醫學工程》主編
在 16 日的「AI+醫療」論壇上,國際頂級科學期刊《自然·生物醫學工程》主編 Pep Pàmies 做了主題為《人工智慧在醫療領域的顛覆性潛力》的演講。
Pep Pàmies是《自然》2017年1月新推出的子刊《自然-生物醫學工程》主編,該雜誌致力於傳播人類健康和醫療保健技術的傑出研究成果。此前,他在《自然-材料學》從事了5年多的編輯工作,處理包括組織工程學、醫學成像、再生醫學、癌症治療和診斷等在內的多個領域和主題的論文,推動生物材料學方面的科學傳播。Pep Pàmies曾在美國哥倫比亞大學化學系、德國馬克斯•普朗克膠體和介面研究所、荷蘭原子與分子物理學研究所進行過計算軟物質和生物物理方面的研究。他於2003年在西班牙的羅維拉-威爾吉利(RoviraiVirgili)大學獲得化學工程博士學位。
演講內容
人工智慧即將大幅度改變臨床醫學。資料獲取、調節和數字化方法、計算基礎設施和演算法訓練方法的快速發展,預示著人工智慧將在幾乎所有醫療領域和疾病上得到應用。
以下為演講全文(為便於閱讀進行過適當編輯整理):
非常感謝各位,我非常榮幸來到這裡。
我想用一個小笑話來開始今天的演講:為了讓飛機飛起來,我們需要一臺計算機、一位飛行員和一條狗。這臺計算機的任務是控制飛機飛行,飛行員的任務是喂狗,而狗的任務則是在飛行員試圖操作計算機時咬他。
當然這只是一個笑話,但我想說的有兩點。第一,現在我們確實在用計算機幫助駕駛飛機,但我們可能並不認為那是 AI。我認為 AI 本身也是一個不斷演進的目標,當計算系統或演算法在我們的生活變得很常見時,我們就不再認為那是 AI 了。
第二,駕駛飛機的計算機很可靠和安全,整個行業都在使用。也許我們並不完全信任它們,但我們還是需要它們來駕駛飛機,因為飛機上的幾百條生命都取決於它們的可靠執行和降落。
現在我們看到,AI 有可能變革很多領域,尤其是醫療領域。但現在我們還處在人工智慧發展非常早期的階段。和駕駛飛機一樣,在醫療方面我們也還不能完全信任演算法。我會給出一些例子來說明。
現在的可穿戴裝置上配置了很多感測器,相關裝置上也有分析這些感測器資料的演算法。能檢視這些資料當然很好,但我想看到更多資訊,比如我的健康狀況如何、心血管是否健康、身體狀況是否有所改善。這些分析也許都需要用到 AI。所以要讓可穿戴裝置幫助我們實現更健康的生活,還有很長的路要走。
大家可能知道上圖中的這篇論文,因為很多媒體報導過。這是谷歌第一篇使用卷積神經網路預測糖尿病性視網膜病變(diabetic retinopathy)的論文。糖尿病性視網膜病變是由高血壓導致的視網膜中的血管問題,這會發展成真正的出血問題,並可能最終導致失明。
這是典型的接受者操作特性(ROC)曲線。可以看到它的縱座標表示靈敏度,橫座標表示特異度。其中一條線是神經網路演算法的表現,這些點是不同醫生的結果。可以看到演算法的表現和醫生的結果差不多好。所以這個演算法能夠診斷糖尿病性視網膜病變。
上圖是另一個關於眼部疾病的研究,兩週前剛發表在 Cell 上。你也可以看到有類似的 ROC 曲線。
另外還有一篇我們幾周前釋出的論文,也是來自谷歌的研究成果。它也是利用了視網膜影像,但不是為了診斷眼病,而是為了診斷心血管疾病,尤其是五年發病風險。谷歌通過他們的深度學習方法可以預測心血管疾病的風險因素,比如血壓、年齡、性別。雖然這方面還有更多工作要做,但這項工作表明這是有可能實現的,有望用來為公眾進行疾病篩查。
他們的演算法的表現差不多接近執業眼科醫生。圖中藍色方塊是檢測準確的結果,橙色和棕色是錯誤的結果。這種演算法目前正在進行臨床試驗,這樣既能給醫生提供幫助,也能在醫生的幫助下得到更好的訓練。另外,這個系統是部署在雲上的,實現了多家醫院的合作。因為罕見病的資料本來很少,這樣的合作能聚合多家醫院的資料和醫生,從而有助於更快地開發出更好的系統。
上圖是《自然》去年釋出的一篇關於檢測黑素瘤的論文,這個演算法的表現同樣也接近醫生。因為黑素瘤有不同的型別和階段,所以有時候醫生也難以判定。而這個演算法能很好地識別不同型別的黑素瘤。
雖然我們這裡看到的都是比較容易拍照檢測的位置——眼睛和皮膚,但我們也可以使用演算法來檢測 X 光照片、超聲影像等。
上圖是一個與臨床不相關的研究,是關於使用 CRISPR 進行基因編輯的。這項技術所面臨的一個主要問題是脫靶效應(off-target effect)。脫靶效應是指用於編輯特定基因的蛋白可能偏離目標,破壞基因組中的其它基因,因為這些基因可能具有相似的模式。我們可以根據基因規則和模擬來預測脫靶效應發生的可能性。這裡的 Elevation 方法使用了機器學習,可以看到表現優於其它方法。這是人工智慧可以發揮作用的又一領域,而且預計 CRISPR 技術將在未來 5-10 年內得到臨床應用。
上圖的研究是關於病理學的,是我們去年發表的一篇論文。我們想從這些影像中瞭解有關病理的內容,這方面我們看到了影像系統的優勢。一般來說,檢測腫瘤時,首先會取一些未經處理的人體組織,然後在實驗室中用化學方法進行檢測,檢視細胞的模式等等,但也可以使用影像系統來做這件事。可以看到,上面使用 SRH 的結果很接近下面的使用傳統 H&E 方法的結果;但 SRH 的結果不需要在化學實驗室中來做,實際上這是一種基於受激拉曼散射顯微成像的方法。可以看到不同的細胞有不同的模式,可以用機器學習來進行識別;實際上他們也這麼做了,實驗結果也確實非常不錯。
這些研究都很好,但絕大多數都沒有在臨床實踐上得到應用,甚至都沒有臨床試驗。因為所有這些演算法都需要得到驗證,而且驗證的資料不能只來自某家醫院,而需要多家不同醫院的資料。因為不同醫院的系統可能存在些許差異,比如有的系統可能噪聲多一點。所以在實現這些系統的實際部署和應用上還有很多工作要做。
我們在部署這些系統上還面臨著哪些社會經濟難題呢?
首先,每當我們在一個體系中部署新系統時,都會有人反對。這些系統肯定會改變醫療行業的工作情況——影像科醫生和病理醫生等的工作都會改變。但並不是說演算法會讓這些醫生失業,這些技術是無法取代臨床醫生的。而且我們不會一蹴而就地部署這些技術,我們會首先進行試點測試,然後逐步推廣——因為我們也需要逐步得到人們的信任,這是非常重要的。此外,診斷和治療非常注重背景資訊,目前的演算法在理解背景資訊上還遠遠不行。所以就算放射科醫生的工作確實會變化,那也是向更好的方向變化,讓他們能免於那些重複的檢視模式的任務——演算法能在這些任務上做得更好,它們更有原則、不易出錯、不知疲倦,而且還不領工資。
我們還需要合適的補償框架——這些系統產生的利益是誰的?誰為之付費?這些系統應該會很便宜。
當然,必要的臨床試用和測試流程也必不可少,在大規模應用之前必須確保系統有用。
還有監管機構方面的認證問題,不同的國家有不同的監管機構,比如中國的食品藥監局、歐洲的 CE 認證。
此外,還有資料的共享和隱私問題。演算法需要大量資料,但這些資料涉及人們的隱私,你不能公開共享這些資料,為此我們需要加密共享、區塊鏈技術等等。
法律方面的問題也不能忽視。要讓你設計的演算法得到應用和產生影響,你必須和現有的系統合作,讓你的演算法得到信任。
最後是「行為沉默」方面,我們要讓人們相信演算法,否則就無法讓這些演算法得到應用。為此我們需要做到這幾點——第一點是可解釋性。人工智慧應該要能解釋醫療行為背後的原因,我們需要理解演算法是如何得到結果的。我們有一些能夠做到這一點的方法,尤其是針對卷積神經網路而言。這是我在谷歌的 Distill 上找到的一個最新案例。他們試圖解讀深度學習網路的工作方式。這種功能在醫療領域有很重要的價值,能讓醫生理解這些演算法得出特定結論的原因,比如出錯的原因。這樣有助於構建醫生對演算法的信任。如果沒有這樣的信任,演算法不可能得到應用,畢竟這事關病人的生命。
第二點是人性問題。我們都認為演算法是非常客觀的,其實不一定,因為給演算法程式設計的是我們人類,而人類是存在偏見的。而且我們不僅可以通過程式設計方式和網路結構選擇來施加影響,資料集的選擇也會產生重大影響。資料中的偏差和偏見也會反映在訓練得到的模型上。
第三點是透明。這不僅僅關乎可解釋性,因為這些演算法直接影響的是病人,所以要讓病人知道這些診斷結果和治療方案來自於演算法。要讓病人理解這種醫療方式,得到他們的信任。
第四點是責任。誰為演算法的決策負責?出了問題怎麼辦?實際上人工智慧的很多不同領域都面臨著法律和問責機制方面的問題。
第五點是公平。人工智慧應該依據人類的價值觀來進行行動,這一點非常重要。
接下來分享我的一點簡單看法,我覺得人工智慧將最可能首先在這些方面帶來重大影響。
首先是影像分割。這方面已經有一些實際應用了。我們可以根據不同的引數,讓演算法對醫療影像進行分割。
其次是遠端醫療。我發手機上就有一個這樣的應用叫Babylon,是英國的一個健康系統。你可以在上面使用聊天機器人進行諮詢,你也可以付費尋求醫生的遠端幫助。
第三是虛擬組織學(Virtual Histology)。通過演算法對組織影像進行處理,可以得到高質量的視覺化資料,從而幫助醫生進行診斷。
最後是體外診斷。比如在液體活檢方面,有時候難以找到合適的生物標誌物,而且有時候一種生物標誌物不足以確定某種疾病,而需要多種生物標記物的組合。這也是一種模式識別任務,可以使用機器學習解決。
那麼我們現在處在哪個階段呢?看看這個典型的技術炒作曲線(Hype Cycle),首先人們對一項技術感到興奮;然後人們的期望達到頂峰,但最後發現實際情況沒有這麼好,這可能會導致資金撤出,人們的期望破滅。然後經過幾年的沉寂,人們終於認清了現實,技術重新迎來發展併產出實際應用。我認為我們處在這個★的位置。在醫療領域,現在對於 AI 的能力有很多炒作的地方。
我們面臨的風險是 AI 技術的市場份額不能有效地增長,最後反而衰退。
謝謝大家!