人工智慧發展跳出三要素?加入“知識”後,醫療AI發展還將面臨哪些新問題?

動脈網VCBEAT發表於2020-08-11

雖是老生常談,但人工智慧終究繞不開演算法、算力、資料三要素。這些要素環環相扣,緊緊握住了人工智慧技術的命脈。而醫療場景的人工智慧產品越來越豐富,毫無疑問也離不開這三個要素的快速發展。

為了再度探索醫療人工智慧技術發展及產業未來趨勢,在前不久舉行的全球人工智慧和機器人峰會(CCF-GAIR 2020)上,包括南京大學計算機系主任周志華、華西醫院副院長龔啟勇、騰訊天衍實驗室主任鄭冶楓、平安集團首席醫療科學家謝國彤、聯影智慧聯席CEO沈定剛在內的醫療人工智慧頂級專家,對這個三元問題又提出了新的理解。

人工智慧發展跳出三要素?加入“知識”後,醫療AI發展還將面臨哪些新問題?

神經放射科的新需求

華西醫院副院長龔啟勇同時也是一名放射科醫生,他認為,要解決人類神經類疾病,AI的介入必不可少。

在龔啟勇對於精神分裂症患者的腦MR影像研究之中,他發現疾病的發展會帶動患者腦部結構發生變化,患者多個腦區會因此便膨脹或縮小。如果能夠透過影像的方式量化這一類變化,醫生就有可能對患者的精神分裂、抑鬱症、強迫症等神經疾病進行詳細分類。

他在峰會上提到過去的一項研究成果:“一位醫生曾發現她的患者在犯強迫症時,某一特定腦區的電波會變得異常活躍,因此她嘗試用電極對該區域進行刺激。而後,患者的病症有了明顯的改觀。”

遺憾的是,該結果在後續的大量實驗中並沒有表現出絕對的效果,對此,龔啟勇認為:“由於人腦的結構非常複雜,想要透過二維的影像準確判斷腦部病變位置非常困難,我們無法判斷醫生在操作時是否準確的刺激了標記區域,因此,我們需要AI技術對腦部進行快速準確的建模,輔助定位。”

“如果我們能夠透過AI準確或許患者腦部資訊及病變情況,後續的治療研究或許也將因此受益。”

小樣本學習或能滿足AI新需求

龔啟勇院長的研究似乎預示著AI確實能夠在輔助神經放射學的發展,推動神經類疾病診斷、治療的進行。但在實際之中,這裡存在的資料缺乏問題無疑是擋住研究進展的大山。

通常而言,受制於高昂的費用,疑似精神病病患在檢查時並不會直接進行MR診斷,透過患者的實際表現與部分精心設計的量表,醫生可以很快完成患者的初診,進而直接選擇通用的治療方案。這導致精神病患腦MR影像難以收集。

龔啟勇院長也提出了多中心協同的臨床研究以解決資料問題,透過聯合多家醫院精心標註的腦部資料,樣本量的確能夠獲得擴充,但仍難以達到AI訓練所期望的大資料。

這時,一些新的方法應運而生。

小樣本學習是推動深度學習發展的新方向,也是現階段騰訊天衍實驗室研究的重點方向之一,騰訊天衍實驗室主任鄭冶楓在會上介紹了兩個小樣本學習演算法,用於將來解決醫療影像資料量不足的問題。

第一個方法是遷移學習,即將某個任務(源域)上訓練好的模型遷移到另一個任務(目標域)。透過這種方式,我們能夠透過源域上的大量資料輔助目標域的小樣本資料進行學習,具體表現為“預訓練+微調”的模式。

鄭冶楓以一個有趣的例子對遷移學習的原理進行了表述:“假設你想做一個‘識別老虎’的計算機視覺專案,但你卻沒辦法經常接觸它,觀察它。不過,若你能夠養一隻橘貓,便能在與它的朝夕相處中,捕捉它進食、玩耍、休憩等過程中的一些特徵,進而用於老虎的識別。”

第二個方法是無監督域自適應學習,用以解決域偏移問題。在這個方向上,騰訊天衍實驗室提出了新型無監督域自適應(UDA)的方法,來緩和域偏移所導致的效能下降,該方法僅僅需要源域的資料、標註以及目標域的部分影像,無需新的標註,即可實現兩個領域的自適應。

算力重塑人工智慧

不過,僅是對演算法進行調整,能夠解決醫療人工智慧中的問題嗎?其實,演算法本身也有最佳化的空間。

南京大學計算機系主任周志華以當前最大人工智慧模型“GPT3”為例,談到了當前機器學習中的暴力美學。這個模型用到了45TB訓練資料,1750億引數模型引數,整個模型大小700GB。基於這個模型,很多困難的自然語言處理問題都取得大幅度進展。

如此來看,模型、資料的擴張確實能夠有效改善模型的質量,但對於醫學人工智慧影像而言,同樣會面對資料的問題。

假設醫生能夠標註足夠多的影像,誰來負擔高昂的運算費用呢?GPT3一次運算所耗費的算力大概價值1300萬美元,即便是模型中存在BUG,也沒人願意對其修改,再耗費巨資跑上一遍。

對於這一問題,周志華與鄭冶楓給出了不同的解題思路。

周志華在演講中表示:“這樣的模型能夠解決很多問題,帶來很大的效能提升。但是如此高昂的成本,也給我們從事人工智慧研究的人帶來了新的挑戰,特別值得讓學術界從事人工智慧研究的學者思考一個問題:昂貴的成本必須換來效益回報,模型效能提升,在工業界能提升經濟效益,有時哪怕效能提升一兩個點,帶來的回報可能足以彌補投入。但學術界如果花這麼大成本,怎麼能帶來足夠的回報?”

“把對‘ 效能’的追求交給工業界,學術界不必過多地關注“效能”,因為模型效能提高那麼幾個點,對於學術界並沒有多大的意義,僅僅是發表幾篇論文的話,對不起這麼巨大的投入。那麼學術界做什麼呢?回到本源,做學術界該做的工作:探路、思考未來”。

與之相反,鄭冶楓在接受採訪時告訴動脈網:“1%的效率提升對於企業而言意義不大,而學術界應該精益求精,追求更完美的結果。”

誰是更好的路徑?現在下定論還太早,但從AI的發展來看,工業與學業的合作,或許才是當下最有可能的發展方向。

三元問題引入“知識”新要素

人工智慧誕生至今已經近70年曆史,研究者仍未跳出三要素的影響範圍,但隨著技術逐漸成熟,要追求下一代的人工智慧周志華認為必須引入“知識”這一要素。

如何將“機器學習“與“邏輯推理”結合,是人工智慧領域的“聖盃問題”,以往的努力有的是“重推理”,有的是“重學習”,偏重任何一側都不能充分發揮AI的力量。周志華提出了“反繹學習”,希望在一個框架下讓機器學習邏輯推理二者能更均衡更充分地發揮效用。

“從現在來看,‘機器學習’與‘邏輯推理’結合方式主要有兩類,第一類,我們可以看到它是把機器學習邏輯推理中引,但是後面主體還是透過推理來解決問題,所以我們稱它是推理重而學習輕。第二種做法基本上是反過來,它把邏輯推理的技術往機器學習裡面引,但是後期主要的問題是靠機器學習來解決,所以我們稱它是學習重而推理輕。總是一頭重一頭輕,這就意味著有一頭的技術沒有充分發揮威力。”而“反繹學習”則是兩者的融合。

對於周志華的觀點,鄭冶楓也表示非常認同,但他也提出了其中實現的困難:“在人工智慧的初期,我們便嘗試將先驗知識融入AI演算法模型。但由於不同的知識在融入的過程中必須遵循不同的方式,而沒有一種通法。此外,當時我們的模型跑起來並不如大量資料支援的黑箱模型有效,這其實有點打擊人。不過,如今時代已經不同,知識的加入或許能夠徹底改變當前的人工智慧。”

AI大有可為

無論是演算法、算力、資料,還是可能加入的知識,一切都將服務於醫生,服務於具體的場景,只有場景是AI的試金石。

對此,在平安集團首席醫療科學家謝國彤看來,AI的發展必須要藉助生態的力量,醫療科技的付費是企業、醫保、患者三方的角逐。

他在採訪中這樣談到:“衛健委很信任我們,因為我們有保險生態,其激勵便是讓患者健康、長壽,以控制保險風險。因此,我們與衛健委的利益是一致的”

另外,他也表示:“其實影像只是醫療體系中很小的一個科室,AI在領域之中的應用非常有效,是大勢所趨。即使有同行者在前行路上倒下,這也很正常。錯誤的經驗也是經驗,一切積累,將幫助我們走得更遠。

相關文章