德米特里·特佐普羅斯(Demetri Terzopoulos)來過上海多次。在剛剛結束的2019世界人工智慧大會上,他在題為“智匯健康·預見未來”的分論壇上帶來了主題為“人工智慧在視覺計算和醫學領域應用”的演講。
在此之前,今年7月他在北京大學前沿計算研究中心的一場報告中,帶去的演講主題則是“神經肌肉和感知控制的人體模擬與深度學習”。
事實上,這位有著英國工程院院士、加拿大科學院院士、美國計算機協會(ACM)院士、美國電氣和電子工程師協會(IEEE)院士、加州大學洛杉磯分校(UCLA)傑出教授等多個頭銜,被譽為“計算機視覺領域奠基人”的“泰斗級科學家”,其實有著頗為廣泛的研究興趣:計算機圖形學、計算機視覺、醫學成像、計算機輔助設計、人工智慧……過去40多年中,圍繞這些領域他已發表了300多篇研究論文和多部學術著作。
電影《怪獸電力公司》 來源:豆瓣
有些出人意料的是,由於他在“彈性可變形模型”(Elastically Deformable Models)領域傑出的研究貢獻,2006年他獲得了美國電影藝術與科學學院頒發的奧斯卡技術成就獎。《怪獸電力公司》、《星球大戰》、《哈利波特》、《指環王》、《特 洛 伊》等享譽全球的影片中都有“可變形模型”的技術貢獻。正如他自己所說,“人工智慧是一門涉及廣泛的學科,有包容萬物的胸懷。”
在世界人工智慧大會的主題演講前夕,解放日報·上觀新聞記者獨家專訪了這位依舊年輕的“泰斗”。剛踏進採訪室,特佐普羅斯正坐在沙發上使用iPad。“可以開始採訪嗎?”“稍等,一分鐘就好。”於是,一陣飛快地點選螢幕後,特佐普羅斯把iPad往茶几上一放,露出笑容:“開始提問吧。”
(一)與其擔心機器取代醫生,不如為己所用
此次特佐普羅斯帶來的演講題目與他近期的研究息息相關。由於近年來影像識別技術的飛速發展,加之世界範圍內積累了大量醫療資料,醫學影像便有了巨大的驅動。而計算機視覺技術在影像分割、配準、影像的重構、建模、運動模型分析、輔助診斷、治療過程跟蹤等方面,都能為醫護人員釋放巨大的勞動力。
上觀新聞:您最近提到,深度學習正為包括計算機視覺在內的許多領域帶來變革。事實上,過去的視覺影像模型都是由人類發現,而現在人們透過訓練機器來“學習”模型,甚至構建模型。您覺得有一天機器會取代人類,成為新模型的構建者、發現者嗎?畢竟機器的學習速度和效率都遠高於人類。
特佐普羅斯:這個問題可以這樣來看:過去放射科醫生做的許多工作其實都很瑣碎,比如要查閱、分析無數張X光片,這些都靠人工完成。尤其是影像分割(Segmentation),這是一件非常瑣碎的工作。相比之下,機器就很擅長處理這些繁瑣、重複性工作,這是機器對醫生的日常作業產生的一個很重要的潛在影響。
然而,我覺得與其說考慮機器是否會取代人類醫生,不如說我們正用機器不斷創造新工具,幫助醫生更好、更高效地完成工作,將醫生的勞動力充分釋放,讓他們投入到要求更高的工作中去。
上觀新聞:您的演講中提到,現在醫學影像已經由資料驅動(Data-driven),包括您30年前發現的“可變形模型”,現在也透過對資料的訓練來不斷精益。所以,資料驅動的醫學影像和傳統醫學影像,兩者最大的不同是什麼?這些不同對人類尤其是病患來說,有哪些影響?
特佐普羅斯:資料驅動的方法中包括了很多機器學習技術,這些技術來自對資料的不斷訓練。比如在醫學影像領域,以前許多影像都靠醫人工去分割,現在我們嘗試讓機器從海量的影像中學習醫生分割影像的手法。
但獲取海量的醫學影像並非暢通無阻,需要考慮病患的隱私安全,避免個人資訊洩露。因此,資料的獲得、選取以及決定究竟要讓機器學習哪一部分資料,都需要充分考慮,也需要一定成本。
還有一點要說明,透過大量的資料訓練達到機器學習目的,這在醫學影像領域目前仍是小範圍探索,並沒有擴張到整個醫學領域。但在其他社會領域,機器學習技術有機會迅速大面積普及。比如人們現在經常獲取社交網路資料並進行分析,輔助商業、學術、城市管理等工作。這一類資料不僅數量龐大,並且大多都很有用。但在醫療領域,訓練資料不是一件那麼容易的事。
(二)人工智慧正在改變科學家研究方式
1987年,特佐普羅斯與研究夥伴合作提出了著名的“主動輪廓模型”,透過識別物體輪廓,用不同顏色的線條勾勒出輪廓平面,然後使用影像分割法進行3D重建。由於重建後的模型富含各種彎彎曲曲的線條,這一模型也被稱為“Snakes”,即中文裡的“蛇”。
“Snake模型”的提出不僅使各種基於主動輪廓線的影像分割與識別方法蓬勃發展,也非常有力地推動了此後人們在神經網路方面的研究——神經網路,正是人工智慧最核心的研究領域之一。
1997年,加拿大約赫湖,右二為特佐普羅斯
上觀新聞:若現在回顧一下您的研究歷程,您是否曾意識到,三、四十年前您的一系列發明發現,其實就是今天我們所說的“人工智慧”,只是當時人們還沒意識到這一點?
特佐普羅斯:的確如此。人工智慧其實在上世紀50年代就已經誕生,到了60、70年代,開始大量運用於醫學領域。我在上世紀70年末代開始研究醫學影像分析,在那個年代,模式識別法(Pattern Recognition Methods)、分類識別法(Classification Recognition Methods)是主流。今天基於統計學的機器學習法,其實和那個年代的方法有諸多相似。我們現在同樣要訓練資料,透過統計學方法用資料建模,然後訓練機器智慧去建立分類模型。
神經元樹突組織的snake模型
上世紀70年代之後,我開始對物理空間感興趣,也就是用可變形模型來進行影像分析。如今這些早期模型都已經與機器學習整合,我們現在研究中獲取的新模型,就是“新”與“舊”的綜合。
上觀新聞:那麼,與上世紀80年代您發現”Snake模型”的過程相比,如今深度學習等技術是否已經改變了科學家探索世界、獲取新發現的方式?
特佐普羅斯:人工智慧的確改變了當今科學家展開發明發現的方式,尤其人工智慧目前在科學領域的運用非常廣泛,比如科學家們常藉助AI技術發現新藥、做基因序列分析、天文學成像等,運用人工智慧完成影像分析更是常見。
沒錯,AI可以運用、結合到很多領域,科學和工程學領域是目前應用最多的。當然,過去的很多“老”辦法至今仍然實用,尤其是我剛才說的新老辦法結合,這令今天的科學家們同樣感到振奮,也是未來機器學習取得更好效果的主要趨勢。
(三)中國企業逐漸找到細分市場
特佐普羅斯目前擔任UCLA計算機視覺與圖形學實驗室主任。2016年,他與自己的中國學生丁曉偉一同創辦了醫療人工智慧企業體素科技。這家在上海和洛杉磯擁有“雙總部”的企業,目前在上海的辦公室位於浦江鎮,50餘名員工大多為技術研發人員。公司主要研究方向為人工智慧與胸部CT、眼底彩照、冠脈CTA、皮膚病診療結合,提供全病種解決方案。
“全病種”是否意味著“大而全”?這一點引起了記者的興趣。
上觀新聞:從您的觀察來看,中國的人工智慧醫療影像產業目前發展情況如何?我們已經瞭解到不少利用眼底成像技術篩查糖尿病等慢性病的企業,您覺得目前各個企業是在一窩蜂地湧向同一風口,還是已經逐漸找到了自己的市場定位?
特佐普羅斯:從我的觀察來看,大部分中國企業已經找到了細分市場。哪怕是像體素科技關注的整體診斷,其實也是基於清晰的三條研發線和一條產品線。對皮膚狀況的研究就是面向消費端的應用產品,透過手機APP拍攝照片來檢測皮膚狀況。
有些企業專注於眼底識別,做到了專業和精細。我們的研究則基於不同狀況和環境進行分析,比如在放射學領域我們關注的不僅是肺部,而是從整個胸腔的影像呈現來判斷肺部整體健康情況。無論是做CT、核磁共振還是照X光,最後都透過整區域檢查來完成一個複雜的醫學影像分析——這就是我們技術的“細分領域”。
3D捕捉人體運動為《指環王》等影片服務
醫學成像資料訓練
上觀新聞:您最近在醫學影像領域的研究重點是什麼?近年來人們對醫學影像診斷糖尿病、肺癌等疾病癒發熟悉,所以醫學影像的發展趨勢是更用於常見病,還是更多用於罕見病的篩查?
特佐普羅斯:這個問題其實與資料訓練有關。常見病在病理資料中更具有代表性,罕見病的資料則相對少很多,因此資料從數量上就存在不平衡。然而,機器學習所需的資料要確保全面,因此這也是醫療領域獲取機器學習資料較困難的一點。
現有趨勢是運用監測手段,讓機器學習還沒有被標記的訓練資料。比如使用生成模型(Generative Models)去生成訓練資料,這樣機器就能從少量的、未被人工標記的資料中,分析整合出已經有訓練標記的資料,促使機器學習有更好的表現,產生更強大的醫學影像分析演算法。
用超聲波偵查舌頭的運動
(三)讓“蘇利文”的毛髮成真用了20年
在加拿大麥吉爾大學攻讀本科期間,一節選修課讓特佐普羅斯第一次感知到人工智慧的魅力,進而繼續攻讀碩士學位,並由此找到了自己終其一生的研究方向:計算機視覺與圖形。
年輕的特佐普羅斯
1984年,特佐普羅斯從麻省理工學院獲得了人工智慧博士學位。三年後,他在發現彈性可變形模型的過程中,與研究者們首次使用物理建模方法模擬了模擬布料。2001年皮克斯出品的動畫電影《怪獸電力公司》中,主人公小女孩阿布身穿的粉紅色睡衣、“怪獸”蘇利文身上軟乎乎的藍色皮毛,均透過基於可變形模型的計算機模擬生成。
上觀新聞:你對可變形模型的研究為你和研究夥伴贏得了一座奧斯卡技術成就獎,這對你來說是個意外嗎?你覺得下一個讓你因為研究獲得“意外之喜”的領域會是什麼?
特佐普羅斯:其實上世紀80年代中期,我就開始研究計算機影像。當時我們希望透過這一技術模擬人的動態,所以我們就從模擬人的體態著手,我獲得的這座奧斯卡就來源於對《怪獸電力公司》等電影中人物衣服布料的模擬。現在這項技術已經被廣泛運用於皮克斯乃至整個好萊塢的製作公司,全世界都在使用基於彈性可變形模型衍生出的各種技術手段。
電影《怪獸電力公司》 來源:豆瓣
所以,對電影產業的貢獻和得到的認可並非意外,而是都在我們的計劃之中,是一步一個腳印才達到的。從最早的技術發明,到最終被全世界廣泛應用,當中差不多經過了20年。所以,一項技術的橫空出世到廣泛應用,真的需要時間,需要人們的耐心。
同樣,我現在研究的人工智慧與醫療的結合也需要時間。或許10年內我們就能看到巨大的進步。又或許20年後,會出現我們現在想象不到的發展。
上觀新聞:您在自己的求學時代就找到了伴隨一生的興趣點,人工智慧。在中國,也有很多年輕學子對學習人工智慧感興趣,有什麼想對中國學生說的?
特佐普羅斯:人工智慧是一個非常令人興奮的領域,也是一們涉及面很廣的學科,可以實現很多交叉學科的成果,把AI技術運用到不同領域。它很值得學習,因為有很多揭露深層次問題的學習領域正等待未來的年輕學子們去研究和解決。
有一些說法稱人工智慧是“解決世界所有問題的鑰匙”。不錯,過去十多年來AI的發展進步了不少,尤其是最近十年,因為深度學習的出現,AI的發展取得了長足進步。但仍有許多充滿挑戰的問題等待未來的人才們去解決。