報導 | 微胖
智慧與醫療,正成為人工智慧時代重頭戲。
2017 年被認為是「人工智慧應用元年」,亦是人工智慧發展的拐點。7 月 9 日,全球人工智慧高峰論壇暨中國(杭州)人工智慧小鎮啟動儀式在杭州召開。在本次論壇的「人工智慧醫療健康分論壇」上,專家、學者以及業內人士就人工智慧在醫學領域應用展開了交流。
據近期普華永道報告分析,2030 年之前,中國和美國將成為從技術浪潮中收穫最多的國家。未來的 13 年內,人工智慧將增加中國 7 億萬美元的 GDP,經濟增長達 26%。其中,醫療成為人工智慧最富變革力領域之一。醫療領域是典型資料密集型行業,在智慧化時代,資料生成速度的提升也帶來了醫療資料積累量的大幅增加。尤其是在基因和醫學影像領域,人工智慧技術極大加快挖掘提取深層次資訊的效率,由此也釋放出大量創業和商業機會。
過去十幾年,中國醫療行業的資訊化也積累了大量歷史資料;人工智慧技術也取得了巨大進展。場景、資料、技術的具備為行業變革奠定了基礎。中國醫療行業也面臨不少問題,比如,中國醫療資源總量不足、分佈不合理、優質資源匱乏。看病難、看病貴的問題的核心表現為供需矛盾,資源嚴重不足。另外,醫療失誤造成大量生命和財產損失,數字同樣讓人驚心。全球每年有 4300 萬人受到醫療失誤的波及,其中大部分發生在中低收入國家。
資料顯示,2017 年第一季度有 30 多家人工智慧企業獲得融資,醫療健康領域的人工智慧創業公司表現尤為突出,關注度和融資量最高。「當我們把目光聚焦向人工智慧醫療健康領域,不難發現人工智慧已經應用到醫學影像識別、疾病輔助診斷、外科手術、基因測序以及醫療大資料等許多方面。未來五年,醫療健康將會是人工智慧最重要的應用領域之一。」
在本次論壇的「人工智慧醫療健康分論壇」上,「人工智慧+醫療」領域的首個產業聯盟——健康產業人工智慧技術創新聯盟在本次論壇上正式成立。健康產業人工智慧技術創新聯盟由科大訊飛、復星醫藥、德勤諮詢、思創醫惠、榮之聯、Boston AI、浙江智慧財產權交易中心、杉杉醫療、貝殼社等單位聯合發起,旨在打造醫療人工智慧應用聚集地,搭建醫療人工智慧產業生態鏈示範平臺和中國醫療人工智慧核心技術平臺。
一、專家把脈,醫療行業的人工智慧應用存在四大痛點
在醫療領域,人工智慧技術應用存在四大痛點,麻省理終身教授、波士頓人工智慧實驗室主任曹漁在題為《端智慧在醫學領域的應用》的發言中談到。針對這四大痛點,他認為端智慧在中國醫療領域當中會大有可為。
曹漁談到,所謂端智慧,是指把人工智慧的演算法、架構部署在終端,在終端領域,執行我們的計算。在這種情況下,我們可以保證我們的計算不依賴於網路,同時我們可以實現實時的資料處理。更重要的是,我們可以保護使用者的隱私,而且實現個性化的定製。在這基礎上,有可能產生很多新的商業模式。我們認為,端智慧是推動垂直領域人工智慧化最重要的技術之一。
2016 年美國的主流 ID 廠商逐步佈局邊緣計算和端智慧。在過去的一兩年之內,大概有近 20 家與端智慧相關的企業獲得超過 5 億美元的融資。在 2017 年到來的時候,邊緣計算已經迅速發展成為 10 億美元的技術市場。近期,微軟公司宣佈進行重大轉型,專注雲端計算和端智慧也是未來的方向之一。
那麼,人工智慧的醫學應用存在什麼痛點呢?
首先,異構資料普遍存在。在醫療領域有醫療影像、影片資料、音訊資料、結構化資料、非結構化資料、文字資料。每一種資料的處理方式、儲存格式、傳輸方法、演算法都不盡相同。不可否認,一旦理順了多格式,多源頭,呈爆炸性成長的大資料的整合和分析,醫療大資料將對提高醫療質量,強化患者安全,降低風險,降低醫療成本等方面發揮無與倫比的巨大作用。但是,怎麼樣能夠開發一個有效的人工智慧的系統,能夠把這些多模態的資料利用起來,作出更好的診斷和治療,這是非常有挑戰性的任務。
其次,有效資料的缺失。其實,很多應用裡面其實沒有大資料,只有小資料。如何解決?當我們只有小資料的時候,仍然希望能夠訓練一個很好的模型。在這種情況下,用遷移學習的方法就可以做到用一個領域的大量的資料,透過遷移學習的方法,到新的領域進行學習,達到類似的效果,解決小資料訓練問題。
第三,缺乏個性化模型。其實這和精準醫療密切相關。精準醫療的目的是實現千人千面,但離我們的目標還有一定的距離。可以用增量學習的方法,來解決個性化模型定製問題。所謂「增量學習」,是指最開始的時候,用資料學到一個通用的模型,這個通用模型會教給使用者和病人。在跟病人進一步互動過程中,我們用增量學習的方法更新模型。在這種情況下,我們就可以定製一個模型。比如說一種治療的方法、一種診斷,在某一個病人的手中,經過一段時間的互動,經過一段時間的資料積累,它的模型會發生變化,實現理想中的千人千面。
第四,技術架構和系統功效。在傳統的雲端計算裡面,在雲端有很強的計算能力,不用考慮功耗。但是,在終端必須考慮功耗,我們手機一天要充電,在這種情況下我們必須考慮到如何重新開發技術架構,使系統更高效。特別是在傳統雲端計算裡面,資料要傳到網上,傳到雲端。但是,很多醫院不允許把資料傳到雲端,即使傳到雲端,也存在很大的隱私洩露的領域。所以在醫療領域,我們希望把資料留在本地。問題就出現了,怎麼樣才能使本地計算更有效、高效地技術?這是我們認為具有挑戰的方向。
端智慧如何解決醫療中的技術挑戰?簡單來說,將人工智慧演算法部署在醫療的終端,實現本地計算和個性化模型的定製,從而確保病人的隱私和資料安全,從高層次角度解決醫療技術的挑戰。
二、科大訊飛佈局人工智慧在醫學影像中的應用
貝殼社創始人姜慧霞在《共建醫健人工智慧產業加速生態系統》的發言中指出,從統計出來的過去融資的輪次來看,很多都是很小的公司,或處在初創早期,可能也就是十幾個人,或者更小。大部分處於 A 輪、B 輪,很多都是天使輪。但是,越來越多的大公司關注人工智慧,更多跟人工智慧專案或者團隊進行一些合作。另外,市場增長,到 2018 年市場規模達到 200 億,增長率達到 40%,「未來 4-5 年,會有一批偉大的人工智慧公司創立。所以人工智慧特別是在醫療領域的創業,它其實剛剛開始。」
普華永道報告分析指出,人工智慧覆蓋領域中,最具潛力的三個醫療領域之一就是影像診斷(影像診斷,病理診斷)。人工智慧在醫學影像中的應用,也是我們最為熟悉的。比如,最近吳恩達領導的史丹佛大學機器學習組開發了一種深度神經網路,從心電圖中識別 14 類心律不齊;年初,史丹佛大學一個聯合研究團隊開發出了一個皮膚癌診斷準確率媲美人類醫生的人工智慧,相關成果刊發為了 1 月底《自然》雜誌的封面論文;FDA 首次批准了一款心臟核磁共振影像 AI 分析軟體,等。
科大訊飛鹿曉亮介紹說,除了將訊飛最擅長的語音技術用到醫療,幫醫生寫電子病例和醫療文書,醫療影像的服務診斷系統也是科大訊飛的佈局重點。
訊飛一直有關注計算機視覺領域,也一直有計算機視覺團隊,有不少同事在從事這方面的工作。公司實際上擁有比較強的包括人臉識別、OCR 等在內的技術。訊飛系統不僅要能夠處理這個人的胸片或 CT 影像,還要同步處理他的其他非結構資料,把這些資料融合在一起,最後幫助醫生做一個整體的判斷跟方案的建議,這個是訊飛與其他公司的最大不同。科大訊飛希望把這樣的技術應用到醫療領域,幫助以後找肺部 CT 結節,幫醫生看骨科的片子。在這些領域,機器可以做得比人類更好。
目前,人工智慧在醫學影像中的應用主要就是輔助醫生做診斷,讓醫生做診斷的時候做到有理有據,從而減少誤診、漏診率。從影像方面的誤診人數來看,美國每年的誤診人數達到了 1200 萬,中國因為人口基數龐大,達到了驚人的 5700 萬/年,這些誤診主要發生在基層醫療機構。電子膠片的廣泛使用使得醫學影像資料大幅度增長,美國的資料年增長率達到了 63.1%,在中國也達到了 30%。放射科醫生的年增長率美國和中國僅只有 2.2% 和 4.1%,遠遠低於影像資料的增長,形成巨大缺口。這意味著醫師工作量大增,判斷準確性下降,藉助人工智慧對影像進行判斷可以有效彌補該缺口。
科大訊飛在醫療上的佈局,其實除了這些,還立志做好醫生的助理。據普華永道分析預測,這屬於高潛力的用例。也就是說以資料為驅動,透過將患者的病史作為基準,調查偏差資料或標識,這樣的診斷方式在初始階段將是人類醫生的助手,並不能替代人類醫生。但是,能提高醫生的診斷效率和準確度,AI 在此過程中也能不斷學習、改進,人類醫生和 AI 診斷的結合,將提高系統的準確性,隨著時間的推移,人類將有足夠的信心,將診斷任務完全委託給 AI 系統,讓 AI 自主操作。
據鹿曉亮介紹,現在他們在一步步地紮實工作。比如,他現在給研究院設定一個小目標,就是到今年 8 月底,人工智慧系統要能夠透過中國職業醫師職業考試筆試。就是 600 道選擇題,現在醫學院學生或者社會上的人只要 360 分能透過考試,希望科大訊飛的人工智慧系統 8 月底能考到 400 分。
三、基因資料規模激增,創業公司瞄準資料分析瓶頸
隨著基因檢測的價格不斷降低和日益普及,基因領域資料規模激增,如何這儲存、分析以及解讀成為行業必須要突破的瓶頸和壁壘。目前在中國只有少數的頂端的三甲醫院,甚至一些頂端的醫學團隊才能夠分析這個技術。創業公司希望藉助人工智慧讓這些技術惠及大眾。
與會的北京基雲惠康的郝向穩介紹說,公司雲分析服務專注於個人全基因組資料分析。基雲惠康屬於 SaaS 服務,以阿里云為基礎,針對全基因組資料,提供更快,更低成本的最佳化服務,主要服務 B 端使用者。「全基因組資料分析和解讀,涉及 90 個 GB 的資料,有 2 萬多個基因。我們要對這些基因做一個全面的解讀,裡面涉及到非常多維度的資料,不光是 DNA 序列,還有人的表情資料。針對那麼多維度的資料進行分析,不是我們原來說的做一個簡單的統計分析,就可以把這個事情完全做完。」
上海易瑞生物科技有限公司呂暉介紹說,易瑞也是以基因檢測為基礎,用資料分析和人工智慧做個性化的健康和醫療服務工作。「基因資料有非常豐富的資料,但解讀出來的部分其實很少。而且這個解讀,也是全世界分子生物學家用幾十年時間解讀出來。所以現在到了這個時間點,我們覺得到了人工智慧開始介入部分了。我們一方面的技術是做基因組,還有是其他多組學的整合,這是資料方面的發展。」
聚道科技的業務更加底層,為基因領域搭建雲環境。2014 年,一批阿里出身的技術團隊成立了基因大資料計算服務平臺聚道科技。李廈戎介紹說,聚道科技在基因領域幫助企業解決精準資料及大規模的資料計算,包括更多表情資料整理、整合的需求。背後的資料包括資料的傳輸、分散式儲存和計算的技術,還包括資料的管理以及怎麼樣提供一些協作化、標準化的資料標準和計算的標準。另外,公司也可以再跟一些臨床機構合作,做一些基於人工智慧的,對遺傳性疾病和罕見性疾病的基因推斷。
目前,大多數企業都還是 A 輪或者 A 輪以前的初創公司,市場還屬於醞釀階段,大部分仍聚焦資料分析環節,雲服務是一趨勢。
四、展望未來,職業替代還太早,資料難題不可忽視
在分會場的圓桌論壇上,大家討論了人工智慧對醫療領域醫生職業的影響以及對行業未來的展望。
人工智慧技術會對醫生職業產生怎樣的影響?
德勤中國創新領導合夥人馮曄談到了德勤的經驗。他說,德勤很早就已經引入了科技,我們自己在做一些機器學習,審計或者稅務甚至律師大型的文獻,或者說文件都是用機器讀的。最近,大家可能在網路上看到很多財務機器人,也是我們創新中心一起研發了。我們現在有一個很好聽的名字,我們叫機器為「小勤人」,當然我們也希望走出財務和稅務機器人的範疇,向醫療健康領域發展。
人工智慧的出現,很多人職業會消失?首當其衝的就是財務、會計、稅務或者一些重複勞動的工作。我們自己也在分析自己公司一些工作的性質,比如說像審計。審計最痛苦的是在什麼時候?就是在最後的出報表的時候,大家大量的時間用於加班,大量的時間用於對賬、對資料,包括前期大量的時間在抽樣板。其實,我們已經採取了很多的方式,比如數字分析、數字挖掘的方式,包括我們自己也開發了報告系統,一鍵生成的報告系統,只要有三張財務系統,至少可以把整個審計報告的數字部分全部放進去,而且前後沒有偏差。大家也知道審計報告前後有多級關係,如果讓系統去做這個事情,未來可能人工智慧來做事情,這個時間就不需要了。
有那麼多時間被節省下來,那人員的成本應該下來了?目前來看,不是那麼明顯。事實上,你可以把重複勞動時間轉化為為目標客戶提供更多價值的時間,更多地瞭解他的業務,更多和他分析他的業務,以及去探索他的商業模式,找出他目前碰到的一些問題。我覺得從這一點來講,招募一些相對來說低階別的人員,每年數量已經下降。我們的業務(客戶群)其實在增長,其實從這方面來講,相對來講,我們的人數在這方面已經降低了,其實我們只是把一些重複勞動的事情轉化到了更有價值的能跟客戶互動的事情上來,這是我們想做的事情。使用高科技,來為客戶提供高價值的服務,這是我們的目的,正在這個過程當中。未來的趨勢都是這樣的。
德勤也在跟醫院直接合作,我的感覺是,人工智慧是導致社會現有職業的消失,我不認為這個職業會完全消失,但是,這些人的工作性質會發生變化。比如說影像讀片的人,還包括做基因分析也是一樣,他中間有很大一部分是重複工作。一個是他需要很強的記憶,又需要不知疲倦地做,這一類工作會被機器很快地代替。如果這個職位,當年是因為這個技術比較好,不幸的是你要學新的技術了。
另外,我感覺在最近的將來,這些職業不會完全被代替,因為它還要跟人打交道,這其實就像交通的「最後一公里」,這最後一公里很難做,還是需要人做的。就像遺傳諮詢師,以前為什麼他難培訓?因為他掌握基因知識需要很長時間。在人學起來非常困難的一部分,機器很容易代替,我們現在開發的系統也是這樣,就是基於基因型的表情輔助診斷,醫生就會很快明白。以後醫生諮詢師的時候就會集中在怎麼從現有的知識和病人的溝通上,而不是花在查詢文獻和知識庫上,然後判斷這個知識到底是對還是錯。所以,我認為這方面,他不會完全消失,但是他的工作會有改變。
聚道科技的李廈戎認為,從基因領域來講,其實基因領域有大量的未知,這些未知是需要人去利用,而不完全靠機器理解。所以,從某種程度上來講,這個領域還存在著大量的機會,需要更多人去加進來,而不是減少職業,需要更多的職業會出現。其實像常規的遺傳諮詢,它會自動化做一些分析。但其實還會存在大量的罕見性和疑難的病例,這些病例可能就需要很多背景更加強的遺傳專家,甚至一些研究人員進一步研究背後生物學的機理。這時候,需要大量人去參與。
科大訊飛的鹿曉亮表示,人工智慧也只是一項技術而已,它跟其他的產業革命相比,沒有什麼過人之處。現在的人工智慧要真正讓我們的機器有意識、有感情,這還離得遠。包括剛才說的人工智慧有可能會代替放射醫生,幫助醫生閱片。這些知識在非常垂直的領域,對醫生來說是一個非常繁重、非常繁雜的工作上,我們的機器有可能會代替人類。整體而言,現在人工智慧是處在弱人工智慧的階段,它沒有通用性,不像人類大腦一樣有通用性。我們語言識別系統,識別中文可能識別得很好,讓它識別法語,就會識別得亂七八糟。所以,這是目前人工智慧發展的階段,我們把它定義為弱人工智慧階段。現在很多人工智慧威脅什麼,這些東西現在為之過早。但不可否認的是,我們現在的人工智慧即使只能做某一個垂直領域的工作,它也是可以在這個領域裡面做得比人類好,可以在某一個具體點上幫助人類,甚至替代人類。
未來五年甚至二十年,人工智慧技術會對醫療領域產生什麼影響?
首先,資料孤島和資料重複性問題。醫療行為過程將醫療大資料分為診療資料、研發資料、科研資料和支付資料四種,而不同的資料型別又在智慧醫療中有不同的價值。比如,診療資料可以為公共機構和醫院提升醫療服務質量提供資料依據,以實現有效的疾病管理和公共衛生建設;同時,診療資料也可以幫助個人進行疾病預防,進行慢病管理。當這些資料在醫療行業充分得以運用就會帶來巨大的經濟價值。
雖然智慧醫療前景廣闊,但是,資料孤島是現階段限制醫療大資料價值變現的首要因素,行業割據又加劇了資料孤島的惡化。由於缺乏統一的醫療資訊平臺,不同的醫療機構之間、不同的區域醫療資訊化平臺之間都存在資料割裂,甚至個人健康資料也會因為不同的可穿戴裝置而儲存在不同的 APP 上形成資料割裂。資料孤島和行業割據問題,不僅影響了大資料在智慧醫療中的作用,更對提高利用醫療資源效率,實現大資料價值變現產生阻礙。
德勤的馮曄表示,在基因測序領域,現在影像識別都用了很多大資料、雲端計算等等一系列的高科技手段。目前,因為資料孤島的情況是存在的,未來的情況下,這個精準度,尤其是在診療方面,找出一些疑難雜症,透過人工智慧能得到更好的精準度的提高,能解決一些疑難病症,使用人工智慧會更好。
易瑞科技創始人兼首席科學家呂暉表示,從技術來講,確實現階段三五年之內,咱們要解決重複性的問題。因為我們也是著重於收集病人和健康人群的資料,因為有這個資料才能做更好的服務。所以技術上來講,現在需要把這些資料規範化,規範化才能學。但是,在醫療上,目前這個階段,它面對的醫學問題不是一個完全封閉的系統,我覺得在二三十年之後,其實現在人工智慧的理論需要有一個飛躍,我認為,不一定是突破,因為演算法其實已經在那兒。
人工智慧在未來十年、二十年,完全想替代人類和醫生是不可能的事情。但是我希望未來的十年、二十年,每一個醫生都有一個人工智慧的助手,科大訊飛的鹿曉亮表示。從基因應用來說,希望每個人擁有自己的健康管理顧問。