近日,由阿里雲與上海瑞金醫院、阿里健康聯合舉辦的新一輪天池大賽——“瑞金醫院MMC人工智慧輔助構建知識圖譜大賽”決賽結果頒佈,來自哈爾濱工業大學、北京大學、江南大學年輕的學者團隊在近2000名開發者中脫穎而出,分列前三名。
在人工智慧此類前沿技術領域,擁有25萬開發者的天池平臺集眾人之智慧產出了怎樣的結果?以技術為實力比拼的比賽成果又如何與企業、醫院結合應用到實際?在本次釋出的大賽成果轉化產品——國內首個“基於機器智慧的糖尿病領域知識圖譜”中,我們找到了答案。
內分泌醫生缺口大,機器可替代重複性工作
“我的爸爸就是一名糖尿病患者,最初參賽是因為他,我希望能夠利用我所掌握的技術,幫助到更多像他一樣的糖尿病患者。技術的存在本身不該只為炫技,應該為全人類做貢獻。”在談到參賽初衷時,一位參賽的開發者表示。
根據IDF釋出的第八版全球糖尿病概覽中顯示,2017年中國1.144億糖尿病患者人數位居全球第一,即便按照1個醫生管理1000人的需求推算,也需要10萬醫生。而如今,我國內分泌醫生遠遠達不到10萬,導致很多糖尿病患者不能享受到較好的慢病管理服務,而不同層級的醫療機構,對糖尿病慢病診治水平參差不齊,也影響了糖尿病患者的治療體驗。
為了能夠以最高的效率達到更好的糖尿病管理效果,中國工程院院士、上海交通大學醫學院附屬瑞金醫院副院長、國家代謝性疾病臨床醫學研究中心主任寧光發起的國家標準化代謝性疾病管理中心(MMC)採用一體化的診療流程,將糖尿病管控做到標準化。
MMC採用1+x模式,即一家MMC的中心醫院與它周圍的多個社群醫院相聯絡,形成“從國家級MMC中心到MMC中心醫院再到多個社群衛生中心”的病人雙向轉診就醫模式。因此,醫生數量尤其是基層醫生數量不足、專業水平參差不齊等問題,就成為影響糖尿病患者的治療康復一大掣肘。
寧光院士表示:“基層醫生尤其是全科醫生,需要處理很多種疾病,往往無法達到“術業有專攻”。如何讓基層醫生也能夠像專科醫生那樣處理這些疾病的狀況,這是MMC需要解決的非常重要的問題。”
此外,醫生大量的從事重複性的工作,長期的疲勞容易造成漏診、誤診,“如何讓已經形成重複性勞動的事情,更多地讓機器完成,而讓醫生更多考慮疾病中不規律的情況,是疾病治療很重要的部分。”
首個糖尿病知識圖譜出爐,助力瑞寧助糖優化用藥方案
2018年9月,阿里雲天池大賽就發起了用人工智慧輔助構建糖尿病知識圖譜的挑戰。在過去半年時間裡,吸引了中國、美國、日本、丹麥、新加坡等8個國家和地區共1629支隊伍、1817名開發者參與。
其中,吸引的團隊除了北京大學、浙江大學、哈爾濱工業大學、新加坡國立大學等國內外知名高校,還不乏國內眾多企業的身影,在產業內也受到極大的關注。
大賽主辦方瑞金提供與糖尿病相關的學術論文以及糖尿病臨床指南。第一賽季課題為“基於糖尿病臨床指南和研究論文的標註構建”,要求選手在學術論文和臨床指南的基礎上,做實體標註;第二賽季課題為“基於糖尿病基於糖尿病臨床指南和研究論文的實體間關係構建”。選手將從中抽取實體之間的關係。通過初賽、複賽與決賽答辯,綜合線上提交結果評分和線下答辯角逐冠軍。
賽題組通過標註工作,形成國內糖尿病領域首個文字標註資料集合,標註中文實體近19萬,最終,開發者基於糖尿病相關教科書、研究論文,通過高效的演算法,進行文獻挖掘並構建知識圖譜,與瑞寧助糖深度融合,加速產品迭代。
時間拉回到2016年,寧光團隊與阿里合作,首次釋出“瑞寧助糖”,這是一款糖尿病醫生AI助手,它由經驗模型和知識模型的兩部分機器學習構成的軟體系統。
其通過人工智慧深度學習的方式,以1000多份真實的糖尿病病例,加上300位的糖尿病醫生的經驗形成經驗模型,同時,融合各種糖尿病指南和國內外文獻檢索資料庫形成知識庫,以及綜合糖尿病可能導致的血脂異常、高血壓、肥胖等100多種併發症的發病原理和標準化臨床資料,進而對為醫生給出診斷建議。
在經歷過數次的迭代之後,此次應用天池大賽知識圖譜構建成果的“瑞寧助糖”,三年後又迎來了一次重要的轉型升級。
阿里雲演算法專家顧斐在展示成果時表示,知識圖譜的作用在於以下三點:一是其能夠電子病歷、科研論文這類非結構化資料做成結構化,“這是作為下一步人工智慧研究非常必要的步驟”;二是知識圖譜能整合各類文獻資料,將實體關係抽離出來;三是構建知識圖譜的過程為後續人工智慧輔助診斷和智慧用藥推薦提供了堅實的基礎。
知識圖譜示例,企業供圖
以實際操作為例,首先在“瑞寧助糖”介面輸入患者相關的資訊及症狀後,對血糖血脂等測試結果做出糖尿病及其併發症的判定;第二步,給出供醫生參考的治療建議,基於海量醫學指南和學術論文,提供標準化糖尿病用藥建議;最後,點選具體推薦藥物,便可連結到以該藥物為中心的知識圖譜,包括藥品名稱與疾病、藥品名稱與副作用等實體關係。此外,介面右側會顯示與藥物相關的最新研究文獻,並隨著資料庫的更新而實時更新。
如在輸入某個病歷後,出現Ⅱ型糖尿病的用藥推薦,其中,包括二甲雙胍或阿卡波糖,在點選阿卡波糖後,會出現以“阿卡波糖”為中心的知識圖譜,在實體關係中,就包括“腹瀉”這一副作用,而右側同樣會顯示與“阿卡波糖”相關的文獻,給醫生形成參考。
模擬專家演繹,輔助基層醫生科學決策
知識圖譜本質上是一種語義網絡。 其結點代表實體(entity)或者概念(concept),邊代表實體/概念之間的各種語義關係。
阿里巴巴達摩院醫療健康負責人謝宣鬆認為:“人理解知識很多是單線條的,而知識圖譜是一張‘交叉的網’,本身關係就很複雜,又有很強的專業性,每一條文字都跟人的生命健康緊密相關,又包含了海量的資料,因此在構建醫療知識圖譜的過程中,每一個環節都有其特殊的難點。”
要構建醫學的知識圖譜,尤其是糖尿病領域的知識圖譜,其難點在於:1.在臨床中,大量的醫療文書是以文字形式存在,不僅海量且非結構化,提升了文字處理的難度;2.糖尿病對應的慢病是週期性很長的疾病,每個階段不同症狀對應的知識點可能是有所區別的,另外,糖尿病是併發症最多的慢病之一,每一個併發症都會對應不同的只是體系,導致整個知識圖譜構建的內容和規模就會遠遠大於一般的疾病。
通過對近19萬資料的標註,糖尿病知識圖譜的構建促使瑞寧助糖實現結構化能力升級,並有效幫助醫生修正給病人的用藥方案,優化藥物方案。
此外,在醫生培養方面,除了對已有文獻的知識進行總結之外,通過演算法,瑞寧助糖還能挖掘新的知識,從而建立新的關係。如果有新的臨床研究出現,通過人工智慧的標註和知識圖譜的貢獻,將有可能發現潛在的關係,從而幫助醫生實時更新醫學知識。
阿里健康醫療大腦負責人範繹表示,計算機能夠輔助知識的獲取和知識判定的過程。相當於建了一個更加好用的“醫學字典”,而這個“醫學字典”的載體是計算機,計算機又通過自己的判定呈現出文字的形式。就像醫生用自己的知識演繹出對疾病的判定,以相同的方式呈現。
寧光院士表示,構建糖尿病的全面知識圖譜,有助於形成糖尿病預測、干預、監控、教育等閉環管理,能最大程度還原專家在治療糖尿病時的用藥思路,輔助基層臨床醫生做出更科學的決策,提升用藥技能,將進一步提升就診效率、降低就醫門檻。同時,對於糖尿病醫學科研也有重大意義。
“醫學的病史資料如何能被很好的使用,很重要,但之前我們做得並不好,如果能夠在現有資料的基礎上利用起來,在幫助醫生成長和診療方面,有重要的意義。”
據悉,升級後的“瑞寧助糖”預計3月份首先在瑞金醫院使用,5月份正式上線,並進一步推廣到全國,服務更多的醫生及患者。
——“請問瑞金醫院的資料能儘快公開應用於學術研究嗎,迫切期待,感謝!”
在決賽結果頒佈的三個月前,有網友在該比賽的論壇中,發表了上述的帖子。可見對於資料集的開放,早有需求。此次天池大賽標註的近19萬中文實體,是人工智慧在醫療領域應用最為基礎和關鍵的資料集,具有極大的科研和應用價值,有望成為糖尿病人工智慧領域的標準。
“我們的宗旨是始於比賽,終於生態,希望通過我們的平臺能夠搭建生態環境,來對接我們醫學工作者和人工智慧的開發人員。”顧斐如是說。
此外,他透露,近期還會舉辦多場醫療相關的天池大賽,作為一個面向全球人工智慧專家及技術愛好者的開發者社群和眾智平臺,目前天池平臺上活躍著全球範圍內超19萬名技術愛好者、200多家大資料領域的創新創業團隊,到2020年,該平臺或將培養30萬位AI工程師。
“我們希望可以往更垂直化的方向發展,包括一些創業公司,他們慢慢開始醫療和人工智慧相結合方向的研究或者是進行創業。”屆時,會有更多的比賽成果轉化為實際應用,協助醫生提高臨床診療的效率,成為更好的醫療工具。