從百度飛槳助力開源肺炎CT影像分析模型,看開發者的“無聲抗疫”

naojiti發表於2020-03-01

進入三月,令人揪心的新冠疫情在國內逐漸得到了控制,春天似乎正在悄然到來。

回首過去的一個月,是中國科技承壓頗重的一個月。不僅大量行業面臨著線上化、遠端化、無接觸化轉型,社會各個環節的防疫工作中,同樣也需要技術能力的支援。彷彿短時間內,社會中出現了無數個大大小小的反應場,考驗著科技能力在其中激發的化學反應。

從目前來看,結果還是超乎意料的。像是短時間內很多人流密集的交通站點部署了AI測溫系統,減輕人工測溫帶來的擁擠低效。也有大量實體商家通過SaaS向電商轉型,以保證商業運轉。同時我們還能看到,AI醫療也正在發揮著作用。就在最近,連心醫療基於百度飛槳開發的“基於CT影像的肺炎篩查與病情預評估AI系統”已經上線並部署在了湖南郴州湘南學院附屬醫院,利用AI醫療影像來提升醫生診斷和評估效率。

藉著這一最新的落地案例,我們不妨來看看,在疫情大考中,百度飛槳交出了一張怎樣的答卷。

讀秒閱片:AI如何改變肺炎診斷

其實產業各個環節的數字化和AI化,已經不算是什麼新鮮的話題。從過去一年開始,很多企業都高舉起AI進入工業大生產的旗幟,開始著手推動產業生產的技術變革。其中醫療影像憑藉著天然的數字化基礎,與AI的影象分析能力又格外契合,其AI化程式自然走在各行各業前方。乳腺影像診斷、眼底影象診斷等等細分領域,都在去年取得了不少落地性進展,尤其緩解了醫療勞動力資源緊張的問題。

就拿這次抗疫來說,肺部CT是新冠肺炎篩查和診斷的重要依據,在治療過程中,醫院還需要在不同階段多次檢查影像以進行對比。但矛盾的是,抗疫時期有大量病人需要護理,醫院工作本來就很緊張,而新增疑似病例也需要儘快篩查以得到適當的治療手段。診斷、病情發展跟蹤、治療效果評估等等任務上都落在了醫療影像上。但人工閱片顯然在效率上有限,並且難以實現一些精細對比需求。

這時連心醫療基於百度飛槳所開發的肺炎CT影像分析模型就可以發揮作用,資料顯示這一系統可在幾十秒內完成對患者CT影像的病灶檢測、病灶輪廓勾畫、雙肺密度分佈直方圖及肺部病灶的數量、體積、肺部佔比等全套定量指標的計算與展示。至於準確率方面,該系統在測試資料集上的病灶檢測精度和召回率分別達到92%和97%,不僅漏檢機率極低,也能很好地完成諸如後續階段性治療效果跟蹤比對這類對於精細度要求較高的工作。同時有了這一系統,一些在基層醫療機構就診的患者也可以通過遠端醫療得到更精準的診斷,進而減少患者在大醫院聚集帶來的風險。

一方面釋放醫院的人力資源,同時提升診斷效率,讓更多患者及時得到治療。可以說在這次抗疫中,AI醫療影像發揮了其一貫的作用。

想要應對這次疫情的挑戰,僅僅靠AI醫療影像“一貫”的作用是遠不足夠的。

我們可以回憶一下,以往AI醫療影像從研發到應用的過程是怎樣的。大多數時候,是行業參與累積一個開放的資料集,經由醫療專家對影象中的病灶進行標註,再將資料集公開開來,以競賽等形式號召科技企業參與攻克。當企業訓練出準確率足夠高的AI模型後,通常還要和一家家醫院進行逐一的落地適配——因為不同裝置在成片解析度上的細微差別,都有可能對模型的準確率造成影響。

這種我們已經習以為常的複雜流程,顯然不適用於新冠肺炎的緊急情況。

鑿井鋪渠:肺炎戰疫背後的百度飛槳

如果說技術本身是滋養一切的水流,那麼從開鑿井口到鋪設渠道,讓水流真正輸入土壤中的整個過程,和水流一樣重要。

這一次連心醫療的肺炎CT影像分析模型能夠快速落地,切實解決抗疫需求的背後,除了醫療科技企業的技術累積,百度飛槳所發揮的鑿井開渠作用。

作為基於產業實踐的開源深度學習開發平臺,我們可以將飛槳之上醫療AI影像技術從誕生到應用分為研發和落地兩個區段,看看百度飛槳是如何在同一時間對兩個區段同時進行加速。

首先是鑿井,也就是研發階段。

醫療AI在研發中最常遇到的困難,就是“技能分配”問題。相信大家在玩遊戲的時候,都遇到過“點技能樹”問題,既選擇修煉A技能後,往往很難在B技能上同樣也達到高水準表現。同樣的,很多醫療AI科技企業在醫療專業能力上非常擅長,但在將專業技術AI化、模型化的工作上,效率就不那麼理想了。例如加快AI模型研發、解決資料樣本少等工作,就很容易對醫療AI企業形成困擾。這時百度飛槳這樣深度開發學習平臺,就能夠提供很好的互補作用。作為AI頭雁企業,百度自然在深度學習、影象識別等等技術上有著更高的建樹,並把這些先進的技術能力通過平臺輸出給連心醫療這樣的開發者。

在這次肺炎CT影像分析模型中,連心醫療就應用了百度飛槳提供的PaddleSeg開發套件。PaddleSeg的一個重要特點,就是內建了十餘種資料增強策略。新冠肺炎這樣需要在短時間內部署應對的新型疾病,在模型研發時最容易遇到的問題就是資料樣本不足。這時PaddleSeg的資料增強能力就可以很好的發揮作用,通過對原本資料樣本的處理,擴大樣本集來提升模型訓練效率。同時PaddleSeg還具有模組化設計的特徵,包含了數種主流分割網路,並打包成了“即拿即用”的形式,極大地簡化了模型開發的複雜程度,讓連心醫療這樣的企業可以將更多精力投入在病理表現、病灶形態等等更切合醫療專業的地方。

鑿井之後的開渠,也就是這次肺炎CT影像分析模型所面臨的最大挑戰——落地。

為一家醫院開發一套AI閱片系統並不困難,但面對新冠肺炎這樣覆蓋全國乃至世界的傳染病,顯然需要的是將這一系統儘可能的佈設到更多醫療機構中,才能為整個社會增強疫情應對能力。尤其一些基層醫院可能並不具備高解析度的裝置,如何在這些平臺實現靈活部署,是百度飛槳參與攻克的首要任務。

在百度飛槳與連心醫療的合作中,系統採用的深度學習演算法模型充分訓練了所收集到的高解析度和低解析度的CT影像資料,以適應不同等級醫療機構中的CT影像裝置。加上PaddleSeg所具備的工業級部署能力,也能更快完成和醫療機構裝置的對接。

更重要的是,當很多其他技術企業也在攻克肺部CT識別技術時,百度飛槳和連心醫療已經創新式地通過EasyDL定製化訓練和服務平臺將這一模型開源,開發者可以在EasyDL影象分割模型中找到這一專用演算法,通過少量資料訓練即可獲得基於實際場景進一步優化的模型,並可以利用多種模式進行部署。

換句話說,面對這樣一場覆蓋面如此之廣的災難,不論是連心醫療還是百度,或者任何一家科技企業,都無法獨自承擔將技術部署到每一家醫療機構的重任。只有將模型開放在EasyDL這樣儘可能抹平技術應用門檻的平臺中,才能讓更多人在技術本身之上加以開發利用,來應對開發場景上的細節差異,以及未來可能出現的病灶表現改變等。同時幫助更多在攻克這一命題的開發者共享成果,提升進度。

鑿井鋪渠之後,百度飛槳還通過開源精神,把涓涓水流變成了人人都能取用的水源。

釋放雙重價值:百度飛槳在疫時和未來的答案

技術開放,是百度所代表的技術企業一直在宣揚的口號,也是百度飛槳一直在執行的概念。但在當下這種時刻,我們比以往更加明確的感受到了技術開放的價值。

在這次疫情大考中,我們看到了百度飛槳通過開放精神所釋放出的“雙重價值”。

第一層顯然是技術價值。

像百度這樣科技巨頭,其能力構成上必然具備著先進技術和先進落地經驗的一致性,通過飛槳這樣的平臺,百度可以同時把先進的純粹技術和先進的落地經驗輸入給開發者。讓他們去填補中間的一環,利用堅實的技術骨架支撐起解決方案,然後使其穩穩地紮根於產業世界。這次百度飛槳通過PaddleSeg幫助科技企業更好、更快的研發出針對疫情的AI模型,就是其中的表現。

第二層則是開放精神釋放出的社會價值。

在這次疫情中,我們在百度飛槳上不僅能看到開源的肺炎CT影像分析模型,還有首個開源的口罩人臉識別檢測模型,相信現在已經有很多企業以及個人開發者,在這些模型上繼續開發,將水源引入更廣闊的疆域。這是我們在面臨社會問題時,一種默然的協作模式,不同層級的開發者把解決問題的能力開放出來,不斷向下遊傳遞,直到覆蓋社會每一個角落,成為我們與災難抗爭的推助力。在這一過程中,釋放的不僅是百度飛槳一個平臺或百度一家企業的社會價值,還有每一個參與其中的開發者,並且鼓勵了更多手握力量卻不知如何使用的人,告訴他們技術能夠為這個社會帶來切實的改變。每一行程式碼都是一顆衝向災難的靜默,每一位開發者都有機會成為“抗疫奇兵”。

一款新冠肺炎AI輔助診療系統,顯然不會是百度飛槳價值釋放的終點。這場考試尚未停止,相信百度飛槳將會在更多產業以及社會場景鑿井開渠,為抗疫輸出AI能量。更重要的是,水源一旦被開啟就不會停止,而是不斷的孕育生機。在這次抗疫中發揮價值後,將會有更多人意識到技術開源的社會價值。在未來,或許會有更多開發者會選擇開源合作,更好地用技術撫平整個世界的褶皺。

水源的珍貴之處正是如此,它可以賦予萬物生機,又可以持續蜿蜒,將生機一直傳遞下去。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2677941/,如需轉載,請註明出處,否則將追究法律責任。

相關文章