通過機器學習讓醫療資料更好用

Google_Developers發表於2018-08-24

原文網址 : https://juejin.im/post/5b7fdec2e51d4538df02b07d

文 / Google Brain 團隊軟體工程師 Patrik Sundberg 和產品經理 Eyal Oren

原文連結：mp.weixin.qq.com/s/AukAfg-5C…

在過去 10 年間，醫療資料已經從以紙質檔案為主幾乎完全數字化為電子健康記錄。但是，理解這些資料涉及一些關鍵挑戰。

供應商之間沒有共同的資料表示形式；每個供應商都使用不同的方式來構建他們的資料。
即使使用相同供應商的網站也可能存在很大不同，例如，他們通常為同一種藥物使用不同的程式碼。
資料可能分佈在多個表格中，一些表格包含患者就醫記錄，一些包含實驗室結果，其他的則包含生命體徵資料。

快速醫療互操作性資源 (FHIR) 標準解決了其中的大多數挑戰：它具有一個堅實並且可擴充套件的資料模型並基於成熟的網路標準構建，正在快速成為個體記錄和批量資料訪問的事實標準。但是，為了實現大規模機器學習，我們需要一些補充：各種程式語言的實現，將大量資料序列化到磁碟的有效方法，以及允許分析大型資料集的表示形式。

今天，我們高興地開源 FHIR 標準的一種協議緩衝區實現，它可以解決這些問題。當前版本支援 Java，並且將很快支援 C++、Go 和 Python。對配置檔案的支援也即將釋出，還會推出一些工具，幫助使用者將舊資料轉換成 FHIR。

將 FHIR 用作核心資料模型過去幾年，我們一直與眾多學術醫療中心合作，將機器學習應用於匿名病歷，我們需要正面解決醫療資料的複雜性，這一點已經變得非常明顯。確實，要讓機器學習有效用於醫療資料，我們需要從整體上了解每名患者隨著時間推移的情況。作為獎勵，我們想要一種可以直接用於臨床環境的資料表示形式。

儘管 FHIR 標準可以解決我們的大多數需求，但是為了使醫療資料比“舊”資料結構更加易於管理和確保大規模機器學習不依賴於供應商，我們認為引入協議緩衝區可以幫助應用開發者和（機器學習）研究人員使用 FHIR。

當前版本的協議緩衝區為了讓我們的協議緩衝區表示適合程式設計訪問和資料庫查詢，我們做了大量工作。提供的一個示例顯示瞭如何將 FHIR 資料上傳到 Google Cloud BigQuery 中並讓它可以用於查詢，我們將新增直接從批量資料匯出上傳的其他示例。我們的協議緩衝區符合 FHIR 標準（這些緩衝區實際上是從此標準自動生成的），但可以實現更高階的查詢。

當前版本還不可以用於訓練 TensorFlow 模型，不過，敬請關注未來更新。我們打算開源儘可能多的近期工作，以便提升我們的研究在現實世界情景中的重現性和適用性。此外，我們還在與 Google Cloud 團隊的同事緊密合作，推出更多用於管理大規模醫療資料的工具。

案例丨堡壘機如何讓醫療機構運維更安全？
2020-09-25
運維
[譯] 通過整合學習提高機器學習結果
2019-02-27
機器學習
百億資金投入科研，醫學知識圖譜資料過百萬，平安挺進「智慧醫療」
2019-05-10
區塊鏈讓醫療資料儲存變得安全
2018-03-20
區塊鏈
機器學習如何解決「看病難」？Jeff Dean等詳述機器學習在醫療領域的應用。
2019-04-19
機器學習
醫療資料安全防護，這家三甲醫院的做法值得學習
2021-03-18
智慧醫療BI助你釋放醫療大資料潛力
2022-04-12
大資料
機器學習-資料清洗
2019-03-02
機器學習
機器學習大資料
2019-05-10
機器學習大資料
Google AI負責人Jeff Dean：機器學習讓計算機更智慧
2019-07-11
GoAI機器學習計算機
醫療保健領域的機器人
2022-04-13
機器人
看微軟醫療聊天機器人，如何服務醫療健康市場
2019-11-25
微軟機器人
醫療資料的概念框架 - PICU
2022-03-15
框架
機器學習-- 資料轉換
2018-11-17
機器學習
機器學習之清理資料
2020-06-16
機器學習
關於醫療機器人行業投資的五點心得
2020-07-15
機器人行業
“GPT+醫療健康”前景廣闊，景聯文科技大量醫學資料儲備助力AI醫療大模型
2023-05-10
GPTAI大模型
2020年，醫療機器人還有哪些機會？
2019-12-24
機器人
做資料分析需要學習機器學習嗎？
2020-01-15
機器學習
美創科技受邀為阿勒泰地區醫療衛生機構開展醫療資料安全培訓
2023-02-20
助力智慧醫療，杉巖資料為醫療資訊化建設護航加速
2019-12-28
如何通過 JavaScript 實現機器學習和神經學網路？
2018-06-20
JavaScript機器學習
醫療大資料Topic推薦-AMiner
2021-01-04
大資料
八個機器學習資料清洗
2019-06-19
機器學習
深度學習在醫療領域的應用
2019-02-27
深度學習
順元年5G智慧醫療解決方案，讓偏遠地區享受優質醫療資源
2022-01-05
宣武醫院：讓物聯網為智慧醫療添翼
2018-05-23
機器學習：探索資料和資料預處理
2020-12-13
機器學習
機器學習一：資料預處理
2019-02-27
機器學習
機器學習筆記——資料集分割
2018-09-25
機器學習筆記
機器學習基礎-資料降維
2019-05-02
機器學習
33個機器學習常用資料集
2019-04-19
機器學習
分散式機器學習常用資料集
2021-11-28
分散式機器學習
讓理賠更容易和泰人壽接入微信支付醫療電子發票
2021-04-09
全同態加密的硬體加速：讓機器學習更懂隱私保護
2024-01-26
加密機器學習
醫療BI系統如何讓醫療行業實現精細化管理轉型？
2022-03-29
行業
2018京醫通就醫資料包告
2019-05-12
10個python常用且好用的機器學習及深度學習庫!
2022-12-02
Python機器學習深度學習

通過機器學習讓醫療資料更好用

相關文章