達觀醫療器械知識圖譜-心血管器械企業加速創新的“黑科技”

達觀資料DataGrand發表於2021-12-01

近年來,在心血管和結構性心臟病領域,高新醫療器械的臨床應用顯得越來越迫切,然而,現階段國內相關心血管醫療器械的研究國內傳統醫療器械企業在實際產品創新和功能優化的過程中。

lQDPDhrqq6JgX1HNA-jNCS6wzbWoDqcbT5wBrboTk4A4AA_2350_1000.jpg_720x720q90g

針對於現有專業領域知識和經驗的管理問題還處於半封閉狀態,出於安全性和智慧財產權等方面的因素考慮,傳統醫療器械廠商在進行醫療產品文件管理中設定了非常嚴格的訪問許可權,僅限小部分人員可以查閱,這就勢必導致很多可以應用在相通領域的關鍵性技術和知識無法在企業內部得到充分的複用和傳承,從而在一定程度上減緩了醫療器械生產企業產品創新迭代和快速發展的程式。例如,心脈和冠脈部門在涉及到同一型別導絲產品問題時,由於資訊知識不對齊,問題處理的效率會大幅度降低。

達觀資料作為業內首個利用知識圖譜技術賦能醫療領域產品資料圖譜化應用服務的人工智慧企業,基於對醫療產品應用場景的深入理解,藉助達觀淵海知識圖譜為基礎,運用自然語言處理技術從企業的醫療產品相關的技術、工藝、效能、材料、部件等文件資料中,將其中有價值的資料知識和歷史經驗提取出來,然後通過有效的組織構建成醫療器械產品知識圖譜,進一步輔助企業通過圖譜探索和智慧問答等方式快速定位已經沉澱在圖譜中的關鍵技術、工藝、效能等知識內容,從而更好的實現對相關經驗和知識的複用,從長遠可以進一步促進了企業內部在某些共通領域產品體系技術知識和經驗的共享和傳承。

30

1心血管器械產品文件的結構化處理


首先,在圖譜構建前達觀會根據企業提供的醫療產品文件進行結構化處理,主要包括產品資料的對接和採集,文字的解析和標註,以及智慧抽取和結構化三部分,主要介紹如何從企業提供醫療產品樣例資料中獲取關鍵性資料,然後對文件資料進行解析和標註,再通過技術手段進行文字抽取和結構化資料處理的過程和方法。

lQDPDhrqqpMs4XjNA83NAqKwxywPEtBGBcgBrbhWuIAjAA_674_973.jpg_720x720q90g

支援對文件或圖片等非結構化和半結構化資料批量或單個接入。支援多種非結構化資料格式,此外,還支援採用達觀自研的OCR技術識別掃描件中的文字,識別準確性達到人眼識別的精準度要求。

其次,產品提供的文件解析和標註工具,主要負責對產品文件的文字和表格進行識別,並對關鍵資訊進行標註用於後續的模型訓練和資訊抽取。

隨後,產品提供的資訊抽取和結構化工具,主要負責根據業務需求呼叫已構建好的模型進行文字的抽取,並對抽取結果進行結構化處理,再通過工具將結構化以後的資料匯入到圖譜。

實際使用情況下,樣例資料達到一定數量規模以後,文件資訊抽取可以完全無須人工干預同時抽取的準確率也會達到實際業務場景使用的要求,大量減少人工運營的工作量。

2心血管器械產品知識圖譜模式設計和構建


達觀的知識圖譜構建平臺提供了一套視覺化工具來幫助心血管器械企業的產品專家和達觀圖譜技術專家一起來梳理和設計圖譜模式,其中圖譜模式設計通常需要兩個步驟的工作。第一步,需要知識圖譜工程師和企業業務專家協同梳理業務知識,結合企業自身的業務邏輯形成知識體系;第二步,以業務知識體系為基礎,根據業務需求和功能設計,由知識圖譜專家和業務專家討論、抽象出實體型別及其屬性和關係型別及其屬性,設計知識圖譜模式。


lQDPDhrqqpMs4TvNAkbNBFOwZt5Hi5Y6W7sBrbhWrAASAA_1107_582.jpg_720x720q90g

3心血管器械產品知識圖譜全景探索


圖譜全景探索是圖譜資料圖譜化的典型前端應用服務,通過對現有心血管器械產品資料,迅速梳理資訊,結合NLP和文字抽取技術,精準提取資料及內在關係,展示圖譜資料關係,輔助人員快速查詢產品相關的技術、工藝、材料、部件等資訊。

圖譜全景探索支援在視覺化的介面對心血管器械產品進行查閱,展示圖譜中關係的不斷擴充套件,以及不同產品之間可能的關聯關係等,在具體產品功能上支援結構化展示查詢、節點排列布局調整、節點間關係層數展示、多圖譜管理、節點知識卡片展示等功能。

4心血管器械產品文件知識溯源


基於圖譜技術的產品文件知識溯源功能,可以查詢指定圖譜實體節點知識點的源文件內容,例如某一項產品技術、工藝來源於哪一類具體的文件,支援實體的多文字溯源。

以某心脈血管支架產品為例,點選工藝-導絲原材料清洗,展示屬性資訊和關聯資料,並溯源對應工藝流程圖,可以快速定位該知識原始的文件,進一步提升對相關文件資料的閱讀效率和質量。

5基於知識圖譜推理技術的智慧問答服務


基於知識圖譜推理技術的智慧問答服務提供基於心血管器械產品關鍵技術、部件、工藝、材料以及效能要求等資訊維度的搜尋問答服務,支援以自然語言處理方式提問,對問題進行語義理解和解析,並對知識圖譜進行查詢、推理得出答案,採用實體識別、實體連結、意圖識別、知識檢索、答案生成與排序等技術,獲取最優問答結果,同時,問答結果支援可解釋和可追溯性,支援精確和模糊搜尋、中英文多語言檢索和搜尋結果展示。

總體而言,達觀資料主要充分利用了自然語言處理和知識圖譜技術幫助心血管器械企業如何在產品研發和創新過程中更好的使用好已經沉澱在企業內部的知識和經驗,從實際應用效果反饋可見,基於知識圖譜技術的心血管器械產品知識圖譜平臺對企業日常心血管產品知識和經驗的有效應用和管理有深遠的價值意義:

lQDPDhrqqpMs4T3NAkbNBB6wTc7h4a1dLm8BrbhWsEAaAA_1054_582.jpg_720x720q90g

一方面,通過圖譜視覺化探索和文件溯源,輔助企業培養了企業業務人員的全域性思維,提升不同職能間的溝通效率,加快對醫療產品全面知識的學習和理解,提升了團隊效率,另一方面通過基於知識推理技術的智慧問答實現了在共通領域下共性知識的參考、複用和標準化,不僅有效促進了企業內部醫療產品經驗和知識的積累,而且充分利用知識輔助企業提升了醫療產品創新的效率和質量,進而縮短了產品研發的週期和時間,整體上提升醫療器械企業行業競爭力。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69997703/viewspace-2845046/,如需轉載,請註明出處,否則將追究法律責任。

相關文章