知識圖譜丨行業應用廣泛,未來發展前景好,參與學習勢在必行

龍騰AI技術發表於2022-10-26

學習和關注人工智慧技術與諮詢,qq群:189696007,更多詳情可諮詢175-3102-1189(v同號)。


多領域發揮重要作用

知識圖譜本質上是基於語義網路(semantic network)的知識庫,旨在描述客觀世界的概念、實體、事件及其之間的關係。

知識圖譜(Knowledge Graph)的概念最先是由谷歌於2012年正式提出,主要用來支撐下一代搜尋和線上廣告業務。2013年以後知識圖譜開始在學術界和業界普及,並在搜尋、智慧問答、情報分析、金融等領域應用中發揮重要作用。

生命科學:降低研發診斷成本

由於研發新藥花費較高,醫藥公司非常關注如何縮短新藥研製週期,降低研發成本。歐盟第七框架下的開放藥品平臺Open Phacts專案,就是利用來自實驗室的理化資料、各種期刊文獻中的研究成果以及各種開放資料,包括Clinical Trials.org,美國開放資料中的臨床實驗資料,來加速藥物研製中的分子篩選工作,已吸引輝瑞和諾華等製藥巨頭參與。

Watson取得巨大成功之後,IBM成立了Watson group(事業部),對各種行業進行認知突破。其中在醫療方面,IBM啟動了登月計劃(moon shot),透過整合大量醫療文獻和書籍以及各種EMR(電子病歷)來獲取海量高質量的醫療知識,並基於這些知識向醫護人員提供輔助臨床決策和用藥安全等方面的應用。


金融:識別及預防欺詐

金融僅次於醫療,是知識圖譜應用最廣泛的領域,在反欺詐、搜尋和營銷方面均有深入應用。

國外的Datafox和Spiderbook,國內的通聯資料等,透過從網際網路提取上市公司的相關資料,包括產品、公司供應鏈關係、競爭對手關係等,整合為知識圖譜幫助企業或投資機構進行全網資料的關聯分析、影響傳播和預測。

反欺詐在金融風控中舉足輕重,但基於大資料的反欺詐存在兩個難點:一是如何整合不同來源的結構化和非結構化資料,並有效地識別出身份造假、團體欺詐等欺詐案件。二是不少欺詐案件涉及複雜的關係網路,如組團欺詐。

知識圖譜是基於關係的表達方式,可輕鬆解決以上兩個問題,因此在反欺詐中獲得廣泛應用。首先,知識圖譜可以提供非常便捷的方式來新增新的資料來源。其次,知識圖譜本身是直觀的關係表達方式,可以幫助更有效地分析複雜關係中存在的特定的潛在風險。

農業:多媒體知識指導

大量的農業資料以不同格式分散儲存,傳統的關聯式資料庫模式不適用於複雜多變的領域,無法實現定義所有可能的知識點並構建關鍵資料庫模式,而知識圖譜這種更加靈活的知識表示模型可以實現管理。利用抽取挖掘技術從各種多源異構資料中獲取相應的知識,並用統一圖譜進行表示,形成完整的知識庫,刻畫作物知識、土壤知識、肥料知識、疾病知識和天氣知識等。透過圖譜關聯到圖片資訊,形成多媒體知識圖譜,病變圖片資訊相比專業知識更加直觀,也更方便農民使用。


賦能認知智慧

知識圖譜對於人工智慧的價值在於讓機器具備了認知能力。機器認知智慧在應用方面是廣泛、多樣的,體現在精準分析、智慧搜尋、智慧推薦、智慧解釋、更自然的人機互動和深層關係推理等多個方面。

智慧分析

由於缺乏諸如知識圖譜此類背景知識,各類工具理解大資料的手段有限,限制了基於大資料的精準與精細分析,大大降低了大資料的潛在價值。因此儘管越來越多的行業或者企業積累了規模可觀的資料,但這些資料非但未能創造價值,甚至可能因消耗大量的運維成本而成為負資產。

知識圖譜的發展提供了強大的背景知識支撐,可以賦能輿情分析、商業洞察、軍事情報分析和商業情報分析此類基於大資料的精準分析。

知識圖譜和基於此的認知智慧為精細分析提供了可能。如汽車製造廠商等製造企業都希望實現個性化製造運用於精細分析案例。知識圖譜構建關於汽車評價的背景知識,如汽車的車型、車飾、動力、能耗等,提取消費者對汽車的褒貶態度、消費者改進建議、競爭品牌等評價與反饋,並以此為據實現按需與個性化定製。



自然人機互動

人機互動將會變得更簡單自然。自然人機互動包括自然語言問答、對話、體感互動、表情互動等,需要機器能夠理解人類的自然語言,要求其具有較高認知智慧水平及強大的背景知識。會話式(Conversational UI)、問答式(QA)互動將逐步代替傳統的關鍵字搜尋式互動。未來,Google NOW、siri、amazon Alexa等語音助手及下一代對話機器人將代替我們閱讀、瀏覽,甚至代替我們看電影、電視劇,然後回答我們所關心的任何問題。

深刻影響社會結構

以深度學習為代表的人工智慧獲得巨大進展,但深度學習的不透明性、不可解釋性已成為制約其發展的障礙,“理解”與“解釋”是人工智慧需要攻克的下一個挑戰,而知識圖譜為“可解釋的人工智慧”提供了全新的視角和機遇,並帶來新科技、商業和社會新紀元—認知時代的黎明。

對於人類而言,知識圖譜賦能人工智慧之後,將增強人類的能力,讓我們可以理解和運作社會中複雜的系統,提升我們駕馭科技的能力,改善人類的生存環境,人類與機器的互動將更加自然、有預見性、有情感性。


時間:2022年11月11日 — 2022年11月15日  線上直播


目標:緊密結合理論與實踐,深入淺出,循序漸進。從基本概念講起,重點講解構建方法和技術的轉化思路,幫助學員系統性的掌握知識圖譜的核心技術原理。基於百科知識進行各項核心技術的例項訓練,並結合數字圖書館、醫療、金融、電商、農業、法律等行業應用幫助學員快速積累知識圖譜工程專案經驗。


具體安排:

一、知識圖譜概論

1.1知識圖譜的起源和歷史

1.2知識圖譜的發展史——從框架、本體論、語義網、連結資料到知識圖譜

1.3知識圖譜的本質和價值

1.4知識圖譜VS傳統知識庫VS關聯式資料庫

1.5經典的知識圖譜

1.5.1經典的CYC, WordNnet, WikiData, DBpedia, YAGO, NELL等知識庫

1.5.2行業知識圖譜:

Google知識圖譜,微軟實體圖,阿里知識圖譜,醫學知識圖譜,基因知識圖譜等知識圖譜專案

二、知識圖譜應用

2.1知識圖譜應用場景

2.2知識圖譜應用簡介

2.2.1知識圖譜在數字圖書館上的應用  

2.2.2知識圖譜在國防、情報、公安上的應用

2.2.3知識圖譜在金融上的應用        

2.2.4知識圖譜在電子商務中的應用

2.2.5知識圖譜在農業、醫學、法律等領域的應用

2.2.6知識圖譜在製造行業的應用

2.2.7知識圖譜在大資料融合中的應用  

2.2.8知識圖譜在人機互動(智慧問答)中的應用

三、知識表示與知識建模

3.1知識表示概念

3.2 知識表示方法

a.語義網路 b.產生式規則 c.框架系統 d.描述邏輯 e.本體 f.RDF和RDFS

g.OWL和OWL2 Fragments  h.SPARQL查詢語言

i.Json-LD、RDFa、HTML5 MicroData等新型知識表示

3.3典型知識庫專案的知識表示

3.4知識建模方法學

3.5知識表示和知識建模實踐

1.三國演義知識圖譜的表示和建模實踐案例

2.學術知識圖譜等

四、知識抽取與挖掘

4.1知識抽取基本問題

a.實體識別 b.關係抽取 c.事件抽取

4.2資料採集和獲取

4.3面向結構化資料的知識抽取

a.D2RQ    b.R2RML

4.4面向半結構化資料的知識抽取

  a.基於正規表示式的方法 b.基於包裝器的方法

4.5.面向非結構化資料的知識抽取

a.實體識別技術(基於規則、機器學習、深度學習、半監督學習、預訓練等方法)

b.關係抽取技術(基於模板、監督、遠端監督、深度學習等方法)

c.事件抽取技術(基於規則、深度學習、強化學習等方法)

4.6.知識挖掘

a.實體消歧b.實體連結c.型別推斷 d.知識表示學習

4.7知識抽取上機實踐

A.面向半結構化資料的三國演義知識抽取

B.面向文字的三國演義知識抽取

C.人物關係抽取

五、知識融合

5.1知識融合背景

5.2知識異構原因分析

5.3知識融合解決方案分析

5.4.本體對齊基本流程和常用方法

a.基於文字的匹配 b.基於圖結構的匹配 c.基於外部知識庫的匹配

e.不平衡本體匹配 d.跨語言本體匹配  f.弱資訊本體匹配

5.5實體匹配基本流程和常用方法

  a.基於相似度的例項匹配  b.基於規則或推理的實體匹配

c.基於機器學習的例項匹配 d.大規模知識圖譜的例項匹配

(1)基於分塊的例項匹配

(2)無需分塊的例項匹配

(3)大規模例項匹配的分散式處理

5.6 知識融合上機實踐

1.百科知識融合 

2.OAEI知識融合任務

六、儲存與檢索

6.1.知識圖譜的儲存與檢索概述

6.2.知識圖譜的儲存

  a.基於表結構的儲存       b.基於圖結構的儲存

6.3.知識圖譜的檢索

a.關聯式資料庫查詢:SQL語言 b資料庫查詢:SPARQL語言  

6.4.上機實踐案例:利用GraphDB完成知識圖譜的儲存與檢索

七、知識推理

7.1.知識圖譜中的推理技術概述

7.2.歸納推理:學習推理規則

  a.歸納邏輯程設計Øb.關聯規則挖掘 c.路徑排序演算法

上機實踐案例:利用AMIE+演算法完成Freebase資料上的關聯規則挖掘

7.3.演繹推理:推理具體事實

Ø a.馬爾可夫邏輯網 b.機率軟邏輯

7.4.基於分散式表示的推理

a.TransE模型及其變種        b.RESCAL模型及其變種

c.(深度)神經網路模型介紹   d.表示學習模型訓練

7.5.上機實踐案例:利用分散式知識表示技術完成Freebase上的連結預測

八、語義搜尋

8.1.語義搜尋概述

8.2.搜尋關鍵技術

a.索引技術:倒排索引   

b.排序演算法:BM25及其擴充套件

8.3.知識圖譜搜尋

a.實體搜尋

b.關聯搜尋

8.4.知識視覺化 a.摘要技術

8.5.上機實踐案例:SPARQL搜尋

九、知識問答

9.1.知識問答概述                      

9.2.知識問答基本流程

9.3.相關測試集:QALD、WebQuestions等

9.4.知識問答關鍵技術

   a.基於模板的方法  

 b.語義解析

   c.基於深度學習的方法

9.5.上機實踐案例:DeepQA、TemplateQA

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70021344/viewspace-2920352/,如需轉載,請註明出處,否則將追究法律責任。

相關文章