知識圖譜是什麼
知識圖譜是以圖譜的形式表明實體之間的關係,而如何從文字中挖掘實體之間、實體與屬性的關係則是我們今天想要講述的~這裡以裁判文書中的實體關係抽取為例說明。
功能簡介
裁判文書實體關係挖掘服務用於對裁判文書中包含的實體關係進行自動挖掘。
功能描述
該服務由使用者輸入一篇裁判文書,實現實體自動識別,並抽取實體間關係。
輸入:一篇完整的裁判文書。
輸出:一個或一組實體關係。
一個關係用如下結構表示:
{
RelType: 表示提取的關係型別名稱;如代理人關係、賠償關係等
Rel: 表示從原文中提取的指示關係的具體詞語;
Value: 表示關係的數值;不同的關係,Value表示的內容也不同,如賠償關係的金額等;
Obj1: 表示關係涉及的實體1的值;
Obj2: 表示關係涉及的實體2的值;
Time: 表示關係發生的時間;
TimeInvalid: 表示關係失效的時間;如夫妻之間的離婚時間;
Evidence: 表示關係從哪些原文中提取得到的;
Weight: 表示關係挖掘的可信度,一般是[0,1]之間的小數。
}
實體,可以是個人,也可以是機構,如公司、公益機構、政府機構等。
1、代理人關係:原告、被告與其代理律師、自然代理人之間的關係。
2、家庭關係:民事案件中,關於原告、被告、或者與第三方之間的個人關係,如離婚案件中的夫妻、父子、母子、爺孫、兄弟、叔侄等關係。
3、企業高管關係:原告、被告、或者與第三方之間的企業與其高管之間的關係,如法人、董事、監事、高管、區域經理等關係。
4、企業關聯關係:原告、被告、或者與第三方之間的企業與企業之間的關係,如分公司、子公司、代理商、供貨商等關係。
5、賠償關係:判決結果中,原告與被告之間的費用支付情況。賠償關係中,一般有Value輸出值,表示賠償的金額。
6、債務關係:民事案件中,關於原告、被告、或者與第三方之間的經濟糾紛。債務關係中,一般有Value輸出值,表示債務涉及的金額。
7、違約關係:民事案件中,關於原告、被告、或者與第三方之間的違約事實。
8、傷害關係:刑事案件中,關於原告、被告、或者與第三方之間的人身傷害關係,如殺人、致殘等。
服務在輸出每個關係時,會根據提取演算法從原文中獲取依據的數量與質量,輸出關係挖掘的可信度,一般是[0,1]之間的小數。可信度越高,表示輸出的關係越可靠。
為了方便檢視服務效果,服務同時輸出關係提取的證據,從哪些原文中提取得到的,以及提取的依據。
每個關係,會有一定的時間性,關係的有效性,決定著後續如何使用這些關係,如果關係失效,則不能採用這些關係來作為證據。服務中輸出兩個時間,一個是關係發生的時間,預設是裁判文書的判決時間,如果文書中有,則提取文書中的時間;第二個時間是關係失效的時間,如夫妻之間的離婚時間,從文書中自動提取。
相關服務
除了裁判文書實體關係挖掘的服務以外,泰嶽語義工廠還提供了中文命名實體識別、英文文命名實體識別等相關自然語言處理服務。
應用場景
該服務可應用於基於裁判文書的知識圖譜,以及其他需要實體關係的企業服務場景。
接下來我們以盜竊酌情從輕處罰的案件框架為例,帶領大家瞭解如何基於裁判文書的實體關係挖掘構建知識圖譜。
★
案情
被告人楊某在北京xxxxxxx北京xxxxx有限公司 女更衣室內,將被害人王某放在xx號更衣櫃內 的錢包盜走(內有現金人民幣xx元、身份證一 張、工商銀行卡一張),後持該工商銀行卡取 款並消費共計人民幣xxx.x元。被告人楊某於 2015年10月27日被抓獲,到案後如實供述了上 述犯罪事實。另查明,被告人家屬已退賠被害 人王某全部經濟損失,被害人王某對被告人楊 某表示諒解。
意見
被告人xx的辯護人關於xx系初犯、偶犯,到案 後如實供述犯罪事實、認罪悔罪,賠償被害人 經濟損失並取得諒解,建議對李×從輕處罰並 判處緩刑的辯護意見,本院予以採納。
被告人xx犯盜竊罪,判處拘役四個月,緩刑六 個月,並處罰金人民幣一千元。
從上面的內容中,我們可以抽取出這樣一個相對完整的知識圖譜。
服務對裁判文書中所包含的絕大部分關係,均具有較高的識別準確率,對各種關係的多樣性描述,服務採用的智慧語義認知技術,均能歸一化到同一關係上去。
服務不僅輸出實體關係,而且輸出關係中涉及到的金額、時間等外延,同時還給出關係挖掘時所使用證據,依據挖掘演算法認為的證據的可信度。