面向NLP場景應用的智慧輔助建模(一)簡介

泰岳语义工厂發表於2019-05-08

一個場景模型示例

在下邊這個本體場景例項,是銀行領域客服投訴分析挖掘的場景本體模型,可用於對銀行客服投訴進行自動分析。輸入是客服投訴文字,是自然語言表示的文字,輸出結果是客服投訴的自動分類。

面向NLP場景應用的智慧輔助建模(一)簡介



 客服投訴模型,包括3部分:

1、本體模型:形式上由一個本體樹和領域模型構成。本體樹是類目體系的形式化描述,這裡指客服投訴的分類。領域模型,是本體樹對應的推理規則的形式化描述,這裡指客服投訴分類相關的業務知識。領域模型支援兩種型別:概念模型、機器學習預訓練模型。上圖中的“本體表示式”,是概念模型的形式化規則,說明客服投訴的業務知識,一般是用“客服人員-態度-不好”這樣的三元組表示,其中“客服人員”是投訴物件要素,“態度”是投訴涉及的屬性要素,“不好”是投訴中對投訴物件涉及屬性的評價性描述。

2、要素模型:是對領域相關實體概念的形式化描述。這裡指銀行領域相關投訴物件(物件要素)、投訴物件相關屬性(屬性要素)。如工作人員的物件要素,可包括下級要素,如“櫃員、客服人員、保安、大堂經理”等,工作人員的屬性要素,可包括下級要素如“態度、效率、業務水平”等。

3、概念模型:是對領域無關的語言概念的形式化描述。這裡指物件和屬性的評價概念,如“不好、惡劣、怠慢”等。概念模型可理解為傳統意義上的語言資源形式化管理。

場景本體輔助建模

場景本體模型是業務知識的形式化表示,一般由業務人員主導構建。面向場景應用開發的工具——DINFO-OEC平臺,提供專業、方便、易用的建模IDE整合環境,支援場景化業務建模,可通過概念規則,構建形式化的業務規則,也可通過資料標註,指定機器學習(包括深度學習)演算法,來訓練機器學習模型。建模工具支援兩種型別領域模型。

為了提高建模效率,DINFO-OEC平臺也提供OEC智慧輔助建模工具,支援利用機器學習演算法,對業務資料進行自動學習。輔助建模中涉及到的機器學習演算法(包括深度學習)、知識資源及各種功能模組,均由DINFO-OEC平臺提供。

面向NLP場景應用的智慧輔助建模(一)簡介

輔助建模工具

輔助建模工具,提供視覺化輔助建模環境,支援業務人員通過拖拉拽的方式,實現各種建模操作。

面向NLP場景應用的智慧輔助建模(一)簡介

  輔助建模工具的3個分割槽:

1、元件區:在建模工具左下角。該區提供相關演算法元件,如用於本體模型輔助的分類聚類,用於要素模型、概念模型中的實體抽取,用於本體模型中本體表示式輔助的關聯發現、規則生成等元件。每個元件對可以對應一個或多個演算法,業務人員無須瞭解演算法的具體細節,只需要在輔助建模工具中拖拽元件(如分類、聚類元件),即可完成自動聚類的任務。元件區也提供建模常用操作,如選擇語料,可以選擇客服投訴語料來作為輔助建模的資料等。

2、建模區: 在建模工具左上方。該區支援業務人員將元件區的元件和操作,通過拖拉拽的方式,形成一個處理流程,用以實現多級建模。

3、結果區:在建模工具右方。該區展示當前流程的輸出結果,業務人員可對結果進行合併、修改、刪除等操作。

輔助建模功能示例

以上述客服投訴模型為例,輔助建模工具在以下4個環節中,支援業務人員對客服投訴的文字資料進行分析,提高客服投訴模型的建設效率:

1、分類體系建模:針對本體模型中本體樹建設,輔助自動發現本體樹節點。

2、要素發現:針對要素模型中要素樹建設,輔助自動發現客服投訴場景下的實體物件。

3、評價概念複用:針對概念樹中概念樹建設,可直接複用平臺提供的語言資源。

4、本體表示式發現:針對本體模型中,一個本體樹節點的業務規則,從客服投訴文字中,輔助發現要素與概念的組合關係,自動形成本體表示式。

面向NLP場景應用的智慧輔助建模(一)簡介



相關文章