(早前的一個智慧聊天機器人設計,實際使用中已經改了很多了。)
簡述
主要分三塊:
- SuperRobot 框架主體。
- 自然語言理解系統。
- 詞向量Trainer。
SuperRobot
- AliceBot負責閒聊,採用AIML Engine,屬於rulebased。
- 閒聊語句通過後臺輸入到DB。
- ServiceBot負責業務QA,Matcher負責匹配工作。
- 自定義QA對通過後臺輸入到DB。
- AbilityBot負責與第三方系統互動,通過REST請求自然語言理解系統返回意圖及實體。
- 後臺能定義互動的服務介面。
- 用Java開發。
自然語言理解系統
- 主要負責的工作時意圖預測和實體識別。
- 需要標註業務資料樣本的實體和意圖。
- 實體提取器通過序列標註訓練模型並實現實體提取。
- 意圖分類器通過SVM訓練模型並實現意圖預測。
- 麻省理工NLP工具MITIE。
- 用Python、C++ 開發。
詞向量Trainer
- 主要負責詞向量訓練。
- 普通語料包括維基百科百度百科。
- 業務語料包括業務系統資料。
- 用DLib機器學習庫。
- 用C++開發。
- 訓練的模型供前面使用。
-------------推薦閱讀------------
------------------廣告時間----------------
公眾號的選單已分為“分散式”、“機器學習”、“深度學習”、“NLP”、“Java深度”、“Java併發核心”、“JDK原始碼”、“Tomcat核心”等,可能有一款適合你的胃口。
鄙人的新書《Tomcat核心設計剖析》已經在京東銷售了,有需要的朋友可以購買。感謝各位朋友。
歡迎關注: