應用聚類模型獲得聊天機器人語料

GitChat的部落格發表於2018-04-12

之前的 Chat《從零開始,開發一款聊天機器人》描述了聊天機器人的開發過程,另一個 Chat《聊天機器人語言理解模組開發實踐 》中講述了讓聊天機器人更加『人性化』的重要模組:語言理解(LU)模組的構建,LU 模型和訓練演算法。

但是大家都知道,模型的效果除了和演算法相關,與資料更是大有關係,用於訓練模型的語料和意圖型別、實體型別的確定,往往會對模型的有效性和終端使用者體驗產生根本性的影響。

在已經存在使用者與人工客服對話日誌的情況下,日誌中提取有代表性的客戶問題,用以作為聊天機器人的語料,並通過聚類等手段獲取使用者問題之間的關聯,是一種非常有效的途徑。

作為『聊天機器人』系列的第三部,本場 Chat 將詳細闡述應用聚類手段獲取 chatbot 語料,並對構建 LU 模組提供參考的方法。


往期回顧:

閱讀全文: http://gitbook.cn/gitchat/activity/59fdcc13bf7e5232dd393b1e

一場場看太麻煩?成為 GitChat 會員,暢享 1000+ 場 Chat !點選檢視

相關文章