ESIM模型的“全能版”！網易易盾實驗室研究員解讀HIM混合推理模型

網易易盾發表於2020-03-13

原文網址 : https://zhuanlan.kanxue.com/article-10637.htm

“知物由學”是網易易盾打造的一個品牌欄目，詞語出自漢·王充《論衡·實知》。人，能力有高下之分，學習才知道事物的道理，而後才有智慧，不去求問就不會知道。“知物由學”希望通過一篇篇技術乾貨、趨勢解讀、人物思考和沉澱給你帶來收穫的同時，也希望開啟你的眼界，成就不一樣的你。當然，如果你有不錯的認知或分享，也歡迎在“網易易盾”公眾號後臺投稿。

導讀：自然語言處理的ESIM模型目前已在多家公司的內容相關性搜尋模型、人機對話模型上較為廣泛的使用，業內不少人對ESIM模型也耳熟能詳。實際上，ESIM模型只是本篇文章要介紹的HIM模型的閹割版，後者潛力很大，能應用在包括內容安全在內的多個領域。近日，網易易盾實驗室的研究員撰寫了此篇文章，對HIM模型進行簡單解讀。

大家對自然語言處理的ESIM模型可能已經耳熟能詳，但是它其實是這裡介紹的HIM模型的閹割版。

自然語言推理NLI（natrual language inferrence，NLI）一直是人工智慧自然語言處理研究的一個熱門方向。但人類語言的推理也一直是一個極具挑戰的任務。舉個例子，文字蘊含關係描述的是兩個文字之間的推理關係，其中一個文字作為前提（premise），另一個文字作為假設（hypothesis），如果根據前提P能夠推理得出假設H，那麼就說P蘊含H，記做P→H。這跟一階邏輯中的蘊含關係是類似的。

這裡解釋也許還有些抽象，在實際的應用中，前提句子可以是使用者輸入的query查詢短語，假設句子可以是新聞庫中一篇新聞的標題、正文、摘要，或者是網路音樂曲庫庫中一首歌曲的介紹、歌詞。推理出來的關係，就是搜尋查詢與搜尋結果物件的相關性。

在內容安全檢測應用中，前提句子亦可以是一條待檢測的資料，假設句子就是舉報違禁樣本庫中一條樣本記錄，推理出來的關係，就是待檢測資料是否和違禁內容相關。

要完成自然語言的文字推理任務，最近stanford大學貢獻了一個重要的資料集——SNLI。這幫助廣大研究人員能夠訓練更復雜的模型。使用這個資料訓練的序列推理模型能夠得到比之前已有的各種最先進的模型更優秀的模型。這也預示著，很多已有的序列推理演算法的潛力都還沒有挖掘出來。

由於句法和語義聯絡緊密，在自然語言推理任務中，挖掘句法對我們十分的重要。因此在自然語言研究任務中，我們需要把大部分的精力投入到利用迴圈神經網對句法分析樹資訊進行編碼。在神經網路中對區域性推理和推理組合進行建模。

1、混合神經網路推理模型

在自然語言推理神經網路中，有三個組成部分：輸入編碼、區域性推理和推理組合。圖一展示的是這種結構的高層架構的三個重要組成部分。左邊展示的是序列推理模型ESIM，右邊展示是融合句法分析資訊的樹形LSTM。