Bengio 認為,未來的深度神經網路應當能夠實現 System2(邏輯分析系統),實現的是有意識的、有邏輯的、有規劃的、可推理以及可以語言表達的系統。本文所討論的 Logical Reasoning(邏輯推理)擬實現的就是 System2 中重點關注的有邏輯的(Logical)和可推理的(Reasoning)特點。
p 是從特徵空間到原始符號的對映,即它是一個傳統機器學習的感知模型;
∆C 是一組用 B 定義目標概念 C 的一階邏輯子句,稱為知識模型。
(1)
注:請注意,計算運算的具體規則在 B 中沒有定義,即「0+0」、「0+1」和「1+1」的結果可以是「0」、「1」、「00」、「01」甚至「10」。缺失的計算規則形成知識模型 ∆C,這一部分是需要從資料中學習得到的。
1)ABL,機器學習模型由兩層 CNN、一個兩層多層感知器(MLP)和一個 softmax 層組成,邏輯誘因將 50 個位操作的計算規則集作為關係特徵,決策模型為兩層 MLP。實驗中嘗試了兩種不同的設定:使用所有訓練資料的 ABL-all 和僅使用長度為 5-8 的訓練方程的 ABL-short。
2)可微神經計算機(Differentiable Neural Computer,DNC),這是一個與記憶有關的深層神經網路。
3)Transformer 網路,這是一個經過關注增強的深層神經網路,已經被證實在許多自然語言處理任務中是有效的。
4)雙向長短期記憶網路(Bidirectional Long Short-Term Memory Network,BiLSTM),這是目前應用最廣泛的序列資料學習的神經網路。為了處理影像輸入,BiLSTM、DNC 和 Transformer 網路也使用與 ABLs 相同結構的 CNN 作為它們的輸入層。所有的神經網路都是用一個從訓練資料中隨機抽取的驗證集來調整的。
(1)
(2)
(4)
(5)
(6)
(7)
(8)
(9)
(12)
(13)
範疇推理(Categorical reasoning):目的是推理一個特定的概念是否屬於一個特定的範疇。這種推理通常與量詞相關,如「all/everyone/any」、「no」和「some」等。
充分條件推理(Sufficient conditional reasoning):假設推理的型別是基於 「如果 P,那麼 Q」形式的條件陳述,其中 P 是前因,Q 是後因。
析取推理(Disjunctive reasoning):在這種推理中,前提是析取的,形式是「要麼。或者。」,只要一個前提成立,結論就成立。
合取推理(Conjunctive reasoning):在這類推理中,前提是連詞,形式是「兩個。還有。」,只有當所有前提成立時,結論才成立。