神經網路也能解數學題，DeepMind釋出千萬數學題海資料集

機器之心發表於2019-04-04

為了促進這方面的研究，DeepMind 近日釋出了一個新型資料集，包含大量不同型別的數學問題（練習題級別），旨在考察模型的數學學習和代數推理能力。

資料集地址：https://github.com/deepmind/mathematics_dataset

目前該資料集釋出了 1.0 版，其每個模組包含 200 萬（問題答案）對和 10000 個預生成測試樣本，問題的長度限制為 160 字元，答案的長度限制為 30 字元。每個問題型別中的訓練資料被分為「容易訓練」、「中等訓練難度」和「較難訓練」三個級別。這允許通過課程來訓練模型。

該資料集包含以下類別：

神經網路也能解數學題，DeepMind釋出千萬數學題海資料集

如下所示為該資料集的示例，其中 Question 是待解決的數學題目，Answer 是對應題目的解。這些題目涉及上述多種數學問題，且進行了分級。

神經網路也能解數學題，DeepMind釋出千萬數學題海資料集

圖 1：資料集示例。

什麼是神經網路的數學推導能力

深度學習在模式匹配、機器翻譯、強化學習等領域取得了巨大成功。但是，深度模型的穩健性和靈活性遠不及人類。它們對陌生環境的泛化能力不足，且易受對抗樣本的影響。

人類智慧區別於神經模型且優於後者的一個領域是對「代數泛化」物件和實體的離散組合推理。人類在該領域的泛化能力是複雜、多面的，與雙語翻譯領域的泛化有顯著區別。例如，考慮以下數學問題（答案是 −70x − 165）：

神經網路也能解數學題，DeepMind釋出千萬數學題海資料集

為了解決這個問題，人類需要使用多種認知技能：

將字元解析成實體，如數字、算術運算子、變數（加在一起可組成函式）和單詞（決定問題是什麼）。
規劃（例如，識別組合順序正確的函式）。
使用子演算法進行函式複合（加、乘）。
利用工作記憶儲存中間值（如複合函式 h(f(x))）。
應用所需的規則、變換、過程和定理。

這個資料集專案提出了什麼

該資料集包含多種不同型別的數學問題。其動機是，模型如果不具備一些代數泛化能力，則很難處理多種數學問題（包括泛化）。

該領域對神經架構分析非常重要。該資料集除了提供大量問題以外，還有多個優勢：數學提供了一個自洽的環境；不同問題型別的符號是相同的，這使得該資料集可以輕鬆擴充套件；在一個問題上學到的規則和方法通常可用於其他問題。例如，數字加法的規則在哪裡都是一樣的，且可作為其他問題（如乘法、多項式加法）的「子程式」（subroutine）。能夠執行知識遷移的模型會在這個資料集上取得較好的效能，要想解決較難的問題，知識遷移必不可少。

數學本身是一個有趣的領域，儘管解決該資料集中學校級別數學問題的模型沒有實際應用，但它們可能會帶來更強大的模型，用於解決大量有趣新穎的數學問題。一般來說，用於驗證旨在捕捉算術／系統性推理新架構的實驗通常來自數學領域，而這並非巧合。因此 DeepMind 希望通過為此類模型提供大規模訓練和評估框架，來為數學領域之外的機器推理研究打下堅實的基礎。

貢獻

資料集和泛化測試：該序列到序列資料集包含多種不同型別的數學問題，可用於評估數學推理。DeepMind 還提供了生成程式碼和預生成問題。

實驗和模型分析：DeepMind 研究者執行了實驗評估來研究當前最優神經架構的代數能力，證明了這些架構能夠很好地處理多種數學問題，但無法處理所有問題型別，此外它們的泛化能力也有待提升。

這個資料集測試了什麼

在論文中，作者還用該資料集測試了兩種主流模型：迴圈神經網路和 Transformer，它們已經在序列建模問題上展示出當前最優的效能。下圖展示了測試使用的 Attention LSTM 與 Transformer，它們都使用編碼器-解碼器結構建模問題與答案：

神經網路也能解數學題，DeepMind釋出千萬數學題海資料集

圖 2：Attentional LSTM 與 Transformer 架構。

下表展示了不同網路架構的 interpolation 和 extrapolation 效能：

神經網路也能解數學題，DeepMind釋出千萬數學題海資料集

圖 3：不同模型的準確率，其中 RMC 為關係迴圈神經網路。

如上所示，使用帶有多個記憶 slot 的 RMC 在效能上並不會有多大幫助，這表示 RMC 很難使用 slot 運算元學實體。而對於帶或不帶注意力機制的 LSTM，它們的效能也差不多，作者推測注意力機制並沒有學習解析數學問題，因此獲得的效能提升並不大。最後，Transformer 明顯比其它迴圈神經網路表現更好一些。

論文：ANALYSING MATHEMATICAL REASONING ABILITIES OF NEURAL MODELS

神經網路也能解數學題，DeepMind釋出千萬數學題海資料集

論文地址：https://arxiv.org/pdf/1904.01557.pdf

作為人類智慧的核心能力，數學推理具有一些獨特的挑戰：我們不是主要依靠經驗和證據來理解和解決數學問題，而是基於推斷、學習和利用定律、公理和符號操作規則。在本文中，DeepMind 提出了一個評估（並最終設計）神經架構和相似系統的新挑戰，開發了一套數學問題，包括以自由格式文字輸入/輸出形式的問題和答案序列。

數學領域涵蓋算術、代數、概率和微積分，其結構化性質使構建訓練和測試分割成為可能。該訓練和測試分割旨在清晰地闡明不同架構的能力和故障模式，以及評估它們組合與關聯知識和學習過程的能力。描述了資料生成過程及其潛在的未來擴充套件之後，DeepMind 還對來自兩種最強序列到序列架構的模型進行了全面分析，並發現了它們在解決數學問題和泛化知識方面的顯著差異。

卷積神經網路數學原理解析
2022-09-16
卷積神經網路
神經網路 | 基於MATLAB 深度學習工具實現簡單的數字分類問題（卷積神經網路）
2019-03-07
神經網路Matlab深度學習卷積
如何讓AI理解數學？Facebook神經網路透過「語言翻譯」求解數學難題
2020-07-01
AI神經網路
教你用神經網路求解高階數學方程！
2020-04-08
神經網路
學習網路安全能解決哪些現實問題？網路安全學習
2020-07-16
《手寫數字識別》神經網路學習筆記
2020-10-26
神經網路筆記
04_利用手寫數字問題引入深度神經網路
2021-04-18
神經網路
好題——數學與資料結構
2024-05-01
資料結構
DeepMind釋出神經網路、強化學習庫，網友：推動JAX發展
2020-02-23
神經網路強化學習
Python+Matlab+機器學習+深度神經網路全套學習資料！
2018-04-16
PythonMatlab機器學習神經網路
【深度學習篇】--神經網路中的卷積神經網路
2018-03-28
深度學習神經網路卷積
【深度學習篇】--神經網路中解決梯度彌散問題
2018-03-28
深度學習神經網路梯度
神經網路學習參考
2018-04-04
神經網路
如何除錯神經網路引數
2020-04-06
除錯神經網路
iOS數學題
2018-11-07
iOS
專題：數學
2024-05-06
Tensorflow系列專題（四）：神經網路篇之前饋神經網路綜述
2018-11-20
神經網路
神經網路碰上高斯過程，DeepMind論文開啟深度學習新方向
2018-07-06
神經網路深度學習
資料探勘---BP神經網路
2021-01-04
神經網路
卷積神經網路學習筆記——Siamese networks（孿生神經網路）
2021-01-14
卷積神經網路筆記
再聊神經網路與深度學習
2019-04-08
神經網路深度學習
AI之（神經網路+深度學習）
2018-05-31
AI神經網路深度學習
【深度學習】神經網路入門
2020-04-04
深度學習神經網路
深度學習與圖神經網路
2022-09-15
深度學習神經網路
機器學習整理（神經網路）
2022-04-10
機器學習神經網路
前饋神經網路進行MNIST資料集分類
2020-12-28
神經網路
DeepMind新成果：讓AI做了200萬道數學題，結果堪憂
2019-04-14
AI
數學專題1
2018-11-08
深度學習2.0-12.神經網路與全連線層之資料集的載入
2020-10-08
深度學習神經網路
刷臉背後，卷積神經網路的數學原理是這樣的
2019-04-22
卷積神經網路
神經網路常見引數解釋：epoch、batch、batch size、step、iteration
2024-05-30
神經網路BAT
深度學習與圖神經網路學習分享：CNN 經典網路之-ResNet
2022-10-12
深度學習神經網路CNN
DeepMind開發用於量子化學計算的神經網路變分蒙特卡羅
2024-07-12
神經網路
漸進學習前饋神經網路
2019-04-01
神經網路
【深度學習】1.4深層神經網路
2020-09-27
深度學習神經網路
深度學習三：卷積神經網路
2020-10-02
深度學習卷積神經網路
人工神經網路：競爭型學習
2024-08-19
神經網路
深度學習教程 | 深層神經網路
2022-04-14
深度學習神經網路

神經網路也能解數學題，DeepMind釋出千萬數學題海資料集

相關文章