開源！mathAI 手寫拍照自動能解高數題，AI 還能這麼玩？

深度好玩！文章開始紅色石頭先在草稿紙上寫一道高數微積分題目給大家看看如何求解：

怎麼算呢？趁著高數知識還沒忘完，趕緊拿起紙演算起來。大部分人是這麼做的。但是如果現在跟你說，可以用 AI 來做，你信嗎？

現在就有這樣一個 AI 程式，你只要輕鬆上傳上面這張手寫算術題，程式就能幫你自動分析，寫出解題步驟和答案！你信嗎？就像下面一樣：

Amazing！有沒有！今天就給大家介紹這個有趣的 mathAI 專案。它是一個拍照做題程式。輸入一張包含數學計算題的圖片，就會自動輸出識別出的數學計算式以及計算結果。

專案介紹

該專案名為：mathAI，是一個自動計算手寫公式的程式。作者是一名中山大學的學霸碩士小哥 Roujack，他的研究方向就是計算機視覺。

整個程式使用 Python 實現，具體處理流程包括了影像預處理、字元識別、數學公式識別、數學公式語義理解、結果輸出。

整個系統流程圖如下：

1. 預處理

首先，需要對手寫圖片進行預處理。圖片預處理以 OpenCV 作為主要工具。預處理的主要目的是把圖片中的字元切割出來，同時避免無關變數對字元識別的影響。

預處理主要包括：灰度化、二值化、高斯濾波、字元切割與細化。

對圖片預處理的效果如下圖所示：

2. 字元識別

預處理之後，下一步就是對字元進行識別。選擇的模型是卷積神經網路 LeNet5，因為不需要提取字元特徵值，而且影像識別精確度高。

訓練網路選用的資料集是國際數學公式識別比賽資料集（CROHME）。CROHME 資料集具有海量字符集圖片，而且圖片型別與實際輸入非常相似。每種字元有 400 張圖片，其中 60% 的圖片用於訓練，40% 的圖片用於測試。

接下來就是結構分析和語義分析。

總的來說，對於數學公式的識別，主要是將識別出的獨立的字元組織成計算機能夠理解的數學公式（這裡的數學公式就是純字元的可求解的數學計算題）。大概的方法是使用編譯原理的算符優先法和遞迴下降法進行實現。然後根據屬性文法的值傳遞思想，將數學公式的值計算出來。最後使用 Python 的 Matplotlib 庫把計算過程和答案列印出來。