MNIST 是計算機視覺中不老的經典,當第一代卷積神經網路在這個手寫數字資料集上綻放出耀眼的光芒,它註定會載入「史冊」。
儘管目前計算機視覺已經早就走出了 MNIST 資料集的時代,甚至連一千多萬影像的 ImageNet 也不再是非常大的一個影像資料集。然而,MNIST 仍然不可忽視,深度學習入門的第一個資料集、驗證演算法的第一個實驗都是它。甚至連 Hinton 驗證 Capsule 這個想法的資料集都用的它。
如果說想要致敬這樣的資料集「先驅」,你會採用什麼樣的方式?在 GitHub 中,機器之心發現一個有意思的小專案,作者 Dheera Venkatraman 做了一面鍾,裡面的數字都是從 MNIST 資料集中取樣的。
專案地址:https://github.com/dheera/mnist-clock
也就是說,24 小時隨機抽萬張不同的手寫數字,每天都不帶重樣。做出來的效果是這樣的:
這樣的電子鐘只需要簡單的電路板再加上 4 塊電子墨水屏就行了,它背後的樣子是這樣的:
硬體
專案使用了 TinyPICO 開發板;緊湊的 ESP32 板以及大量的 GPIO 插腳、4MB 快閃記憶體、Wi-Fi,以及其他很多功能。TinyPICO 可以說是目前世界上基於 ESP32-PICO-D4 體積最小的開發板,240 MHz 的 32 位雙核處理器足夠我們完成計算。
4 塊 e-link 數字顯示器,之所以選擇 e-link,是因為它符合手寫數字的概念,在任何光線條件下都能正常執行,而且也不至於打擾到任何人。Waveshare 的 e-link 螢幕大部分是 SPI,雖然也有些額外的引腳。大部分人會希望一塊只包含 SPI 以及一塊 CS 插腳,但多一些的連結器是有必要的。下面是 ESP32 的連線圖,根據這個把電線捲起來。
作者在 TinyPICO 上使用的是兩個 10-引腳的 JST-EH 的聯結器,JST-EH 比 JST-XH 使用更低的配置,更適合插入,以及比標準引腳更短更安全。
JST-EH 聯結器所連線的 TinyPICO
下面,再見硬體固定在 3D 列印的外殼上,就大功告成了:
如果讀者們對硬體不熟悉,那也不要急,我們只要按照專案作者給出的硬體,並裝配好就行了。後面我們會介紹所有「裝備」的價格以及作者提供了設計圖。
軟體
專案作者 Dheera Venkatraman 表示,他經常寫 C++或者 C,但他對 MicroPython 非常有興趣,因此在這個專案中採用的就是它。
專案作者使用每畫素 2 位元的灰度深度來表示 MNIST 手寫數字。在這種位元深度下一張 28*28 畫素的影像只需要 196 位元組,因此一個 4MB 的快閃記憶體就能滿足整個 MNIST 驗證集。如果你想把整個資料集都裝進去,那麼也只需要換快閃記憶體更大的微控制器、或者使用 1 位元深度的影像、或者使用壓縮方法等。
將所有檔案放在 TinyPICO 根目錄中的/ code 中,正確的檔案大概如下圖所示。
另外,我們還需要為 Wi-Fi 建立一個名為.wifi 的檔案,中間寫上 yourssid 與 yourpassword,具體的讀取 WIFI 設定的程式碼就如下所示。
專案作者 Dheera Venkatraman 在 GitHub 中提供了所有程式碼檔案,列印鐘錶數字的程式碼也非常易讀。更友善的的是,作者的程式碼提供了非常完善的註釋,基本重要的語句都有解讀。
現實一點,做一塊多少錢?
如果從硬體來看,似乎主要成本就是 TinyPICO 開發板以及四塊 e-ink 屏。首先 TinyPICO 在淘寶或者國外網站都能買到,國外賣 20 美元,而淘寶上標價 235 元,加上運費其實也差不多。此外,讀者也可以選擇專門的元器件商城,其價格也在 200 塊左右。
其次,一塊 e-ink 屏大概 24 美元,雖然淘寶找不到,但是國內的元器件商城要便宜得多,一塊只需要 92 元左右,可能樹莓派對它的需求比較大吧。
其它的成本就比較少了,線材、聯結器裝時鐘的外包裝都比較容易獲得,在國內的元器件商城也可以一次性買到。如果讀者想 3D 列印外包裝,作者也提供了具體的列印引數。所以,總的來說,製作成本應該是低於 650 元的,其中開發板和電子屏都可以在其它專案中再利用。
也許我們還能改進該專案作者的實現,在一塊大的墨水屏上實現數字時鐘,直接使用更常用的樹莓派作為主機板(功耗遠高於 TinyPICO),並實現更多的能力,例如實時取樣個 CIFAR-10 作為背景。總之,MNIST 數字時鐘還有很多可以玩的地方。
最後,所有硬體與軟體的詳細資訊都可查閱原專案。此外,值得一提的是,Dheera Venkatraman 還是非常有意思的一位小哥哥,他從杭州到北京沿著人類歷史上最長的人工河靠腳踏車騎了 1600 公里。
Last But Not Least
確實 MNIST 站在舞臺中央的時代已經過去了,但它的作用仍然不可忽視,仍然有很多研究者致力於改進並修復它,做出獨特的貢獻。
2017 年,德國時尚科技公司 Zalando 提供了 Fashion MNIST 資料集,它的大小、格式和訓練集 / 測試集劃分與原始的 MNIST 完全一致,從 MNIST 遷移到它,我們不需要修改任何程式碼。
去年 6 月份,NYU 和 Facebook 的研究者重建並擴充套件了 MNIST 資料集,在測試集中新增了 50000 個樣本,將測試集增加到 6 萬樣本。MNIST 作者之一的 Yann LeCun 表示,「如果多次使用原版的 MNIST 測試集,你的模型可能在測試集上已經過擬合了,是時候在新增的樣本上試一下了。」
不論是將 MNIST 做成日常生活中好看又好玩的專案,還是提升資料集本身的能力,MNIST 一直都會是活著的歷史~