形而上者謂之道,形而下者謂之器,化而裁之謂之變;推而行之謂之通,舉而措之天下之民,謂之事業。——《易經·繫辭》
天地間本就存在種種規律和法則,這些規律和法則在物質世界相互作用、不斷演化形成了世間永珍,比如水蒸氣遇冷液化成雨,比如萬有引力讓蘋果落到地上。世間永珍稱之為“形”或“象”。
世間之“形”或“象”,大致可分兩種:一種是物質的種種“現象”,風雨雷電、花鳥魚蟲,另一種是精神的種種“意象”,或者說“觀念”。兩者背後都蘊含著很多規律,人們發展出各種學科,如物理學、心理學等,都是在嘗試更準確地描述“形”“象”背後的規律,從而指導實踐。
人們通過持續觀察自然認識自我,初成感覺和猜想,進行實踐,總結規律,不斷修正和創造,進而改造自然,推動社會進步。比如古人觀察到火燒後的土地會變硬,學會了燒陶,但是對於燒製結實耐用容量大的陶器而言,這個階段的認識是片面且膚淺的,在不斷燒製實踐的過程中,進一步總結規律,調整工藝,知道了如何燒製更好的陶器。
是因為物理法則的存在,才會產生“火燒后土地會變硬”的現象,物理法則即是現象背後的道,此為“形而上者謂之道”;人們對這些現象的觀察和總結是在嘗試刻畫“道”、擬合“道”,應用認識到的規律,燒製出陶器,此為“形而下者謂之器”;但認識到的規律是片面的,與真正的“道”之間是有偏差的,這種偏差表現在實踐過程中就會暴露出種種問題,像易碎、裂紋、變形,然後完善認知總結出更準確的規律,改進工藝,此為“化而裁之謂之變”;當總結出的規律足夠準確,工藝足夠好之後,就可以推行了,傳授給更多人,應用的範圍越來越廣,改善了大家的生活,此為“推而行之謂之通,舉而措之天下之民,謂之事業”。
但是,如果總結出的規律一直存在人的腦袋裡,或者停留在工藝層面,別人並不能很快掌握和應用,而且到了一定階段後難以進一步改進,這對推行和發展是不利的。於是需要數學,數學通過抽象可以將結論和規律高度概括為公式,易於驗證、推行和改進。需要注意的是,通過數學公式描述的規律——模型,也僅僅是對“道”的擬合,與“道”仍有偏差,從牛頓力學到愛因斯坦相對論再到量子力學,在簡單場景下好用的規律到更廣泛的場景下可能就不好用了,這即是偏差,有差距就會推動發展出更準確的模型。
這個“認識自然、總結規律、修正改進”的過程能否通過機器(計算機)實現呢?答案是可以的,利用機器“上溯尋道”的方式就是機器學習,而且已經形成了相對清晰的“尋道”路線圖,認識自然——認識資料,總結規律——形成模型,修正改進——模型優化。根據你的問題場景,收集相關資料,總結規律得到模型,分析暴露出的問題,縮小“偏差”,得到更準確更貼近“道”的模型,接下來就是應用模型——應用通常表現為預測,就像利用公式預測蘋果落地時間一樣,這就是機器學習的實踐過程。
假設用(P)來評估計算機程式在某任務類(T)上的效能,若一個程式通過利用經驗(E)在(T)中任務上獲得了效能改善,則我們就說關於(T)和(P),該程式對(E)進行了學習。——《Machine Learning》Tom Mitchell, McGraw Hill, 1997
這裡,(T) 是你的問題場景,(P)是對“偏差”的評估,(E)是從資料中學得的模型。
江湖流傳,訓練深度學習模型的過程是“煉丹”,輸入的資料是煉丹的材料,丹方是模型結構和設計,tensorflow、mxnet這樣的框架是煉丹爐,得到的模型即“金丹”。我們不僅僅是在“煉丹”,更是在“問道修仙”,希望早日成就“金丹大道”。
個人部落格地址:重走機器學習之路——形而上者謂之道