非科班出身的人學習程式設計不負責任指南

1 贊 回覆發表於2015-10-20

為何要寫這樣一篇文章

來我們這個實驗室裡讀研的學生可能自從來到這裡的第一天就覺得自己的命運很苦逼。他們讀本科時主修的是機械設計、製造以及自動化之類的專業,畢業時的簡歷上也頂多是寫寫擅長 MS Word、PowerPoint、UGNX、AutoCAD 之類的應用軟體。他們有限的學習生涯裡,怎麼也不會想到來到這裡竟然要首先重新學習 C 語言,然後還要學 C++,接下來還要學習 Python 或 Lua 什麼的,而且竟然還不讓用 Windows,只能用連個 QQ 都沒有並且經常出故障的 Linux……

在他們心裡,程式設計似乎並不是多麼有趣的事,所以他們就覺得程式設計很難。對此我有同感,大家都會玩的 Windows 裡的挖雷與紙牌那樣的小遊戲,還有很多人會打的麻將,還有圍棋,這些事我覺得也挺難的。

我曾經告訴他們,如果不會程式設計,那麼他們就很難解決自己的研究方向上的那些問題,因此也就不可能寫出有價值的論文,不可能順利的畢業拿到學位,不可能找到很好的工作……這種功利性的『威脅』,對於有些人會有點效用,但是如果沒有能力讓他們自發的對程式設計產生足夠的興趣,這對於任何一個『好為人師』的人而言都是一種莫名其妙的羞辱。

現在我試著去告訴他們,程式設計不僅不難,而且會很有趣,其中充滿著值得深思的東西,而這些深思對於我們人生也會產生許多增益。於是,就有了這篇文章。

程式設計是什麼

無論你是不是程式猿,每一天你都在程式設計,每一天你都被程式設計。程式設計,就是設計一些步驟,組織這些步驟,讓這些步驟在當前環境中正確的執行,最終得出自己想要的結果。

你的每一天都是在起床、喝水、吃飯、工作、上廁所、娛樂、睡覺等步驟的有序組織下運轉的,你活在這個程式中,同時你在這個程式中為改善自己的生活而制定各種計劃並努力去實現。

機械設計,其實比程式設計還要程式設計。所謂的機械零件,就是資料結構。所謂的傳動機制,就是應用程式介面(API)。所謂發動機,就是程式的核心。你將零件裝配好,透過傳動機制將它們接駁到發動機上,於是你就創造出來一部機器,通上電或者打著火,就可以讓它運轉起來。

程式設計比機械設計來的更為簡單,你不需要經常給自己所編寫的程式新增潤滑油,也不需要去對每個資料結構進行復雜的力學分析,更不需要關注這些資料結構是否嚴絲合縫的相互配合,至少目前的計算機軟體工程是這個樣子的,它不像機械工程學科那樣以堅實的物理定律為基礎。機械的結構與執行規律總是可計算、可分析的,而軟體的結構與執行過程卻充滿著太多不嚴格的環節。這種不嚴格,卻給我們營造了一個可以發揮天賦或工科實踐經驗的空間。顯然,即使軟體工程存在著各種不嚴格,但是我們卻能夠透過程式設計模擬出機械工程的一切。事實上也是如此,現代的機械工程領域,軟體已經無處不在。

機械設計有很多精妙的『演算法』,像縫紉機、槍械、發動機之類的機構,設計它們其實要比計算機世界裡的演算法設計難得多,而且這些機構對人類文明的發展往往能夠產生巨大的推動作用。希望你不要因此愛上機械設計……學會程式設計,你會對機械設計的理解更為深刻。因為程式設計是將『設計』本身作為一種智力活動而對待的。你可以將機械工程領域的那些智力活動應用於程式設計,也可以將程式設計中的智力活動應用到任何設計之中

clipboard.png

正如 SICP 一書的序言所言,教育者、將軍、營養學家、心理學家以及父母們,他們做規劃,而士兵、學生以及某些社群則被規劃。克服大型的問題,要經過一系列的規劃,其中大部分規劃會運作於現實之中,因為這些規劃總是與迫切處理的問題息息相關。若將規劃這件事情本身作為一項智力活動來欣賞或研究,那麼就必須轉到計算機程式設計上面來。你需要閱讀與編寫計算機程式,而且要大量的做。程式是怎樣的,它們的功能是什麼,這些不太重要,重要的是它們的效能如何,它們之間能否精巧的相互配合從而構造更大規模的程式。

入門書

學習程式設計之前,應該先問自己一個問題:我為什麼要學習程式設計?不要打我……我知道你們是被逼著去學習程式設計的,那就不妨被逼著思考『我為什麼要學習程式設計?』。

如果不知道答案,也沒有關係。反正這個問題與學習程式設計也沒有太大關係。其實,我們已經做了非常多的不需要回答為什麼的事了。我們連『我們為何而存在』這樣的問題都不知道答案,卻依然糊里糊塗的活到了現在。

先推薦幾本入門書以及閱讀它們的方法。對於我們而言,選對書很重要。國內科班出身的人所用的教科書對於我們來說往往不合適,因為這些教科書可能比較適合在課堂上使用,課堂上總是會有一個能讀懂這些寫的挺糟糕的教科書的老師,他極有可能不會按照教科書裡的套路來講課,而教科書卻可以扮演課堂筆記的角色。也就是說,大部分國產的程式設計書,它們比學生的課堂筆記強不了多少。非科班出身的人,沒有課堂,沒有老師,所以也就看不懂『課堂筆記』。好在,國外有一批優秀的書籍,課堂中的老師就在書中。

閱讀方法也挺重要,因為學習程式設計最不需要就是將一本講程式設計的書從頭讀到尾……對於非科班出身的人而言,程式設計不是考試,沒必要讓自己所掌握的知識去覆蓋所有的程式設計問題。人的精力極為有限,大部分人終其一生,能在一兩個方向上有所建樹已經很對得起自己了,因此幾乎任何一本程式設計的書裡總會有些東西是你沒必要去看的。總是不要忘記,我們是非科班出身,沒那麼多的時間去揮霍,而節省時間的最好的辦法就是隻取自己所需,前提是你的方向與目標是明確的。所以在讀書的過程中,不要停下問自己,為什麼要學習程式設計?

我推薦的第一本書是《計算機程式的構造和解釋》,英文名是《Structure and Interpretation of Computer Programs》,簡稱 SICP。英語閱讀能力好的同學,可以看英文版。中文閱讀能力好的同學,可以看中文譯本,裘宗燕老師的文字素養與翻譯的嚴謹程度基本上是可讚的(如果中文譯本某些地方看不懂了,可以參照英文版)。這本書的閱讀,建議分以下三個階段:

  1. 閱讀前兩章,第一章是講計算過程的抽象方法,第二章是講基本資料型別(資料結構 + 運算)。這兩章的內容涵蓋了軟體世界的『九年制義務教育』的全部內容,所用的教學語言也是非常成熟且設計精巧的 Scheme 語言的一個很小的子集。學習這兩章內容的過程中,可以穿插著閱讀《Teach Yourself Scheme in Fixnum Days》的前 10 章,這份 Scheme 教程也有一份中文譯本。SICP 的習題,即使不去做,也應該把題目看一下,動腦子想一想,判斷一下能不能做得出來。這些習題,在網路上很容易找到答案。

  2. 複習 C 語言,教材用 Kernighan 與 C 語言之父 Ritchie 合寫的那本《C 程式設計語言》即可(學習期間,可以瞭解一下 C99 與 C11 標準)。這個階段的設定,主要是面向我們實驗室內部。因為我們實驗室裡的同學在本科階段通常是要修 C 語言這門課的,但是當時他們可能並未真正從學習程式設計的角度去學習,現在可以透過第一階段由 Scheme 語言建立的程式設計觀念去重新認識一下 C 語言,只有這樣方能理解 C 語言的優點與缺點,並且去思考如何充分發揮 C 的優勢,然後用 Scheme 來彌補 C 的不足。藉助 GNU Guile 2,很容易實現 C 與 Scheme 複合程式設計。這個過程可以穿插閱讀 Kernighan 寫的《程式設計實踐》。

  3. 閱讀 SICP 的第 3 章,然後再找一本講 C++ 的書,比如 C++ 世界中非常有名但我不以為然的磚書《C++ Primer》,只學習基於類的資料抽象以及物件導向程式設計部分。SICP 的第 3 章闡述了物件導向程式設計與函數語言程式設計兩種正規化。從 SICP 中獲得的物件導向程式設計,可以在 C++ 的學習中得到一些強化,至於 C++ 中的泛型程式設計,初學者不必過度深究,只需掌握 C++ 標準庫的基本用法,等具備一定的程式設計經驗之後,根據需要時另作打算。最後,記得將《Teach Yourself Scheme in Fixnum Days》剩下的內容看完。

C++ 的入門書,我更推薦《C++ Without Fear》,中文譯本叫《好學的 C++》,現在應該是第 2 版。之所以不推薦大家認為是 C++ 四書五經之一的《C++ Primer》,是因為我總覺得它像一本事無鉅細的案頭手冊,比較適合那些已經有了程式設計經驗甚至 C++ 經驗的程式猿閱讀。我心目中真正好的教材應該像小說那樣,由一條或多條邏輯主線延展而成,這種教材對於非科班出身的人尤為重要。

對於大部分程式設計任務而言,上述書所涉及的知識已經足夠用了,而且上面的這幾本書也是非常耐讀的書,只要你不是那麼著急的將它們讀完,它們總是很有趣。我很喜歡 SICP 與《程式設計實踐》這兩本書,因為太喜歡了,所以一直都不捨得把它們讀完。

注:會有人嘲笑,又有人又給大家推薦了連他自己都沒看完的書!事實上,SICP 與《程式設計實踐》這兩本書我讀完過。SICP 看了 1.x 遍(因為我對寫編譯器這種事不是很感興趣,所以第四章與第五章只是粗讀,前三章我看了不下三遍)。類似的,《程式設計實踐》也看了 1.x 遍。我之所以說『不捨得把它們讀完』,想表達的是每次重讀它們時,我都當自己沒讀過。

讓實踐有些難度

書是要看的,但是看書的過程中最好開動你的雙手。所以,你不應該停下來問自己:為何要學習程式設計?

我希望總有一天,你能給自己找到一個答案,那就是你想寫一個 XXX 程式。這個程式至少應該對你是有用,亦即它的主要功能不與你的系統裡的其他程式存在著重複。如果你能明確這一點,那麼你所創造的程式就有了意義,你的學習就有了意義。

為何要學習程式設計?因為你要創造一些從來沒有的軟體,而且它能夠幫助你做一些你認為是很重要的事!凡是你認為重要的事,對於很多人而言,很有可能也是很重要的,因此你所創造的東西就可以幫助更多的人,這意味著會有一些你可能不認識的人需要你,這就是你的價值所在。

程式設計是基於現實生活的創造。這種創造是漸進的,你在創造之初可能也無法預料到結果會是如何,這是任何創造性活動的基本屬性。程式設計的實踐,應該將它作為探索未知世界的智力活動,應該從書中跳出來,將自己從那些示例中獲得的經驗用於解決現實中的問題。如果你覺得,現實中根本不存在什麼問題需要你去解決。那麼……請你回答一下『你為何而存在』這個問題吧。

看書,是從前人正確的經驗中學習。實踐,是從自己的失敗中學習。既然決定要實踐了,所以還是給自己找一些比較難走的路走走看吧,讓失敗多一些,讓失敗早一些。

以我個人比較感興趣的幾個東西為例,可以寫一個基於 TeX 的現代文學程式設計語言,透過它不僅可以歷練程式設計能力,也會對編譯原理中的語法分析環節有一些實際的認識。也可以嘗試去寫一個三維幾何庫,能夠完成凸包、Delaunay剖分以及 Voronoi 圖等計算,不求大而全,只求小而精,以後漫長的時間裡可以慢慢的去改進它。還可以去找一個自己喜歡的開源專案,去閱讀它的原始碼,瞭解它所用的專案構建系統,分析專案結構,試著去修改它的程式碼……我現在最感興趣的是 LuaTeX。

問題是最重要的

假如你已經有了非常多次的實踐上的失敗,並且你已經大致掌握了 Scheme 與 C/C++ 這樣的語言,那麼每年學一門新的語言,這並非難事。可能你會對網路上經常發生的語言之戰覺得奇怪。

是問題決定了語言,是問題決定了程式設計正規化,是問題決定了信仰。如果你能很明確的認識到這些,那麼你就不會陷入某種語言宗教的泥淖之中。對於許多事都是如此……搞機械的人,也經常信仰 UGNX,CATIA,PROE 這些『宗教』的……

如果非要給自己找一種信仰,那麼我信仰我的存在就是為了解決問題的

如果在我用的 Linux 系統上做一些自動化程度高一些的維護任務,我不會厭憎佶屈聱牙的 Bash 指令碼,而是非常欣賞它像膠水一樣快速的將幾個本來是獨立執行的程式連線起來替我完成複雜的任務。

如果我要臨時的做一些文字處理工作,我可以用 python 3,因為它對 UTF-8 支援的挺好,而且字串庫功能齊備。如果只是進行一些文字的替換,emacs 或 sed 之類現成的工具也夠用了。

如果我要寫一個嚴肅的程式,嚴肅到了它的生命可能要很久,那我會選擇一門成熟穩定的語言來實現它,即使用 C,我也不會煩棄它的繁瑣的程式碼,我會盡力凝練程式中要實現的功能。

人生中本來就面臨著許多選擇,但是非常多的人在選擇之前並未認真的去考察自己面對的問題。

不過,對問題本身的考察,需要一套基本的工具集。沒有聽診器、手術刀或 X 光,再厲害的醫生也無法分析人體的內部發生了什麼。對於程式設計而言,我認為上述我推薦的書中所涉及的知識已經足夠用來洞察軟體世界的各種問題了,以此為基礎,我們只需再保持心態的開放,隨時汲取所需的知識就可以了。例如,雖然上述幾本書沒有一本是講 Web 開發的,但是如果你熟悉 Scheme,就可以發現 JavaScript、HTML 5、CSS 3 之類的語言並沒有超出 Scheme 的範疇,你可以很快的就掌握它們。

演算法

解決問題需要演算法。既然程式設計無處不在,那麼演算法也是無處不在的。但是,如果隨便拿起一本講演算法的書,隨便一本,可能都會讓你覺得頭昏腦脹。也許你會擔心,連演算法的書都看不懂,還怎麼寫程式?

當初我剛學習程式設計的時候,寫過二十四點、漢諾塔、八皇后、俄羅斯方塊之類的小程式。後來,在現實的專案裡,也寫過堆排序、快速排序、矩陣的 LU 與 SVD 分解、無向連通圖的最小生成樹及最短路徑之類的程式。但是現在,隨便拿一個讓我去實現,我還是不得不去翻書看懂演算法,然後再去寫程式……

我想說的是,如果你正在閱讀一本講演算法的書,書裡有些演算法或它的示例是你一時無法看懂的,可以跳過去。很多專門講演算法的書裡,充斥著心智遊戲。如果你無法將自己代入到這些遊戲的情境中,這個遊戲的玩法自然就是不明瞭的。現在看起來,這是很自然的事,然而當初我卻一遍又一遍的懷疑自己的智商,特別是看到網路上很多人像喝白開水一樣的談論著這些心智遊戲,我一度懷疑,我不適合做程式設計方面的事。

幸好,這個世界足夠穩定,以至於我們不需要了解相對論與量子力學也能夠很好的生活下去。大部分人,連牛頓力學都不需要了解……演算法也是這樣,特別是現在已經存在了相當多的實現,例如幾乎任何一種程式語言的標準庫中都提供一維資料的快速排序演算法的實現。基本上,只要是對現實中的問題非常重要的演算法,你總是能夠找到它們的既有實現,取而用之。

當你走在街上,那些高高矗立恢宏建築,建築工人建造它們的過程中可曾用了極高心智的技術?程式設計,本質上也是如此,工程經驗的重要性大於心智。甚至在程式設計中,過多的運用心智,反而會適得其反。

我不是說學習演算法沒有必要,我只是強調不要被一時難以理解的演算法擋住你。你天生就擁有一些無比強大的演算法,它們是窮舉、貪婪與分治,還有最強大的『演化』與『神經網路』。那些專門講演算法的書,只不過是是了很蹩腳的語言、符號以及示例將你天生的直覺刻畫出來而已。只要你在現實中遇到問題,你總是能夠找到求解這個問題的方法,而不是隻有讀懂了某本講演算法的書你才能解決這個問題。

很多演算法書,都是我看不懂的。它們的第一章就是讓我複習數學歸納法,第二章就是讓我學習演算法的時間與空間複雜度分析……而我屬於對數學缺乏直覺的人,對我而言,這些書的唯一價值就是故意不讓我去讀它。即使是我心目中的大神 Knuth 的傳世之作《計算機程式設計藝術》,它唯一的目的似乎就是讓我覺得我不是搞藝術的。

很久之後,我在學校圖書館閒逛的時候,發現了《如何求解問題:現代啟發式方法》這本書,翻了翻,就開始嘆息,為什麼一開始不知道這本書?

增強對計算機的理解

有時間與精力可以閱讀一些專業性強一些的計算機理論的書籍,譬如作業系統原理、編譯原理、演算法與資料結構之類。看不懂太專業的書,或者沒那麼多時間和精力,可以看看電腦科學的一些科普著作。有本《通靈晶片》值得一看,薄薄的小冊子,三五天的業餘時間就可以看完。有本《編碼:隱匿在計算機軟硬體背後的語言》,算是《通靈晶片》的加強版,也值得一看。有一本《深入理解計算機系統》,以程式設計師的視角來看計算機的軟硬體系統,也是一本很好的書,不過就是要讀完它,需要一些耐心與時間,所以沒必要一次性看完。也可以繼續將 SICP 的第四、五章看完。

雖然你的程式設計技能不會因為讀了這些講述計算機原理的書而突飛猛進,但是這些書可以讓你理解你的程式是在一個什麼樣的世界裡執行的。雖然你不知道自己為何而存在,但是你知道這個程式為何而存在。你不僅知道它為何而存在,還知道它怎樣存在,並且也知道怎樣讓它更好的存在。這樣,也就沒必要在那些所謂的『XXX 箴言』、『XXX 之道』、『XXX 之禪』的書籍上浪費你有限的生命。

有時間,也可以複習一下《駭客帝國》,它的導演雖然不是程式猿,但勝似程式猿。看完駭客帝國,也可以看看 Steven Levy 寫的《駭客:計算機革命的英雄》。從技術層面躍遷到人文層面,也許那時你會對自己的人生有著更為深刻的認識。計算機,是人類為自己創造出來的最好的一面鏡子。我們現在沒有能力瞭解自身,但是我們可以製造與發展計算機來逐步瞭解自己。

從其他領域尋找答案

有必要閱讀一些哲學、物理、生物之類的書籍,如果沒時間或者基礎也不好,可以看科普書籍,而且我比較推薦看後者。看這些書,對程式設計技能沒有太直接的幫助,但是它們往往會讓你對身處的這個世界有所反思,甚至可以獲得一些新的認識,讓自己的意志更為篤定。

如果從未想過去看哲學的書,我推薦一本 14 歲的少男少女就應該閱讀的《蘇菲的世界》。羅素的那本《西方哲學史》雖然出自他個人的視角,但是顯然我們對哲學的理解也很難達到他那樣的高度,鑑於我們也不是打算去在哲學上有所成就,《西方哲學史》足夠我們看的了。我不認為這個世界上真正存在『正確』的哲學。

複習物理。《費恩曼物理學講義》第一卷就很好,人類所能感知到的這個世界,費恩曼像講故事一樣的差不多一網打盡了。如果連費曼的書都看不懂,不妨看看《時間的形狀》+《量子物理史話》,它們是近年來在相對論及其之後的物理學方面中國人寫的非常優秀的科普書。還有一本是我大學時經常看的《從一到無窮大》,雖然年代已頗為久遠,但依然不失為極好的物理科普著作。

生物學,這門課在中學時是我最討厭的課程之一。因為我實在是看不懂書裡的插圖,鄉村中學連個顯微鏡與真實的標本都沒有,所以長期以來,我一直都是個生物盲。很多常見的花草樹木鳥獸蟲魚,我連它們的名字都叫不上來,更不要說它們具體屬於哪個門綱目科屬種了。但是有一本生物學的書我還是能看懂的——《漫畫玩轉遺傳學》,這是本非常好的遺傳學科普書。當時我是因為學習遺傳演算法而買來的,結果從它從第一頁開始就把我的眼睛抓住了。

這些書你都看過麼?

都看過,但是有一些也沒有看完。有些書是看完了,但是時間久了,有些遺忘,一直想找點時間再重讀一遍。

有些書是因為實在太好,不忍心一下都看完。這樣說,有些矯情,但事實就是如此。像《費恩曼物理學講義》,雖然有著物理學界小飛俠之稱的費恩曼已經將深邃的物理學變成了我能夠讀懂的人類語言,但是一方面我不是專業研究物理學的人,我沒有必要趕進度似的將他的書徹底讀完。學物理專業的人,可能也不會去將《計算機程式的構造和解釋》與《計算機程式設計實踐》看完的,否則他們就不會那麼酷愛 python 了。

有些書對我而言是因為太難,即使我覺得已經看完了,但過一段時間發現,跟沒看過是一樣的。這些書,我也只能歸類為沒有看完的書。

凡是我看的書,都是我認為在書中所涉及的方向上,作者比我走的更為深遠。不過,我也不自卑,因為他們現在已經沒法走了……

後記

本文寫於一個深秋又寂寞的下午,目的只是為我的小夥伴們學習程式設計指出一條道路。從 SICP 開始,可能有許多人覺得不靠譜,但是考慮到這些小夥伴一個一個都是研究生,考研期間經過了高數、線代、機率以及英語的『洗禮』,研一也會修數值分析與矩陣分析這兩門數學課。即使他們以前從未接觸過程式設計,但是他們的情況,SICP 還是挺適合他們的。如果他們連 SICP 的前兩章都搞不定,這隻能說明他們連 MIT 大一的學生都不如了……

對於我不知道底細又打算學程式設計的同學,這篇文章可能不會太靠譜,所以我只能在題目中寫上『不負責任』。不過,文章中出現的這些書,我覺得還都是挺不錯的,有時間看一下,應該不是浪費時間。

相關文章