一個資料探勘大牛,用程式演算法做人生選擇

edithfang發表於2014-08-17



每年一到要找工作的時候,我就能收到很多人給我發來的郵件,總是問我怎麼選擇他們的 offer,去騰訊還是去豆瓣,去外企還是去國內的企業,去創業還是去考研,來北京還是回老家,該不該去創新工場?該不該去 thoughtworks?……等等,等等。今年從 7 月份到現在,我收到並回復了 60 多封這樣的郵件。我更多幫他們整理思路,幫他們明白自己最想要的是什麼。(注:我以後不再回復類似的郵件了)。

我深深地發現,對於我國這樣從小被父母和老師安排各種事情長大的人,當有一天,父母和老師都跟不上的時候,我們幾乎完全不知道怎麼去做選擇。而我最近也離開了亞馬遜,換了一個工作,讓我想到寫一篇這樣的文章。

幾個例子

當我們在面對各種對選擇的影響因子的時候,如:城市,公司規模,公司性質,薪水,專案,戶口,技術,方向,眼界…… 你總會發現,你會在幾個公司中糾結一些東西,舉幾個例子:
  • 某網友和我說,他們去上海騰訊,因為騰訊的規模很大,但卻發現薪水待遇沒有豆瓣高(低的還不是一點),如果以後要換工作的話,起薪點直接關係到了以後的高工資。我說那就去豆瓣吧,他說豆瓣在北京,汙染那麼嚴重,又沒有戶口,生存環境不好。我說去騰訊吧,他說騰訊最近組織調整,不穩定。我說那就去豆瓣吧,慢公司,發展很穩當。他說,豆瓣的盈利不清楚,而且用 Python,自己不喜歡。我說,那就去騰訊吧,……
  • 還有一網友和我說,他想回老家,因為老家的人脈關係比較好,能混得好。但又想留在大城市,因為大城市可以開眼界。
  • 另一網友和我說,他想進外企,練練英語,開開眼界,但是又怕在外企裡當個螺絲釘,想法得不到實施。朋友拉他去創業,覺得創業挺好的,鍛鍊大,但是朋友做的那個不知道能不能做好。
  • 還有一網友在創新工場的某團隊和考研之間抉擇,不知道去創新工場行不行,覺得那個專案一般,但是感覺那個團隊挺有激情的,另一方面覺得自己的學歷還不夠,讀個研應該能找到更好的工作。
  • 還有一些朋友問題我應該學什麼技術?不應該學什麼技術?或是怎麼學會學得最快,技術的路徑應該是什麼?有的說只做後端不做前端,有的說,只做演算法研究,不做工程,等等,等等。因為他們覺得人生有限,術業有專攻。


等等,等等……

我個人覺得,如果是非計算機科班出生的人不會做選擇,不知道怎麼走也罷了,但是我們計算機科班出生的人是學過演算法的,懂演算法的人應該是知道怎麼做選擇的。

排序演算法

你不可能要所有的東西,所以你只能要你最重要的東西,你要知道什麼東西最重要,你就需要對你心內的那些慾望和抱負有清楚的認識,不然,你就會在糾結中度過。

所以,在選擇中糾結的人有必要參考一下排序演算法。

首先,你最需要參考的就是“氣泡排序”——這種演算法的思路就是每次冒泡出一個最大的數。所以,你有必要問問你自己,面對那些影響你選擇的因子,如果你只能要一個的話,你會要哪個?而剩下的都可以放棄。於是,當你把最大的數,一個一個冒泡出來的時候,並用這個決策因子來過濾選項的時候,你就能比較容易地知道知道你應該選什麼了。這個演算法告訴我們,人的雜念越少,就越容易做出選擇。

好吧,可能你已茫然到了怎麼比較兩個決策因子的大小,比如:你分不清楚,工資>業務前景嗎?業務前景>能力提升嗎?所以你完全沒有辦法進行冒泡法。那你,你不妨參考一個“快速排序”的思路——這個演算法告訴我們,我們一開始並不需要找到最大的數,我們只需要把你價值觀中的某個標準拿出來,然後,把可以滿足這個價值的放到右邊,不能的放到左邊去。比如,你的標準是:工資大於 5000 元&&業務前景長於 3 年的公司,你可以用這個標準來過濾你的選項。然後,你可以再調整這個標準再繼續遞迴下去。這個演算法告訴我們,我們的選擇標準越清晰,我們就越容易做出選擇。

這是排序演算法中最經典的兩個演算法了,面試必考。相信你已爛熟於心中了。所以,我覺得你把這個演算法應用於你的人生選擇也應該不是什麼問題。關於在於,你是否知道自己想要的是什麼?

排序演算法的核心思想就是,讓你幫助你認清自己最需要的是什麼,認清自己最想要的是什麼,然後根據這個去做選擇。

貪婪演算法

所謂貪婪演算法,是一種在每一步選擇中都採取在當前狀態下最好或最優(即最有利)的選擇(注意:是當前狀態下),從而希望導致結果是最好或最優的演算法。貪婪演算法最經典的一個例子就是哈夫曼編碼。

對於人類來說,一般人在行為處事的時候都會使用到貪婪演算法,

比如在找零錢的時候,如果要找補 36 元,我們一般會按這樣的順序找錢:20 元,10 元,5 元,1 元。

或者我們在過十字路口的時候,要從到對角線的那個街區時,我們也會使用貪婪演算法——哪邊的綠燈先亮了我們就先過到那邊去,然後再轉身 90 度等紅燈再過街。

這樣的例子有很多。對於選擇中,大多數人都會選用貪婪演算法,因為這是一個比較簡單的演算法,未來太複雜了,只能走一步看一步,在當前的狀況下做出最利於自己的判斷和選擇即可。

有的人會貪婪薪水,有的人會貪婪做的專案,有的人會貪婪業務,有的人會貪婪職位,有的人會貪婪自己的興趣……這些都沒什麼問題。貪婪演算法並沒有錯,雖然不是全域性最優解,但其可以讓你找到區域性最優解或是次優解。其實,有次優解也不錯了。貪婪演算法基本上是一種急功近利的演算法,但是並不代表這種演算法不好,如果貪婪的是一種長遠和持續,又未嘗不可呢?。

動態規劃

但是我們知道,對於大部分的問題,貪婪法通常都不能找出最優解,因為他們一般沒有測試所有可能的解。因為貪婪演算法是一種短視的行為,只會跟據當前的形式做判斷,也就是過早做決定,因而沒法達到最佳解。

動態規劃和貪婪演算法的最大不同是,貪婪演算法做出選擇,不能回退。動態規劃則會儲存以前的運算結果,並根據以前的結果對當前進行選擇,有回退功能。

動態規劃演算法至少告訴我們兩個事:

  • 1)承前啟後非常重要,當你準備去做遍歷的時候,你的上次的經歷不但能開啟你以後的經歷,而且還能為後面的經歷所用。你的每一步都沒有浪費。
  • 2)是否可以回退也很重要。這意思是——如果你面前有兩個選擇,一個是A公司一個是B公司,如果今天你錯失了B公司,那到你明天還能不能找回來?


比如說:你有兩個 offer,一個是 Yahoo,一個是 Baidu,上述的第一點會讓我們思考,Yahoo 和 Baidu 誰能給我們開啟更大的平臺?上述的第二點告訴我們,是進入 Yahoo 後如果沒有選好,是否還能回退到 Baidu 公司?還是進入 Baidu 公司後能容易回退到 Yahoo 公司?

Dijkstra 最短路徑

最短路徑是一個 Greedy + DP 的演算法。相當經典。這個演算法的大意如下:

  • 1)在初始化的時候,所有的結點都和我是無窮大,預設是達不到的。
  • 2)從離自己最近的結點開始貪婪。
  • 3)走過去,看看又能到達什麼樣的結點,計算並更新到所有目標點的距離。
  • 4)再貪婪與原點最短的結點,如此反覆。


這個演算法給我們帶來了一些這樣的啟示:

有朋友和我說過他想成為一個架構師,或是某技術領域的專家,並會踏踏實實的向這個目標前進,永不放棄。我還是鼓勵了他,但我也告訴他了這個著名的演算法,我說,這個演算法告訴你,架構師或某領域的專家對你來說目前的距離是無窮大,他們放在心中,先看看你能夠得著的東西。所謂踏實,並不是踏踏實實追求你的目標,而是踏踏實實把你夠得著看得見的就在身邊的東西幹好。我還記得我剛參加工作,從老家出來的時候,從來沒有想過要成為一個技術牛人,也從來沒有想過我的部落格會那麼的有影響力,在做自己力所能及,看得見摸得著的事情,我就看見什麼技術就學什麼,學著學著就知道怎麼學更輕鬆,怎麼學更紮實,這也許就是我的最短路徑。

有很多朋友問我要不要學C++,或是問我學 Python 還是學 Ruby,是不是不用學前端,等等。這些朋友告訴我,他們不可能學習多個語言,學了不用也就忘了,而且術業有專攻。這並沒有什麼不對的,只是我個人覺得,學習一個東西沒有必要只有兩種狀態,一種是不學,另一種是精通。瞭解一個技術其實花不了多少時間,我學 C++ 的目的其實是為了更懂 Java,學 TCP/IP 協議其實是為了更懂 Socket 程式設計,很多東西都是連通和相輔相成的,學好了C/C++/Unix/TCP 等這些基礎技術後,我發現到達別的技術路徑一下縮短了(這就是為什麼我用兩天時間就可以瞭解 Go 語言的原因)。這就好像這個演算法一樣,演算法效率不高,也許達到你的目標,你在一開始花了很長時間,遍歷了很多地方,但是,這也許這就是你的最短路徑。

演算法就是 Trade-Off

你根本沒有辦法能得到所有你想得到的東西,任何的選擇都意味著放棄——當你要去獲得一個東西的時候,你總是需要放棄一些東西。人生本來就是一個蹺蹺板,一頭上,另一頭必然下。這和我們做軟體設計或演算法設計一樣,用時間換空間,用空間換時間,還有 CAP 理論,總是有很多的 Trade-Off,正如這個短語的原意一樣——你總是要用某種東西去交易某種東西。

我們都在用某種東西在交易我們的未來,有的人用自己的努力,有的人用自己的思考,有的人用自己的年輕,有的人用自己的自由,有的人用自己的價值觀,有的人用自己的道德…… …… 有的人在交換金錢,有的人在交換眼界,有的人在交換經歷,有的人在交換地位,有的人在交換能力,有的人在交換自由,有的人在交換興趣,有的人在交換虛榮心,在交換安逸享樂…… ……

每個人有每個人的演算法,每個演算法都有每個演算法的 purpose,就算大家在用同樣的演算法,但是每個人演算法中的那些變數、開關和條件都不一樣,得到的結果也不一樣。我們就是生活在 Matrix 裡的一段程式,我們每個人的演算法決定著我們每個人的選擇,我們的選擇決定了我們的人生。
相關閱讀
評論(2)

相關文章