很多年前我進入矽谷人才市場,當時是想找一份高階工程師的職位。如果你有一段時間沒有面試過,根據經驗,有個非常有用的提醒你應該接受,就是:你往往會在前幾次面試中的什麼地方犯一些錯誤。簡單而言就是,不要首先去你夢想的公司裡面試。面試中有多如牛毛的應該注意的問題,你可能全部忘記了,所以,先去幾個不太重要的公司裡面試,它們會在這些方面對你起教育(再教育)作用。
我第一家面試的公司叫做gofish.com,據我所知,gofish這家公司如今的情況跟我當時面試時完全的不同。我幾乎能打保票的說,當時我在那遇到的那些人都已不再那工作了,這家公司的實際情況跟我們這個故事並不是很相關。但在其中的面試卻是十分相關的。對我進行技術性面試的人是一個叫做Guy的傢伙。
Guy穿了一條皮褲子。眾所周知,穿皮褲子的面試官通常是讓人“格外”恐怖的。而Guy也沒有任何讓人失望的意思。他同樣也是一個技術難題終結者。而且是一個穿皮褲子的技術難題終結者 —— 真的,我做不到他那樣。
我永遠不會忘記他問我的一個問題。事實上,這個問題是非常的普通 —— 在當時也是矽谷裡標準的面試題。
問題是這樣的:
假設這有一個各種字母組成的字串,假設這還有另外一個字串,而且這個字串裡的字母數相對少一些。從演算法是講,什麼方法能最快的查出所有小字串裡的字母在大字串裡都有?
比如,如果是下面兩個字串:
String 1: ABCDEFGHLMNOPQRS
String 2: DCGSRQPOM
答案是true,所有在string2裡的字母string1也都有。如果是下面兩個字串:
String 1: ABCDEFGHLMNOPQRS
String 2: DCGSRQPOZ
答案是false,因為第二個字串裡的Z字母不在第一個字串裡。
當他問題這個問題時,不誇張的說,我幾乎要脫口而出。事實上,對這個問題我很有信心。(提示:我提供的答案對他來說顯然是最糟糕的一種,從面試中他大量的各種細微表現中可以看出來)。
對於這種操作一種幼稚的做法是輪詢第二個字串裡的每個字母,看它是否同在第一個字串裡。從演算法上講,這需要O(n*m)
次操作,其中n是string1的長度,m是string2的長度。就拿上面的例子來說,最壞的情況下將會有16*8 = 128次操作。
一個稍微好一點的方案是先對這兩個字串的字母進行排序,然後同時對兩個字串依次輪詢。兩個字串的排序需要(常規情況)O(m log m) + O(n log n)
次操作,之後的線性掃描需要O(m+n)
次操作。同樣拿上面的字串做例子,將會需要16*4 + 8*3 = 88加上對兩個字串線性掃描的16 + 8 = 24的操作。(隨著字串長度的增長,你會發現這個演算法的效果會越來越好)
最終,我告訴了他一個最佳的演算法,只需要O(n+m)
次操作。方法就是,對第一個字串進行輪詢,把其中的每個字母都放入一個Hashtable裡(成本是O(n)或16次操作)。然後輪詢第二個字串,在Hashtable裡查詢每個字母,看能否找到。如果找不到,說明沒有匹配成功。這將消耗掉8次操作 —— 這樣兩項操作加起來一共只有24次。不錯吧,比前面兩種方案都要好。
Guy沒有被打動。他把他的皮褲子弄的沙沙響作為迴應。”還有沒有更好的?“他問道。
我的天?這個傢伙究竟想要什麼?我看看白板,然後轉向他。”沒有了,O(n+m)是你能得到的最好的結果了 —— 我是說,你至少要對每個字母至少訪問一次才能完成這項操作 —— 而這個方案是剛好是對每個字母只訪問一次“。我越想越確信我是對的。
他走到白板前,”如果這樣呢 —— 假設我們有一個一定個數的字母組成字串 —— 我給每個字母分配一個素數,從2開始,往後類推。這樣A將會是2,B將會是3,C將會是5,等等。現在我遍歷第一個字串,把每個字母代表的素數相乘。你最終會得到一個很大的整數,對吧?然後 —— 輪詢第二個字串,用每個字母除它。如果除的結果有餘數,這說明有不匹配的字母。如果整個過程中沒有餘數,你應該知道它是第一個字串恰好的子集了。這樣不行嗎?“
每當這個時候 —— 當某個人的奇思異想超出了你的思維模式時,你真的需要一段時間來跟上他的思路。現在他站在那裡,他的皮褲子並沒有幫助我理解他。
現在我想告訴你 —— Guy的方案(不消說,我並不認為Guy是第一個想出這招的人)在演算法上並不能說就比我的好。而且在實際操作中,你很可能仍會使用我的方案,因為它更通用,無需跟麻煩的大型數字打交道。但從”巧妙水平“上講,Guy提供的是一種更、更、更有趣的方案。
我沒有得到這份職位。也許是因為我拒絕了他們提供給我的一些討厭的工作內容和其它一些東西,但這都無所謂了。我還有更大更好的目標呢。
接著,我應聘了become.com。在跟CTO的電話面試中,他給我佈置了一道”程式設計作業“。這個作業有點荒唐 —— 現在回想起來,大概用了我3天的時間去完成。我得到了面試,得到了那份工作 —— 但對於我來說,最大的收穫是這道程式設計作業強迫我去鑽研並有所獲。我需要去開發一個網頁爬蟲,一個拼寫檢查/糾正器,還有一些其它的功能。不錯的東西。然而,最終,我拒絕了這份工作。
終於,我來到了Google面試。我曾說過Google的面試過程跟外面宣傳的很一致。冗長 —— 嚴格,但誠實的說,相當的公平。他們在各種面試過程中盡最大的努力去了解你、你的能力。並不是說他們在對你做科學研究,但我確信他們是努力這樣做。
我在Google的第四場面試是一個女工程師,老實話,是一場很無聊的面試。在前面幾場面試中我表現的很好,感覺到我的機會非常的大。我相信如果不做出什麼荒唐事情來,十拿九穩我能得到這份工作。
她問了我一些關於排序或設計方面的非常簡單的問題,我記不清了。但就在45分鐘的面試快要結束時,她對我說”我還有一個問題。假設你有一個一定長度的由字母組成的字串。你還有另外一個,短些。你如何才能知道所有的在較短的字串裡的字母在長字串裡也有?“
哇塞。Guy附身了。
現在,我完全可以馬上結束這場面試。我可以對她說“哈哈,幾個星期前我就知道答案啦!”,這是事實。但就是在幾個星期前被問到這個問題時 —— 我給出的也是正確的答案。這是我本來就知道答案的問題。看起來就好像是Guy為我的這次面試溫習過功課一樣。而且,可惡,人們通常是通過上網來蒐集面試問題 —— 而我,我可以毫不客氣的說,對於這些問題,我不需要任何“作弊”。我自己知道這些答案!
現在你們可能認為——就在她問出了問題之後,在我準備開始說出在腦海裡構思完成的最後的演講之前——你們可能會想,我應該是,當然該,從情理上講,鎮定的回答出這個問題,並且獲得讚賞。可糟糕的是,事實並不是這樣。打個比喻,就像是她問出來問題後,我在鬧子裡立即舉起了手,並大叫著“我!嗨!嗨!我知道!讓我來回答吧!”我的大腦試圖奪走我對嘴巴的控制權(這事經常發生),幸虧我堅強的毅力讓我鎮定下來。
於是我開始回答。平靜的。帶著不可思議的沉著和優雅。帶著一種故意表現出來的 —— 帶著一種,我認為,只有那種完全的淵博到對古今中外、不分鉅細的知識都精通的人才能表現出來的自信。
我輕描淡寫的說出來那種很幼稚的方案,就好象是這種方案毫無價值。我提到了給它們排序,就好像是在給早期的《星際迷航》中的一個場景中的人物穿上紅T恤似的。最後,平淡的,就好像是我決定了所有事情的好壞、演算法上的效率,我說出了O(n+m)
一次性方案。
我要告訴你——儘管我表明上的平靜——這整個過程我卻在做激烈的掙扎,內心裡我在對自己尖著——“你個笨蛋,趕緊告訴她素數方案!”
當我完成了對一次性演算法的解釋後,她完全不出意外的認可的點了下頭,並開始在筆記本上記錄。這個問題她以前也許問過了一百次,我想大部分的人都能回答上來。她也許寫的是“回答正確。無聊的面試。正確的回答了無聊的字串問題。沒有驚喜。無聊的傢伙,但可以留下。”
我等了一會。我讓這種焦灼的狀態持續的儘可能的長。我可以發誓的說,如果再耽擱一分鐘,我一定會憋出腦血栓、脫口說出關於素數的未解之謎。
我打破了沉默。“你知道嗎,還有另外一個,可能是更聰明的演算法。”
她二目空空的抬頭看了一眼,僅在瞬間閃現過一絲希望。
“假設我們有一定長度的字串。我們可以給每個字母分配一個素數,從2開始。然後我們把大字串中的每個字母代表的素數相乘得出一個數,用小字串中的每個字母代表的素數去除它。如果除的過程中沒有產生餘數,則小字串是大字串的一個子集。”
在此時,我猜,她看起來就像是Guy當時把相同的話說給我聽時我表現出來的樣子。而我演講時泰然自若的表情沒了,眼睛瞪大,說話時稍微帶出來一些唾沫星子。
一會兒後,她不得不說了,“可是…等一下,有可能…是的,可以這樣!可是如何…如果…噢,噢,可行!簡潔!”
我得意洋洋的吸了一口氣。我在我的面試記錄裡寫下了“她給了我一個‘簡潔’的評語!”在她提出這個問題之前我就確信能得到這份工作,現在我更加確信了。還有一點我十分確信的是,我(更準確的說是Guy)給了她今天的好心情。
我在Google幹了3年,生活的十分愉快。我在2008年辭職去到一個小公司裡做CTO,之後又開辦了一個自己的公司。大概是一年前,我偶然的在一個創業論壇會上遇到了Guy,他記不得我了,當我向他細述這段往事時,他對他那條皮褲子大笑不已。
話說回來,如果這個故事裡有什麼教育意義的話——永遠不要冒失的首先去應聘你夢想的公司,應先去應聘那些你不看好的職位。你除了能從這些面試中獲得經驗外,你指不定能遇到某個能為你的更重要的面試鋪路的人呢。事實上,這個經驗在你生活中的很多其它事情上也適應。
說正經的,如果你有機會想找一個解決問題的高手——僱傭Guy比誰都強。那個傢伙很厲害。
(在這些陳年舊賬裡發現的一點技術瑕疵:字母有可能重複而字串可能會很長,所以必須要有統計。用那個最幼稚的解決方案時,當在大字串裡找到一個字元後就把它刪掉,當這樣仍然是 O(n*m)次。在Hashtable裡我們會有一個key->value的計數。Guy的方案在這種情況下仍然好用。)
修改:11/30/10 —— 本文中提到的Guy看到了這篇文章,並在評論中做了澄清。值得一讀。