演算法與面試之-如何準備演算法面試

吳軍旗發表於2018-06-15

主要介紹演算法面試的一些問題、以及如何準備演算法面試

演算法面試不僅僅是正確的回答問題

對於面試中遇到的大多數問題,都能有一個合理的思考路徑

什麼是演算法面試?

  • 讓大家在面對面試中的演算法問題時,有一個合理的思考路徑:
  • 不代表能夠“正確”回答每一個演算法問題,但是合理的思考方向其實更重要,也是正確完成演算法面試問題的前提
  • 演算法面試優秀不意味著技術面試優秀
  • 技術面試優秀不意味著能夠拿到Offer

什麼是給出合理的思考路徑?

  • 演算法面試的目的不是給出一個“正確”答案,
  • 而是展示給面試官你思考問題的方式。

“正確”本身是一個相對概念

  • 演算法面試不是高考。
  • 把這個過程看作是和麵試官一起探討一個問題的解決方案。
  • 對於問題的細節和應用環境,可以和麵試官溝通。
  • 這種溝通本身很重要,它暗示著你思考問題的方式。

例子

我們需要對一組資料進行排序

  • 設計排序介面,標準庫的設計,業務中排序演算法。
  • 排序是基礎操作,很重要。

解決

快速排序演算法:O(nlogn)

  • 忽略了演算法使用的基礎環境。要動態選擇。

(向面試官提問):這組資料有什麼樣的特徵?

  • 有沒有可能包含有大量重複的元素?
  • 如果有這種可能的話,三路快排是更好地選擇。
  • 普通資料:普通快速排序就行了;java語言標準庫排序使用的三路快排。
  • 是否大部分資料距離它正確的位置很近?是否近乎有序?
  • 如果是這樣的話,插入排序是更好地選擇。
    • 按照業務發生順序,先發生先完成,幾乎有序,插入排序是更好的選擇。
  • 是否資料的取值範圍非常有限?比如對學生成績排序。
    • 如果是這樣的話,計數排序是更好地選擇。高考成績取值範圍有限:計數排序更好。

(向面試官提問):對排序有什麼額外的要求?

  • 是否需要穩定排序?
    • 如果是的話,歸併排序是更好地選擇。

(向面試官提問):資料的儲存狀況是怎樣的?

  • 是否是使用連結串列儲存的?
    • 如果是的話,歸併排序是更好地選擇。
    • 快排依賴於陣列的隨機存取。

(向面試官提問):資料的儲存狀況是怎樣的?

  • 資料的大小是否可以裝載在記憶體裡?
    • 資料量很大,或者記憶體很小,不足以裝載在記憶體裡,需要使用外排序演算法。

對一組資料進行排序小結

  • 有沒有可能包含有大量重複的元素?
  • 是否大部分資料距離它正確的位置很近?是否近乎有序?
  • 是否資料的取值範圍非常有限?比如對學生成績排序。
  • 是否需要穩定排序?
  • 是否是使用連結串列儲存的?
  • 資料的大小是否可以裝載在記憶體裡?

什麼是“正確”的回答一個演算法問題

  • 正確除了你能把程式碼編出來執行出正確的結果。正確還包含對問題的獨到見解;優化;程式碼規範;容錯性;
    • 不僅僅是給出解決演算法問題的程式碼,還要把上面因素包括。
    • 如果是非常難的問題,對你的競爭對手來說,也是難的。
  • 關鍵在於你所表達出的解決問題的思路。
  • 甚至通過表達解題思路的方向,得出結論:這個問題的解決方案,應該在哪一個領域,我可以通過查閱或者進一步學習解決問題。

演算法面試只是面試的一部分

  • 演算法面試只是技術面試的一部分。
  • 根據你的簡歷和應聘職位的不同,勢必要考察其他技術方面。
  • 專案經歷和專案中遇到的實際問題
    • 解決能力,是否參與
    • 深入思考
    • 技術態度

面試前梳理自己簡歷上所寫到的專案:整理一下可能會問到的。

  • 你遇到的印象最深的bug是什麼?
  • 物件導向
  • 設計模式
  • 網路相關;安全相關;記憶體相關;併發相關;…
  • 系統設計;scalability(大規模)

技術面試優秀不意味著能夠拿到Offer

技術面試只是面試的一部分。面試不僅僅是考察你的技術水平,還是瞭解你的過去以及形成的思考行為方式。

  • 關於過去:參與專案至關重要

專案經歷:

  • 工作人士
  • 研究生
  • 本科生
    • 畢業設計
    • 其他課程設計(大作業)

如何找到專案?

  • 實習
  • 建立自己的專案
    • 自己做小應用:計劃表;備忘錄;播放器…
    • 自己解決小問題:爬蟲;資料分析;詞頻統計...
    • “不是專案”的專案:一本優秀的技術書籍的程式碼整理等…(github)
    • 分享:自己的技術部落格;github等等

行為類問題

通過過去了解你的思考行為方式:

  • 遇到的最大的挑戰?
  • 犯過的錯誤?
  • 遭遇的失敗?
  • 最享受的工作內容?
  • 遇到衝突的處理方式?
  • 做的最與眾不同的事兒?

具體闡述:我在某某專案中遇到一個怎樣的演算法問題:這個問題是怎樣的。它是我遇到的最大的挑戰,我是如何克服解決的。

準備好合適的問題問面試官

  • 整個小組的大概執行模式是怎樣的?
  • 整個專案的後續規劃是如何的?
  • 這個產品中的某個問題是如何解決的?
  • 為什麼會選擇某些技術?標準?
  • 我對某個技術很感興趣,在你的小組中我會有怎樣的機會深入這種技術?

演算法面試仍然是非常重要的一部分

如何準備演算法面試

準備面試和準備演算法面試 是兩個概念

  • 演算法面試,只是面試中的一個環節。
  • 遠遠不需要啃完一本《演算法導論》
    • 強調理論證明
    • 第一遍讀不需要弄懂證明
    • 前幾遍閱讀應該記住結論就行了,不需要弄懂證明。把更多的精力放在演算法思想上。
  • 針對演算法面試,演算法導論裡面的理論推導和證明不是很重要的方面。

演算法與面試之-如何準備演算法面試

演算法與面試之-如何準備演算法面試

學習切記完美主義

  • 高階資料結構和演算法面試提及的概率很低

提及很低的演算法

  • 基礎的概念要知道,但是不需要實現等更深入的層面。
  • 遠遠不需要到達資訊學競賽的水平

面試不是acm

演算法面試的準備範圍

  • 不要輕視基礎演算法和資料結構,而只關注“有意思”的題目
  • 各種排序演算法
  • 基礎資料結構和演算法的實現:如堆、二叉樹、圖…
  • 基礎資料結構的使用:如連結串列、棧、佇列、雜湊表、圖、Trie、並查集…
  • 基礎演算法:深度優先、廣度優先、二分查詢、遞迴…
  • 基本演算法思想:遞迴、分治、回溯搜尋、貪心、動態規劃…

例子

Intel的面試題:

初始序列為1 8 6 2 5 4 7 3的一組數採用堆排序,當建堆(小根堆)完畢時,堆所對應的二叉樹中序遍歷序列為:( )

A. 8 3 2 5 1 6 4 7

B. 3 2 8 5 1 4 6 7

C. 3 8 2 5 1 6 7 4

D. 8 2 3 5 1 4 7 6

樂視的面試題:

對一個含有20個元素的有序陣列做二分查詢,陣列起始下標為1,則查詢A[2]的比較序列的下標為()

A. 9、5、4、2

B. 10、5、3、2

C. 9、6、2

D. 20、10、5、3、2

考查二分查詢法。

阿里巴巴面試題

一組記錄排序碼為(5、11、7、2、3、17),則利用堆排序方法建立的初始堆為()

A. (11、5、7、2、3、17)

B. (11、5、7、2、17、3)

C. (17、11、7、2、3、5)

D. (17、11、7、5、3、2)

E. (17、7、11、3、5、2)

F. (17、7、11、3、2、5)

百度面試題

在圖採用鄰接表儲存時,求最小生成樹的Prim演算法的時間複雜度為( )

  • O(n)
  • O(n+e)
  • O(n^2)
  • O(n^3)

重點關注

  • 基礎資料結構的使用:如連結串列、棧、佇列、雜湊表、圖、Trie、並查集…
  • 基礎演算法:深度優先、廣度優先、二分查詢、遞迴…
  • 基本演算法思想:遞迴、分治、回溯搜尋、貪心、動態規劃…

選擇合適的OJ(Online judge):線上判題系統

  • 不要選擇過於偏向程式設計競賽的OJ *面向競賽難度過高

面向競賽

  • 選擇合適的oj

  • leetcode

  • HankeRank

    HankeRank

    • 特點是對於問題的分類很詳細。偏難,不過可以對某一類細分問題解決。
    • www.hackerrank.com

注意

  • 在學習和實踐做題之間,要掌握平衡
  • 基礎演算法實現與演算法思想

如何回答演算法面試問題

解決演算法面試問題的整體思路

  • 注意題目中的條件
    • 給定一個有序陣列...(二分法)
  • 有一些題目中的條件本質是暗示
    • 設計一個O(nlogn)的演算法(分治:在一顆搜尋樹中完成任務,對於資料排序)
    • 無需考慮額外的空間(用空間換時間上的優化)
    • 資料規模大概是10000(O(n^2)就可以)

當沒有思路的時候

  • 自己給自己幾個簡單的測試用例,試驗一下
  • 不要忽視暴力解法。暴力解法通常是思考的起點。

例子

LeetCode 3 Longest Substring Without Repeating Characters

在一個字串中尋找沒有重複字母的最長子串
如”abcabcbb”,則結果為”abc”
如”bbbbb”,則結果為”b”

  • 對於字串s的子串s[i...j]

  • 使用O(n^2)的演算法遍歷i,j,可以得到所有的子串s[i...j]

  • 使用O(length(s[i...j]))的演算法判斷s[i...j]中是否含有重複字母

  • 三重迴圈:複雜度O(n^3),對於n=100的資料,可行

優化演算法

  • 遍歷常見的演算法思路

  • 遍歷常見的資料結構

  • 空間和時間的交換 (雜湊表)

  • 預處理資訊(排序)

  • 在瓶頸處尋找答案:O(nlogn) + O(n^2) ; O(n^3)

    • O(n^2)能否優化。
  • 什麼樣的問題使用什麼樣的思路和資料結構。

實際編寫問題

  • 極端條件的判斷

    • 陣列為空?
    • 字串為空?
    • 數量為0?
    • 指標為NULL?
  • 程式碼規範:

    • 變數名
    • 模組化
    • 複用性

-------------------------華麗的分割線--------------------

看完的朋友可以點個喜歡/關注,您的支援是對我最大的鼓勵。

個人部落格番茄技術小棧掘金主頁

想了解更多,歡迎關注我的微信公眾號:番茄技術小棧

番茄技術小棧

相關文章