百度研發面經
百度智慧雲
軟體研發工程師
百度今年的提前批有點奇怪,好像都不走流程,牛客上好幾個百度內推的帖子,我投了幾個,基本上都是百度智慧雲的。
然後這些部門都安排了面試,沒有衝突,所以沒有動靜的小夥伴可以投投別的部門試試。
下面是我的兩篇面經,後續會繼續更新,每個部門側重點不太一樣。
百度智慧雲研發崗
好像是做控制檯方面的組
一面:
1自我介紹,專案
2 static關鍵字有什麼用,static修飾不同東西時有什麼作用,內部類用static修飾和不用static修飾有何區別。
3 hashmap,hashtable,concurrenthashmap區別和場景
4 volatile關鍵字有什麼用
5 jvm分割槽講下,作用講下,gc演算法講一下,gc是否會有停頓或者延遲。
6 講一下OOM和記憶體洩漏的例子,為什麼有GC還會出現記憶體洩漏和記憶體溢位呢
7 執行緒和程式的區別,通訊方式的區別。
8 悲觀鎖和樂觀鎖,說一下Java和資料庫分別怎麼實現的。
9 資料庫索引說一下,除了B+樹索引還有什麼索引。
10倒排索引說一下,如果關鍵字很多,怎麼優化。使用字首樹和hashmap優化。
11 字首樹的結構和原理說一下。
12 瀏覽器發起http請求過程,越詳細越好。
13 快取和資料庫的一致性怎麼保證
14 網上寫程式碼,寫了一個快排
15 沒了。
二面:
1 自我介紹
2 專案中難點,用到的技術
3 多執行緒,說一下執行緒的狀態和狀態轉換,詳細問
4 多執行緒的sleep方法和wait方法為什麼來源不同,一個是object方法,一個是Thread的方法。
5 為什麼object的wait和notify必須在同步塊中使用,不在同步塊使用會報錯麼,編譯報錯還是執行報錯。
6 jvm講一下gc吧,兩個物件的引用迴圈依賴,會不會被垃圾回收,什麼情況下會什麼情況下不會呢
7 GC root是哪些位置呢,我說記不起來,他說你不用記,其實就是執行時的一些物件和變數,比如區域性變數表,方法區的後設資料比如fianl,static變數,本地方法棧執行的方法。
8 資料庫瞭解哪個。Redis說一下為什麼是單執行緒的,不會很慢麼,有什麼好處。
9 Redis的IO請求模型,是不是IO多路複用呢。
10 Spring的interceptor和filter有什麼區別。我說沒區別,錯!
11 網路這塊,說一下dns請求的過程吧,dns是否會訪問快取呢,快取在本地和瀏覽器,還有dns伺服器上是不是都有。
12 get和post的區別講一下,底層的實現有區別麼,都是基於TCP,那麼如何限制get的url長度,在哪一層限制的。
13 資料結構熟麼,講一下樹和圖吧,樹的層次遍歷使用什麼結構,相應的圖的遍歷呢。講講最小生成演算法,還有迪傑斯特拉。
14 陣列,找到唯一一個出現兩次的數。
剛開始聽錯,說了位運算。
a 然後講了陣列計數,hash計數,排序比較。
b 然後面試官說條件給的是1到N-1的N個數字,重新想一下。
c 說了根據陣列位置和數字比較進行判斷。面試官最後說可以用相加求差值來判斷。
15 一個10000以下的陣列,記憶體夠。裡面只有1,2,3。排下序。
a 普通排序O(nlogn)
b 荷蘭旗問題,雙指標解決。O(N)
c 統計數量,重放陣列O(2N)
d 另外搞一個陣列,把1放頭,3放尾,也是雙指標。O(N)。空間複雜度O(N)
16 沒了。
全程50分鐘
三面HR
巴拉巴拉巴拉。基本上問題都大同小異。
百度智慧雲 資料庫部門
一面:
1 資料庫的事務,四個性質說一下,分別有什麼用,怎麼實現的。一致性沒講好。
2 講到了redo和undo日誌,問我分別有什麼用,說redo日誌說錯了。
3 資料庫的隔離性如何保證,使用悲觀鎖和樂觀鎖有何區別。MVCC的設計目的是什麼,怎麼使用版本號判斷資料的可見性。
4 問了一道演算法,1到N的所有數字,按照字典序列印,怎麼做。
說了用陣列排序,問複雜度,扯了半天。
怎麼優化,按照數字特徵順序列印,問這個東西和什麼結構比較像。提示是樹,然後說了個多叉樹,問我怎麼實現,最後其實使用dfs遍歷樹的每個分支。
5 多執行緒併發的同步實現,有兩個方法,每個方法裡有a部分程式碼和b部分程式碼,我要讓兩個執行緒分別執行兩個方法,並且讓他們執行完a部分程式碼再一起向下執行,如何實現。
6 我說了用cyclicbarrier實現,互相等待await。
然後他問我怎麼用訊號量實現,並且提示可以再用一個執行緒。
然後我說了個方案。
7 問了專案
8 如何把優化遞迴的程式碼
改成尾遞迴或者迴圈。
面試官說不是,引導說用棧實現遞迴。
問我棧中需要壓入哪些資料。他說應該是方法引數,返回值,以及返回地址。
二面:
1 自我介紹,專案 10分鐘過去
2 伺服器如何負載均衡,有哪些演算法,哪個比較好,一致性雜湊原理,怎麼避免DDOS攻擊請求打到少數機器。
3 TCP連線中的三次握手和四次揮手,四次揮手的最後一個ack的作用是什麼,為什麼要time wait,為什麼是2msl。
4 資料庫的備份和恢復怎麼實現的,主從複製怎麼做的,什麼時候會出現資料不一致,如何解決。
5 今天面試太多了,記不清了。。。
6 開源的技術看過用過麼,分散式儲存的瞭解麼。
7 想做什麼方向的開發。
8 Linux檢視cpu佔用率高的程式
9 檢視佔用某埠的程式和某程式監聽的埠
10 如何查詢日誌檔案中的所有ip,正規表示式
三面(8.3號更新):
資料庫部門真的很嚴格,問題都挺難的。
1 講一下專案
2 平時瞭解什麼作業系統
Linux,說一下Linux排查問題常用的命令,ps,top,netstat,free,du等等
3 Linux的記憶體管理演算法,問了一下是不是頁面置換演算法,他說是。
說了lru和fifo,問我lru有什麼缺點,沒答上來。
4 Linux的檔案系統瞭解麼,講了一下inode節點,檔案和目錄的原理。他問我了不瞭解具體的檔案系統ext2,ext3,答不會。。
5 程式通訊方式有哪些,問我分別怎麼使用,管道有哪些型別,各有什麼優缺點。
6 問我伺服器硬體瞭解麼。。一臉懵逼,問了我懂不懂Raid,瞎扯了幾句就說不懂了。
7 shell瞭解麼,沒怎麼寫過。
8 聽說你會Java,說一下JVM記憶體模型把,有哪些區,分別幹什麼的
9 說一下gc演算法,分代回收說下。
10 設計模式瞭解麼,說了7種,問我分別怎麼用,實際應用過嗎,稍微扯了一下。
11 MySQL的引擎講一下,有什麼區別,使用場景呢。
12 查詢最新的10條資料,想了好一會,order by id desc limit 10
13 MySQL的union all和union有什麼區別,我瞎掰了一下,應該不對。
14 MySQL有哪幾種join方式,底層原理是什麼,答不會,只知道表現形式。
15 Redis瞭解哪些啊,資料結構和基本原理把。
問我Redis怎麼做叢集,答了主從哨兵和cluster。
Redis的持久化怎麼做,aof和rdb,有什麼區別,有什麼優缺點。
16 Redis使用哨兵部署會有什麼問題,我說需要擴容的話還是得叢集部署。
17 分散式系統瞭解麼,說一下Hadoop瞭解啥。
我說基本元件稍微瞭解過,簡單搭過環境。
18 MapReduce的combiner幹啥的,我說是合併結果的,問我啥時候會用到,答不知道。
19 Hadoop分發任務時,有個job失敗了,hadoop會怎麼處理,我答不知道,猜是會繼續執行。。
20 hadoop分發任務,如果有一個節點特別慢拉慢了整體速度怎麼辦。我猜測是通過yarn分配相同的資源給每個任務,可以避免這種情況,他好像不太滿意。
21 hadoop答得很爛。問了我兩個10g檔案比較,2g記憶體,重複率很高,篩選出不同的內容。我說拆成十份hash,每份兩兩比較hash的結果集,貌似他說OK。
22 排序演算法瞭解哪些,巴拉巴拉。
23 用佇列計算一個樹的高度,我說用層次遍歷記錄節點高度。
24 一個黑名單集合,資料量很大,快速查詢一個值是否在集合裡,怎麼設計,我說布隆過濾器。
25 還是上一題,說這個黑名單可能需要動態地增刪改,如何設計才能避免訪問響應太慢。我沒思路,瞎扯了一下加硬體,用記憶體存,都被駁回了。然後他說算了。
26 上一題的黑名單做成分散式,怎麼做。說了分片的方案,根據地址的hash值確定分片所在節點。
27 分散式資料庫瞭解麼,我不太明白他問的是啥,說不了解,感覺應該是問資料庫的分散式方案。
28 有什麼想問的,據他所說還有2-3輪面試,驚了。
全程50分鐘,可以說是迄今為止難度最大的一個?
百度研發面經整合版
軟體研發工程師
基礎研發工程師
百度智慧雲
百度核心搜尋部
百度今年的提前批有點奇怪,好像都不走流程,牛客上好幾個百度內推的帖子,我投了幾個,基本上都是百度智慧雲的,當然也有其他部門。
下面是我的面經,包括三個部門的面試,每個部門側重點不太一樣。
百度智慧雲 賬號和訊息部門
一面:
1 專案
2 講一下AOP吧
3 動態代理和靜態代理有什麼區別
4 TCP和IP報文是否會分片,分別在什麼情況下會分片。
TCP分包之後是否還會進行ip分片
5 做個題
無限長軌道。兩輛車同方向開,車會滴水,怎麼讓他們相遇。這題簡直像腦筋急轉彎。
6 寫一個斐波那契數列
遞迴式,要求改進
dp方式,要求優化空間
用三個變數代替陣列進行dp,要求改進
我說數學公式,OK。
7 講一下Linux的記憶體結構,我說只會JVM的,他讓我說一下。
兩者的記憶體如何對映,是什麼關係,不會。
8 沒了
二面:
1 專案講一下,10多分鐘去了。
2 排序演算法,複雜度,比較。快排的空間複雜度是logn
3 講一下OSI七層模型,我說了5層模型,然後他讓我再補充一下,問了每層的作用,問了wifi屬於哪一層。
4 執行緒間的同步用什麼方式,說了object方法。
問我使用hashmap時重寫哪兩個方法,為什麼要重寫,巴拉巴拉,什麼場景下重寫。
5 平時用過什麼資料結構,list用哪些有啥區別。
6 Spring中的ioc和aop。ioc的註解有哪些。
autowired和resource有什麼區別,作用域有哪些。
autowired如何配置兩個類中的一個嗎
7 寫一個單例模式,有點忘卻了,巴拉巴拉搞出一個雙重檢測的,中間改了多次。
8 Java會有記憶體洩漏嗎,三個區分別什麼情況下會產生記憶體洩漏
三面:
1 主要了解哪些技術
2 分散式系統怎麼設計,說了CAP和BASE,最終一致性
3 問我最終一致性是什麼,舉一下強一致性和最終一致性的例子。分散式事務和訊息佇列
4 分散式事務的訊息id怎麼確認順序,我說使用zk
5 zk的效能瓶頸怎麼克服,我說使用redis和redis叢集。
6 跨機房的網路延遲怎麼解決,我說不懂,他讓我猜一俠華北到華南的延遲時間大概是多久,我說大概十秒內。
7 網路這塊熟麼,說一下socket程式設計吧。說了一下java的socket
8 網路程式設計的NIO和BIO區別,阻塞指的是什麼意思呢。
9 socket客戶端和服務端的連線過程和通訊過程說一下。
10 作業系統熟麼,一般版,shell和命令熟麼,不熟。
11 演算法熟麼,答不熟。
12 系統怎麼設計,設計模式怎麼用
13 系統優化怎麼做,cpu,IO,記憶體分別怎麼排查問題和調優
14 家鄉,女朋友,巴拉巴拉
百度核心搜尋
一面:
1 自我介紹
2 docker和k8s瞭解多少
3 研究生學了哪些課程
4 作業系統瞭解麼,講一下程式和執行緒
5 死鎖和處理方式
6 記憶體,虛擬記憶體和頁面置換
7 網路瞭解麼,講一下三次握手和四次揮手
8 資料庫瞭解多少,mysql索引,事務,鎖講了一些
9 Redis呢,講了一下資料結構,持久化方式,使用場景
10 分散式瞭解哪些,負載均衡有哪些方式,說了dns,nginx,lvs和硬體,一致性問題怎麼解決,說了2pc,3pc,raft和paxos,zab
10 mysql大表資料查詢,怎麼優化,分表,分庫。
11單連結串列判環
使用快慢指標解決
12 完全二叉樹判斷:
二面:
1 專案
2 docker和kubenetes的原理和了解程度
3 docker的cgroup瞭解麼
4 kubenetes的架構,擴容是怎麼完成的。
5 Java的四種引用
6 Java的執行緒通訊方式
7 Linux的程式通訊方式
8 Java的執行緒池
9 演算法
1 - N + 1這些數中取出N個,問剩下的是哪個。。
我說加起來相減,面試官說取巧了,不能這樣。
我說比較陣列下標,他還是說取巧。
於是我讓他提示我一下,他說了排序再找。。額
然後想了兩個空間換時間的辦法,一個是用hashmap遍歷兩個陣列。一個是合併陣列後統計數字出現次數,也是hashmap
給定一串數字,找出所有可能的IP地址組合,比如192168111,組合是192.168.1.11,192.168.11.1。
應該LeetCode的題。之前自己沒寫完整,現場憋出來了。
這個程式碼應該沒錯。面試官看了二十分鐘才說ok。
然後我們就這樣沉默了20分鐘,中間他就說了幾句話。
三面:
1專案
2家庭情況
3學習生活的挑戰
4學新技術的方式
5解釋一下docker
6意向城市和崗位方向
百度智慧雲
基礎研發工程師
一面
1 專案
2 佇列和棧區別
3 兩個棧實現佇列,兩個棧實現最小值棧
4 資料庫的事務性質,如何實現這些性質
5 事務隔離級別有哪些,預設是什麼級別。
6 已提交讀有什麼問題,用於什麼場景
7 二叉樹瞭解麼,平衡二叉樹呢,有什麼場景會用到呢。
8 殭屍程式和孤兒程式是什麼,分別有什麼危害。
9 主從複製怎麼實現。
10 Redis你用來做什麼,為什麼不用mq做非同步佇列
11 分散式檔案系統瞭解麼,HDFS講一下原理
12 Java中一般用什麼型別表示價格。
13 Java如何把byte型別轉換成字串
14 Java的string型別為什麼是不可變的
15 有什麼問題
▼更多精彩內容
更多校招乾貨請關注公眾號:程式設計師江湖。
文末附上徵文連結:https://juejin.im/post/5b923adb5188255c6666c77b