2018最新大資料面試題下載

肖曉曉發表於2018-02-23

  人生的每一個階段,都有自己應該做的事情,我們在大資料時代,該學習大資料技術就應該好好學習大資料技術,將自己的技術學到精深,學到大資料技術的精華。該面試找工作的時候,也要做好一切準備,無論是禮儀的學習、說話的技巧還是大資料的面試題也是要面面俱到的。恰巧小編整理了一份大資料面試題,供你們免費下載。

  


  1. scala 隱函式關鍵字

  implicit

  2. val x=y=1結果

  1)x、y都是var,x變為Unit

  2)都是val,報錯

  3.java記憶體模型

  堆記憶體、棧記憶體、方法區

  棧記憶體:儲存區域性變數

  堆記憶體:儲存陣列和物件

  方法區:程式碼區、字串常量池、靜態區

  4.Hbase優化

  1) 表設計

  建表時就分割槽,rowkey設定定長(64位元組),CF2到3個

  Max Versio,Time to live,Compact&Split

  2) 寫表

  多Htable併發寫

  Htable引數設定,手動flush,降低IO

  WriteBuffer

  批量寫

  多執行緒併發寫

  3) 讀表

  多Htable併發讀

  Htable引數設定

  批量讀

  釋放資源

  快取查詢結果

  5. MapReduce優化

  1. 任務排程

  I/O 方面:Hadoop 會盡量將 Map 任務分配給 InputSplit 所在的機器,以減少網

  絡 I/O 的消耗。

  2.資料預處理與 InputSplit 的大小

  合理地設定 block塊大小是很重要的調節方式。除此之外,也可以通過合理地

  設定 Map 任務的數量來調節 Map 任務的資料輸入。

  3. Map 和 Reduce 任務的數量

  當 Reduce 任務的數量是任務槽的 1.75 倍時,執行速度快的機器可以獲得更多

  的 Reduce 任務,因此可以使負載更加均衡,以提高任務的處理速度。

  4. Combine 函式

  MapReduce 框架執行使用者寫的 combine 函式用於本地合併,這會大大減少網

  絡 I/O 操作的消耗

  以上是小編的節選,更多的面試題可以直接私信小編。

相關文章