4.17思凡特面試

SunShine789發表於2024-05-22
  1. hive語法重視

  2. hdfs調優

  3. 怎麼編寫清洗

  4. 怎麼寫支援壓縮的map中間結果

  5. 一些誤區
    1. datanode接受資料是一個塊一個塊往上傳,後面兩個節點是依次呼叫的
    2. 後設資料得在namenode記憶體中載入,而非僅存在磁碟上
    3. Fsimage儲存目錄和iNode,eidts記錄更新操作 兩個並不是一致的,第一次就會相當於合併
    4. datanode上也有元資訊,彙報給namenode

    5. 容量採用深度優先演算法,優先那些資源佔用率低的,而公平優先資源差額大的

    6. yarn 檢視叢集使用記憶體情況jmap

  6. hive基本型別

  7. 如何將資料裝載進已有的表中

    location是表建立時用的,load data inpath into是建好以後

  8. hive最佳化

相關文章