面試Hadoop DBA的重要問題

banq發表於2021-12-24

Apache Hadoop 是一種基於 Java 的跨平臺開源軟體框架,用於日益流行的“大資料”世界,用於分散式儲存和處理大型資料集。Hadoop 最突出的使用者是 Yahoo!、Facebook、公共雲空間,如 Microsoft Azure、谷歌計算引擎和亞馬遜網路服務,以及超過一半的財富 50 強。

Hadoop 相對較新,由 Doug Cutting 和 Mike Cafarella 於 2005 年建立。因此,只有少數資料庫管理員可以稱自己為 Hadoop 專家也就不足為奇了。如果您要外包頂級 DBA 專家團隊的服務,您在面試時應該問幾個問題。

 

你有具體的 Hadoop 經驗嗎? 

您可能會得到一名訓練有素且經驗豐富的 DBA,但擁有一名擁有 Hadoop 經驗而非任何其他大資料解決方案經驗的 DBA 是值得的。詢問 DBA 是否對基礎 Hadoop 框架有更多的基本瞭解,其中包括:

  • Hadoop Common 由其他模組使用的實用程式和庫組成
  • HDFS(Hadoop分散式檔案系統)是一種分散式檔案系統,其中商用機器上的資料儲存在叢集中以獲得高聚合頻寬
  • Hadoop YARN 是一個資源管理平臺,用於管理叢集計算資源並使用資源來排程使用者的應用程式
  • Hadoop Map Reduce 是一種用於大規模大資料處理的程式設計模型

一個優秀的 DBA 團隊是一個已經從事業務多年的團隊,因為在業務中的長壽表明良好的工作和相關經驗。您可以從論壇和評論站點獲得有關 Hadoop DBA 團隊經驗的提示。 

 

你知道Hadoop的商業應用嗎? 

Hadoop 擁有比 Map Reduce 作業更多的應用程式,您的 DBA 應該瞭解這些可能的應用程式,以便從解決方案中獲得最大收益。Apache 仍在開發其中一些應用程式,它們包括 Apache Hive 資料倉儲系統、HBase 資料庫和 Apache Mahout 機器學習系統。您可以使用 Hadoop 的一些商業應用程式是:

  • 點選流分析
  • 日誌分析
  • 營銷分析
  • 複雜的資料探勘
  • 機器學習
  • 影像處理
  • XML 訊息處理
  • 網頁抓取
  • 文書處理
  • 一般存檔,包括表格/關係資料以確保合規

 

DBA 最重要的角色是什麼?

這個問題將幫助您瞭解 DBA 是否瞭解他在組織中的角色、如何與其他部門互動以及 Hadoop 在組織中的重要性。Hadoop 資料庫管理不僅僅是在後臺管理 MapReduce 作業。您的 DBA 身兼數職。

 

您將如何管理升級?

Hadoop 是開源的,這意味著您無需為軟體付費。然而,這並不是說您不應該跟蹤更新。您的 DBA 應該制定更新計劃,因為這些計劃旨在修復錯誤和新增功能。您還應該詢問遷移和專案的計劃和時間表,以及從失敗和成功中吸取的經驗教訓。

 

大資料的趨勢是什麼?

一名優秀的 DBA 是一位瞭解大資料世界中正在發生的事情的人,因為這些資訊將使您比競爭對手更具優勢。詢問 DBA 是否參與了相關的討論論壇和開發者社群。您需要一位靈活且樂於接受新想法的 DBA。

 

您如何在當前或以前的角色中進行故障排除?

故障排除是 DBA 中最重要的技能之一,因為停機意味著收入損失。儘管隨著時間的推移,可以從一個人的失敗和成功中吸取教訓,但故障排除技能大多是一種才能。一個好的 DBA 是一個有條不紊地進行故障排除的人。一個好的候選人是能夠清楚地解釋他/她的思考過程,堅持所做的決定並傾聽團隊成員的人。詢問 DBA 他/她將如何與供應商互動,因為供應商支援不是免費的。

 

說說你自己?

雖然這個問題不會告訴你你的 DBA 的技術能力,但它會幫助你深入瞭解你正在面試的人的型別。您應該尋找一位多才多藝的 DBA,以避免在工作場所發生衝突。這個問題還將幫助您確定候選人對未來的關鍵任務是否有足夠的信心和勇氣。

  

說說你的公司?

聘請遠端 DBA 專家是一個好主意,他是組織中較大團隊的一部分,而不是僱用個人。這是因為團隊成員將能夠從團隊成員那裡獲得幫助,並且與個人相比,組織更容易審查。

 

你使用哪些工具?

如果您要在大資料方面取得成功,您的 DBA 還應該具備其他相關技能。其中一些最重要的是資料建模和網路。他/她還應該擁有使工作更輕鬆所需的工具。除了 Hadoop 之外,您的 DBA 還應該熟悉其他相關工具來執行以下任務:

  • 效能監控
  • 警報
  • 資料建模
  • 備份壓縮
  • 更換管理層

提出一兩個相當困難或壓力很大的問題,看看你的候選人如何處理壓力。

  

你在和其他客戶打交道嗎?

如果您將服務外包,那麼您的 DBA 很可能與其他客戶打交道。這個問題將幫助您確定候選人的可信度。一個好的候選人是對其他客戶誠實的人,但會告訴你他/她打算做什麼以確保沒有利益衝突。但是,您的職責是確保您聘用的 DBA 不會同時與您的直接競爭對手合作。

 

 

相關文章