一. 單選題(共10題,20分)
1. (單選題, 2分)第三次資訊化浪潮的標誌是:
- A. 個人電腦的普及
- B. 虛擬現實技術的普及
- C. 雲端計算、大資料、物聯網技術的普及
- D. 網際網路的普及
我的答案: C:雲端計算、大資料、物聯網技術的普及;正確答案: C:雲端計算、大資料、物聯網技術的普及;
2分
2. (單選題, 2分)分散式檔案系統指的是什麼?
- A. 把檔案分佈儲存到多個計算機節點上,成千上萬的計算機節點構成計算機叢集
- B. 用於在Hadoop與傳統資料庫之間進行資料傳遞
- C. 一個高可用的,高可靠的,分散式的海量日誌採集、聚合和傳輸的系統
- D. 一種高吞吐量的分散式釋出訂閱訊息系統,可以處理消費者規模的網站中的所有動作流資料
我的答案: A:把檔案分佈儲存到多個計算機節點上,成千上萬的計算機節點構成計算機叢集;正確答案: A:把檔案分佈儲存到多個計算機節點上,成千上萬的計算機節點構成計算機叢集;
2分
3. (單選題, 2分)下面哪一項不屬於計算機叢集中的節點?
- A. 主節點(Master Node)
- B. 從節點(Slave Node)
- C. 源節點(SourceNode)
- D. 名稱結點(NameNode)
我的答案: C:源節點(SourceNode);正確答案: C:源節點(SourceNode);
2分
4. (單選題, 2分)下列哪一項不屬於HDFS採用抽象的塊概念帶來的好處?
- A. 簡化系統設計
- B. 支援大規模檔案儲存
- C. 強大的跨平臺相容性
- D. 適合資料備份
我的答案: C:強大的跨平臺相容性;正確答案: C:強大的跨平臺相容性;
2分
5. (單選題, 2分)在HDFS中,NameNode的主要功能是什麼?
- A. 維護了block id 到datanode本地檔案的對映關係
- B. 儲存檔案內容
- C. 檔案記憶體儲存在磁碟中
- D. 儲存後設資料
我的答案: D:儲存後設資料;正確答案: D:儲存後設資料;
2分
6. (單選題, 2分)下面對FsImage的描述,哪個是錯誤的?
- A. FsImage用於維護檔案系統樹以及檔案樹中所有的檔案和資料夾的後設資料
- B. FsImage檔案包含檔案系統中所有目錄和檔案inode的序列化形式
- C. FsImage檔案記錄了每個塊具體被儲存在哪個資料節點
- D. FsImage檔案沒有記錄每個塊儲存在哪個資料節點
我的答案: C:FsImage檔案記錄了每個塊具體被儲存在哪個資料節點;正確答案: C:FsImage檔案記錄了每個塊具體被儲存在哪個資料節點;
2分
7. (單選題, 2分)下面對SecondaryNameNode第二名稱節點的描述,哪個是錯誤的?
- A. SecondaryNameNode透過HTTPGET方式從NameNode上獲取到FsImage和EditLog檔案,並下載到本地的相應目錄下
- B. 它是用來儲存名稱節點中對HDFS後設資料資訊的備份,並減少名稱節點重啟的時間
- C. SecondaryNameNode一般是並行執行在多臺機器上
- D. SecondaryNameNode是HDFS架構中的一個組成部分
我的答案: C:SecondaryNameNode一般是並行執行在多臺機器上;正確答案: C:SecondaryNameNode一般是並行執行在多臺機器上;
2分
8. (單選題, 2分)HDFS採用了什麼模型?
- A. 分層模型
- B. 主從結構模型
- C. 管道-過濾器模型
- D. 點對點模型
我的答案: B:主從結構模型;正確答案: B:主從結構模型;
2分
9. (單選題, 2分)在Hadoop專案結構中,HDFS指的是什麼?
- A. Hadoop上的資料倉儲
- B. 資源管理和排程器
- C. 流資料讀寫
- D. 分散式檔案系統
我的答案: D:分散式檔案系統;正確答案: D:分散式檔案系統;
2分
10. (單選題, 2分)下列關於HDFS的描述,哪個不正確?
- A. HDFS採用塊的概念,使得系統的設計變得更加複雜
- B. HDFS採用了主從(Master/Slave)結構模型
- C. HDFS採用了冗餘資料儲存,增強了資料可靠性
- D. HDFS還採用了相應的資料存放、資料讀取和資料複製策略,來提升系統整體讀寫響應效能
我的答案: A:HDFS採用塊的概念,使得系統的設計變得更加複雜;正確答案: A:HDFS採用塊的概念,使得系統的設計變得更加複雜;
2分
二. 多選題(共14題,28分)
11. (多選題, 2分)資訊科技為大資料時代提供哪些技術支撐?
- A. 儲存裝置容量不斷增加
- B. 網路頻寬不斷增加
- C. CPU 處理能力大幅提升
- D. 資料量不斷增大
我的答案: ABC:儲存裝置容量不斷增加; 網路頻寬不斷增加; CPU 處理能力大幅提升;正確答案: ABC:儲存裝置容量不斷增加; 網路頻寬不斷增加; CPU 處理能力大幅提升;
2分
12. (多選題, 2分)大資料具有哪些特點?
- A. 資料的“大量化”
- B. 資料的“快速化”
- C. 資料的“多樣化”
- D. 資料的“價值密度比較低”
我的答案: ABCD:資料的“大量化”; 資料的“快速化”; 資料的“多樣化”; 資料的“價值密度比較低”;正確答案: ABCD:資料的“大量化”; 資料的“快速化”; 資料的“多樣化”; 資料的“價值密度比較低”;
2分
13. (多選題, 2分)大資料的兩個核心技術是什麼?
- A. 分散式儲存
- B. 分散式應用
- C. 分散式處理
- D. 集中式儲存
我的答案: AC:分散式儲存; 分散式處理;正確答案: AC:分散式儲存; 分散式處理;
2分
14. (多選題, 2分)HDFS要實現以下哪幾個目標?
- A. 複雜的檔案模型
- B. 相容廉價的硬體裝置
- C. 大資料集
- D. 流資料讀寫
我的答案: BCD:相容廉價的硬體裝置; 大資料集; 流資料讀寫;正確答案: BCD:相容廉價的硬體裝置; 大資料集; 流資料讀寫;
2分
15. (多選題, 2分)HDFS特殊的設計,在實現優良特性的同時,也使得自身具有一些應用侷限性,主要包括以下哪幾個方面?
- A. 無法高效儲存大量小檔案
- B. 較差的跨平臺相容性
- C. 不支援多使用者寫入及任意修改檔案
- D. 不適合低延遲資料訪問
我的答案: ACD:無法高效儲存大量小檔案; 不支援多使用者寫入及任意修改檔案; 不適合低延遲資料訪問;正確答案: ACD:無法高效儲存大量小檔案; 不支援多使用者寫入及任意修改檔案; 不適合低延遲資料訪問;
2分
16. (多選題, 2分)HDFS採用抽象的塊概念可以帶來以下哪幾個明顯的好處?
- A. 支援大規模檔案儲存
- B. 適合資料備份
- C. 支援小規模檔案儲存
- D. 簡化系統設計
我的答案: ABD:支援大規模檔案儲存; 適合資料備份; 簡化系統設計;正確答案: ABD:支援大規模檔案儲存; 適合資料備份; 簡化系統設計;
2分
17. (多選題, 2分)在HDFS中,名稱節點(NameNode)主要儲存了哪些核心的資料結構?
- A. DN8
- B. Block
- C. FsImage
- D. EditLog
我的答案: CD:FsImage; EditLog;正確答案: CD:FsImage; EditLog;
2分
18. (多選題, 2分)資料節點(DataNode)的主要功能包括哪些?
- A. 負責資料的儲存和讀取
- B. 根據客戶端或者是名稱節點的排程來進行資料的儲存和檢索
- C. 向名稱節點定期傳送自己所儲存的塊的列表
- D. 用來儲存名稱節點中對HDFS後設資料資訊的備份,並減少名稱節點重啟的時間
我的答案: ABC:負責資料的儲存和讀取; 根據客戶端或者是名稱節點的排程來進行資料的儲存和檢索; 向名稱節點定期傳送自己所儲存的塊的列表;正確答案: ABC:負責資料的儲存和讀取; 根據客戶端或者是名稱節點的排程來進行資料的儲存和檢索; 向名稱節點定期傳送自己所儲存的塊的列表;
2分
19. (多選題, 2分)HDFS的名稱空間包含什麼?
- A. 檔案
- B. 塊
- C. 磁碟
- D. 目錄
我的答案: AD:檔案; 目錄;正確答案: ABD:檔案; 塊; 目錄;
1分
20. (多選題, 2分)下列對於客服端的描述,哪些是正確的?
- A. 客戶端是使用者操作HDFS最常用的方式,HDFS在部署時都提供了客戶端
- B. HDFS客戶端是一個庫,暴露了HDFS檔案系統介面
- C. 嚴格來說,客戶端並不算是HDFS的一部分
- D. 客戶端可以支援開啟、讀取、寫入等常見的操作
我的答案: ABD:客戶端是使用者操作HDFS最常用的方式,HDFS在部署時都提供了客戶端; HDFS客戶端是一個庫,暴露了HDFS檔案系統介面; 客戶端可以支援開啟、讀取、寫入等常見的操作;正確答案: ABCD:客戶端是使用者操作HDFS最常用的方式,HDFS在部署時都提供了客戶端; HDFS客戶端是一個庫,暴露了HDFS檔案系統介面; 嚴格來說,客戶端並不算是HDFS的一部分; 客戶端可以支援開啟、讀取、寫入等常見的操作;
1分
21. (多選題, 2分)HDFS只設定唯一一個名稱節點,這樣做雖然大大簡化了系統設計,但也帶來了哪些明顯的侷限性?
- A. 名稱空間的限制
- B. 效能的瓶頸
- C. 隔離問題
- D. 叢集的可用性
我的答案: ABCD:名稱空間的限制; 效能的瓶頸; 隔離問題; 叢集的可用性;正確答案: ABCD:名稱空間的限制; 效能的瓶頸; 隔離問題; 叢集的可用性;
2分
22. (多選題, 2分)HDFS資料塊多副本儲存具備以下哪些優點?
- A. 加快資料傳輸速度
- B. 適合多平臺上執行
- C. 容易檢查資料錯誤
- D. 保證資料可靠性
我的答案: ACD:加快資料傳輸速度; 容易檢查資料錯誤; 保證資料可靠性;正確答案: ACD:加快資料傳輸速度; 容易檢查資料錯誤; 保證資料可靠性;
2分
23. (多選題, 2分)HDFS具有較高的容錯性,設計了哪些相應的機制檢測資料錯誤和進行自動恢復?
- A. 資料節點出錯
- B. 資料出錯
- C. 名稱節點出錯
- D. 資料來源太大
我的答案: ABC:資料節點出錯; 資料出錯; 名稱節點出錯;正確答案: ABC:資料節點出錯; 資料出錯; 名稱節點出錯;
2分
24. (多選題, 2分)資料產生方式大致經歷了三個階段,包括:
- A. 移動網際網路資料階段
- B. 運營式系統階段
- C. 感知式系統階段
- D. 使用者原創內容階段
我的答案: BCD:運營式系統階段; 感知式系統階段; 使用者原創內容階段;正確答案: BCD:運營式系統階段; 感知式系統階段; 使用者原創內容階段;
2分