乾貨 | 資料探勘過關40題,你是否都能通關...
1. 某超市研究銷售紀錄資料後發現,買啤酒的人很大機率也會購買尿布,這種屬於資料探勘的哪類問題?
A.關聯規則發現
B.聚類
C.分類
D.自然語言處理
2. 以下兩種描述分別對應哪兩種對分類演算法的評價標準?
(a)警察抓小偷,描述警察抓的人中有多少個是小偷的標準。
(b)描述有多少比例的小偷給警察抓了的標準。
A.Precision,Recall
B.Recall,Precision
C.Precision,ROC
D.Recall,ROC
3. 將原始資料進行整合、變換、維度規約、數值規約是在以下哪個步驟的任務?
A.頻繁模式挖掘
B.分類和預測
C.資料預處理
D.資料流挖掘
4. 當不知道資料所帶標籤時,可以使用哪種技術促使帶同類標籤的資料與帶其他標籤的資料相分離?
A.分類
B.聚類
C.關聯分析
D.隱馬爾可夫鏈
5. 什麼是KDD?
A.資料探勘與知識發現
B.領域知識發現
C.文件知識發現
D.動態知識發現
6. 使用互動式的和視覺化的技術,對資料進行探索屬於資料探勘的哪一類任務?
A.探索性資料分析
B.建模描述
C.預測建模
D.尋找模式和規則
7. 為資料的總體分佈建模;把多維空間劃分成組等問題屬於資料探勘的哪一類任務?
A.探索性資料分析
B.建模描述
C.預測建模
D.尋找模式和規則
8. 建立一個模型,透過這個模型根據已知的變數值來預測其他某個變數值屬於資料探勘的哪一類任務?
A.根據內容檢索
B.建模描述
C.預測建模
D.尋找模式和規則
9. 使用者有一種感興趣的模式並且希望在資料集中找到相似的模式,屬於資料探勘哪一類任務?
A.根據內容檢索
B.建模描述
C.預測建模
D.尋找模式和規則
10. 以下屬於可伸縮聚類演算法的是。
A、CURE
B、DENCLUE
C、CLIQUE
D、OPOSSUM
11. 下面哪種不屬於資料預處理的方法?
A 變數代換
B 離散化
C 聚集
D估計遺漏值
12. 假設12個銷售價格記錄組已經排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內?
A 第一個
B 第二個
C 第三個
D 第四個
13. 上題中,等寬劃分時(寬度為50),15又在哪個箱子裡?
A 第一個
B 第二個
C 第三個
D 第四個
14. 下面哪個不屬於資料的屬性型別:
A 標稱
B 序數
C 區間
D 相異
15. 在上題中,屬於定量的屬性型別是:
A 標稱
B 序數
C 區間
D 相異
16. 只有非零值才重要的二元屬性被稱作:
A 計數屬性
B 離散屬性
C 非對稱的二元屬性
D 對稱屬性
17. 以下哪種方法不屬於特徵選擇的標準方法:
A 嵌入
B 過濾
C 包裝
D 抽樣
18. 下面不屬於建立新屬性的相關方法的是:
A 特徵提取
B 特徵修改
C 對映資料到新的空間
D 特徵構造
19. 考慮值集{1、2、3、4、5、90},其截斷均值(p=20%)是
A 2
B 3
C 3.5
D 5
20. 下面哪個屬於對映資料到新的空間的方法?
A 傅立葉變換
B 特徵加權
C 漸進抽樣
D 維歸約
21. 熵是為消除不確定性所需要獲得的資訊量,投擲均勻正六面體骰子的熵是:
A1 位元
B 2.6位元
C 3.2位元
D 3.8位元
22. 假設屬性income的最大最小值分別是12000元和98000元。利用最大最小規範化的方法將屬性的值對映到0至1的範圍內。對屬性income的73600元將被轉化為:
A 0.821
B 1.224
C 1.458
D 0.716
23. 假定用於分析的資料包含屬性age。資料元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題:使用按箱平均值平滑方法對上述資料進行平滑,箱的深度為3。第二個箱子值為:
A 18.3
B 22.6
C 26.8
D 27.9
24. 考慮值集{12 24 33 24 55 68 26},其四分位數極差是:
A 31
B 24
C 55
D 3
25. 一所大學內的各年級人數分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數是:
A 一年級
B 二年級
C 三年級
D 四年級
26. 下列哪個不是專門用於視覺化時間空間資料的技術:
A 等高線圖
B 餅圖
C 曲面圖
D 向量場圖
27. 在抽樣方法中,當合適的樣本容量很難確定時,可以使用的抽樣方法是:
A 有放回的簡單隨機抽樣
B 無放回的簡單隨機抽樣
C 分層抽樣
D 漸進抽樣
28. 資料倉儲是隨著時間變化的,下面的描述不正確的是
A.資料倉儲隨時間的變化不斷增加新的資料內容;
B.捕捉到的新資料會覆蓋原來的快照;
C.資料倉儲隨事件變化不斷刪去舊的資料內容;
D.資料倉儲中包含大量的綜合資料,這些綜合資料會隨著時間的變化不斷地進行重新綜合.
29. 關於基本資料的後設資料是指:
A.基本後設資料與資料來源,資料倉儲,資料集市和應用程式等結構相關的資訊;
B.基本後設資料包括與企業相關的管理方面的資料和資訊;
C.基本後設資料包括日誌檔案和簡歷執行處理的時序排程資訊;
D.基本後設資料包括關於裝載和更新處理,分析處理以及管理方面的資訊
30. 下面關於資料粒度的描述不正確的是:
A.粒度是指資料倉儲小資料單元的詳細程度和級別;
B.資料越詳細,粒度就越小,級別也就越高;
C.資料綜合度越高,粒度也就越大,級別也就越高;
D.粒度的具體劃分將直接影響資料倉儲中的資料量以及查詢質量.
31. 有關資料倉儲的開發特點,不正確的描述是:
A.資料倉儲開發要從資料出發;
B.資料倉儲使用的需求在開發出去就要明確;
C.資料倉儲的開發是一個不斷迴圈的過程,是啟發式的開發;
D.在資料倉儲環境中,並不存在操作型環境中所固定的和較確切的處理流,資料倉儲中資料分析和處理更靈活,且沒有固定的模式
32. 在有關資料倉儲測試,下列說法不正確的是:
A.在完成資料倉儲的實施過程中,需要對資料倉儲進行各種測試.測試工作中要包括單元測試和系統測試.
B.當資料倉儲的每個單獨元件完成後,就需要對他們進行單元測試.
C.系統的整合測試需要對資料倉儲的所有元件進行大量的功能測試和迴歸測試.
D.在測試之前沒必要制定詳細的測試計劃.
33. OLAP技術的核心是:
A.線上性;
B.對使用者的快速響應;
C.互操作性.
D.多維分析;
34. 關於OLAP的特性,下面正確的是:
(1)快速性(2)可分析性(3)多維性(4)資訊性(5)共享性
A.(1)(2)(3)
B.(2)(3)(4)
C.(1)(2)(3)(4)
D.(1)(2)(3)(4)(5)
35. 關於OLAP和OLTP的區別描述,不正確的是:
A.OLAP主要是關於如何理解聚集的大量不同的資料.它與OTAP應用程式不同.
B.與OLAP應用程式不同,OLTP應用程式包含大量相對簡單的事務.
C.OLAP的特點在於事務量大,但事務內容比較簡單且重複率高.
D.OLAP是以資料倉儲為基礎的,但其最終資料來源與OLTP一樣均來自底層的資料庫系統,兩者面對的使用者是相同的.
36. OLAM技術一般簡稱為”資料聯機分析挖掘”,下面說法正確的是:
A.OLAP和OLAM都基於客戶機/伺服器模式,只有後者有與使用者的互動性;
B.由於OLAM的立方體和用於OLAP的立方體有本質的區別.
C.基於WEB的OLAM是WEB技術與OLAM技術的結合.
D.OLAM伺服器透過使用者圖形藉口接收使用者的分析指令,在後設資料的知道下,對超級立方體作一定的操作.
37. 關於OLAP和OLTP的說法,下列不正確的是:
A.OLAP事務量大,但事務內容比較簡單且重複率高.
B.OLAP的最終資料來源與OLTP不一樣.
C.OLTP面對的是決策人員和高層管理人員.
D.OLTP以應用為核心,是應用驅動的.
38. 設X={1,2,3}是頻繁項集,則可由X產生____個關聯規則。
A、4
B、5
C、6
D、7
39. 頻繁項集、頻繁閉項集、最大頻繁項集之間的關係是:
A、頻繁項集頻繁閉項集=最大頻繁項集
B、頻繁項集=頻繁閉項集最大頻繁項集
C、頻繁項集頻繁閉項集最大頻繁項集
D、頻繁項集=頻繁閉項集=最大頻繁項集
40. 概念分層圖是____圖。
A、無向無環
B、有向無環
C、有向有環
D、無向有環
答案:
AACBA, ABCAA,
DBADC, CDBCA,
BDAAA, BDCDC,
ADDDC, DACCB
原文連結:https://mp.weixin.qq.com/s/8ioIEszin8KPUKzr3B6UOA
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31548982/viewspace-2212736/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【虹科乾貨】關於JSON資料庫JSON資料庫
- 千字乾貨 | 一文帶你快速掌握資料庫相關概念資料庫
- 關於資料探勘你想了解的都在這
- 虹科乾貨 | 資料庫的九大關鍵功能介紹資料庫
- 資料探勘專案的特徵和關鍵環節特徵
- 通過提交資訊來關閉issue
- 技術乾貨:關於效能測試面試題及答案面試題
- 資料探勘的過程有哪些
- 通過遞迴實現,單表父子關係資料 或者上下級關係資料的組合遞迴
- 關於PaaS的純乾貨總結
- 馬耳他內閣通過加密貨幣相關法案加密
- 關於Flutter初始化,我必須告訴你的是...(乾貨)Flutter
- 透過API介面實現資料探勘?API
- 萬字乾貨|Synchronized關鍵字詳解synchronized
- 演算法面試通關40講總結演算法面試
- 3000字乾貨帶你入門資料倉儲,跑通複雜業務場景資料建模全流程
- 如果這10道關於資料庫的測試題你都會,面試必過!資料庫面試
- 計算機視覺相關乾貨文章-20190807計算機視覺
- 乾貨技巧|關於Redis的16個使用技巧Redis
- 乾貨丨RPA工程中的資料處理問題
- LeetCode通關:通過排序一次秒殺五道題,舒服!LeetCode排序
- MySQL靈魂拷問:36題帶你面試通關MySql面試
- 業務人員都能用,這些功能降低了資料探勘使用門檻
- 資料庫事物相關問題資料庫
- 今天聊點乾貨—關於CSS樣式來源CSS
- 資料探勘面試筆試題(附答案)面試筆試
- 演算法面試通關40講 - 番外 - 陣列演算法面試陣列
- 乾貨:如何通過Federation將Hadoop儲存容量提升4倍?Hadoop
- 中小企業幾個關於seo的小常識問題,你是否知道?
- 做了40多年資料分析,Teradata這次的關鍵字是“任意”?
- 關於android stdio連線mysql資料庫出現過的問題AndroidMySql資料庫
- 乾貨 | 影像資料增強實戰
- 乾貨:mysql索引的資料結構MySql索引資料結構
- 叮,關於NPL與深度學習的“乾貨”請查收!深度學習
- 【虹科乾貨】5個關於微服務的誤解微服務
- 【乾貨】如何設計一個Arkane遊戲的關卡遊戲
- 演算法面試通關40講 - 雜湊表/對映演算法面試
- 資料探勘( TO DO LIST)