2015-03-22 網易筆試(資料探勘方向)——郵件事業部
答案正在更新,有想法的也可以留言............
一:單選題
1:下列程式的輸出結果為()
#include <iostream.h>
void main()
{
int n[][] = {10,20,30,40,50,60};
int (*p)[3];
p = n;
cout<<[0][0] << "," <<*( p[0] + 1) << "," <<(*p)[2]<<endl;
}
A: 10,30,50
B: 10,20,30
C: 20,40,60
D: 10,30,60
解析: n[2][3] = {
10,20,30,
40,50,60
};
*( p[0] + 1) = p[i][j] (與此類似的形式還有 *( *( p+i ) + j )) 故等於20
(*p)[2]:*p指的是首行 2代表第三列 所以為 30 答案選B
2:儲存以下資料,佔用位元組最多的是()
A: 0
B: '0'
C: " 0 "
D: 0.0
解:int 在不同位數的計算機上表現出的長度不一樣,其長度至少為2位元組(在16位的計算機上),在32位的計算機上其長度為4位元組,64位的計算機上長度為8位元組
char 欄位位元組長度為8
“0”的長度為2 0.0的長度為8
3: 棧和佇列共同的特點是
A: 只允許在端點處插入和刪除
B: 都是先進後出
C: 都是先進先出
D: 沒有共同點
解:棧和佇列都是資料結構中的一種,棧是先進後出,其刪除和插入資料只能在端點處進行,對列是先進先出型,插入和刪除資料也只能在端點處進行,另外一個比較混淆的點是 棧通常用於深度遍歷, 而佇列用於廣度遍歷。
4: 任何一顆二叉樹的葉節點在前序,中序,後序遍歷序列中的相對次序
A: A和B 右方
B: A 和B祖先
C: A 和B左方
D: A 是B子孫
解:這道題題目的意思給的太迷亂了,所以我的理解也不一定正確,我的理解是A和B是兩個葉子節點,共有一個父結點,所以無論是前序,中序還是後序遍歷中,A總是在B的左邊,所以選擇C
5:下列關於MapReduce的說法正確的是?
A: MapReduce有多個輸入路徑時,檔案型別必須保持一致
B: 可以使用Counter觀察MR Job執行的各種細節資料
C; 使用TextInputFormat時,Mapper的key型別為Text,value型別為LongWritable
D: 以上都正確
解:MapReduce有多個輸入路徑時不需要保證檔案型別一致,可以使用MultipleInouts類來指定多個Mapper函式,只要一個Map函式來處理一種型別的檔案即可。
MapReduce Counter為提供我們一個視窗:觀察MapReduce job執行期的各種細節資料
使用InputFormat時Mapper的key為LongWritable,表示偏移量,Text表示一行的文字
故選擇 B
6:PCA降維中用到的演算法是:
A: 牛頓法
B: sgd
C: svd
D: Cutting-Plane
解:牛頓法:迭代演算法
sgd:梯度下降演算法
svd:推薦演算法(Singular Value Decomposition)
Cutting-Plane:列生成演算法
其實小編對這幾個演算法並不大懂,所以具體的還望大神指導,具體答案小編目測是選B
7:
A: 0.59 0.514
B: 1.14 1.02
C: 0.59 1.02
D; 0.514 0.59
解:B
8:請選出用於無監督學習問題的方法
A: SGD
B: 反向傳播
C: BFGS
D: 冪迭代
解:D
SGD:梯度下降演算法
反向傳播:Backpropagation algorithm,簡稱:BP演算法,是一種監督學習演算法,常被用來訓練多層感知機
BFGS擬牛頓法,詳情參考
冪迭代:聚類演算法
9:Python中的淺拷貝會建立一個新的物件,但他包含的是對原始物件中包含項的引用,下列哪個操作不涉及淺拷貝
A: copy()
B: list()
C: 完全切片方法
D: 賦值(=)
解:答案選D
推薦一篇便於理解淺拷貝和深拷貝的文章:點選閱讀
思路一:利用切片操作和工廠方法list方法拷貝就叫淺拷貝,只是拷貝最外圍的物件本身,內部的元素都只是拷貝了一個引用而已。
思路二:利用copy中的deepcopy方法進行拷貝就叫做深拷貝,外圍和內部元素都進行了拷貝物件本身,而不是引用。
但是對於數字,字串和其他原子型別物件等,沒有被拷貝的說法,即便是用深拷貝,檢視id的話也是一樣的,如果對其重新賦值,也只是新建立一個物件,替換掉舊的而已。
10:有一個檔案ip.txt ,每行一條ip記錄,共若干行,下列哪個命令可以實現統計出現次數最多的前三個ip及其次數
A: uniq -c ip.txt | sort -rn | head -n 3
B: sort ip.txt | uniq -c | sort -rn | head -n 3
C: cat ip.txt | count -n | sort -rn | head -n 3
D: cat ip.txt | sort | uniq -c | sort -rn | top -n 3
解:B linux基本命令具體自行百度
二:多選題
11:ls -l 顯示如下 -rwxrw-r-- 1 aaa bbb 0 3月 4 11:21 ccc 下列那些說法是正確的/
A: 該檔案是個目錄
B: 該檔案擁有者所在的組使用者有許可權修改檔案
C: 該檔案的許可權數字表示為764
D: 該檔案的擁有者是bbb
解:BC
12:下列屬於線性分類器的是
A: 決策樹
B; 帶和核函式的SVM
C: logistics迴歸
D: 感知器
解:BCD
線性分類器:單層感知器網路、貝葉斯 非線性分類器:多層感知器網路、決策樹 SVM本身是線性分類器,帶核函式之後相當於把低維空間的資料對映到高維空間,之後就可以用線性分類器進行分類了
13: 下列常用的機器學習模型中那些屬於生成模型
A: 樸素貝葉斯
B: 隱馬爾可夫
C: 感知機
D: 決策樹
解:B
樸素貝葉斯和隱馬爾可夫是生成模型
感知機,決策樹是判別模型
14:下列說法正確的是
A:StringBuilder是執行緒不安全的
B: java類可以同時用abstract 和 final宣告
C: HasnMap中,使用get(key)==null 可以判斷這個hashmap是否包含這個key
D: volatike關鍵字不保證對變數操作的原子性
解:A,C,D
abstract類是抽象類,必須做父類
15:Python中怎樣替換一個字串
A: String模組的sub函式
B: re模組的replace()函式
C: re模組的subn()函式
D: re模組的sub()函式
解:B,C,D
A中string模組meiyousub方法,有replace函式
16:Spark中的RDD的持久化操作,下面說法正確的是?
A: 呼叫persist()之後不需要主打unpersist()
B: MEMORY_ONLY_SEP模式比MEMORY_ONLY模式快
C: OFF_HEAP模式不需要序列化資料
D: MEMORY_ADD_DISK模式當記憶體放馬不下資料時會將部分資料儲存到磁碟中
解:B,C,D
樓主不懂Spark,是百度之後的答案,僅供參考
17:對154個元素組成的有序表進行二分法查詢,可能的比較次數為:
A: 10
B: 8
C: 4
D: 1
解:畫一個二叉樹共八層,所以小於等於8即可 B,C,D
18:有一棵二叉樹的前序遍歷和後序遍歷分別是1,2,3,4和4,3,2,1,則該二叉樹的中序遍歷可能是
A: 1,2,3,4
B: 2,3,4,1
C: 3,2,4,1
D: 4,3,2,1
解:C,D
19:已知logistic迴歸分類器的分類閥值是0.5,訓練集中正負類比例為3:1,預測效能中正類的precision為0.88 recall為0.81 ,以下那些處理手段可能提高預測結果中正類的recall
A: 降低分類判斷的閥值為0.3
B: 訓練集中正負類的訓練比例調整為6:1
C: 加大logistic迴歸的正則項的權重值
D: 降低logistic迴歸的正則項的權重值
解:
20:以下隨機變數的概率圖模型,那些圖是滿足p( c,b | a) = p(c | a)p(b |a )
A:
B:
C:
D:
解:A,C(樓主不太懂的路過,,,,,)
三:主觀題
相關文章
- 網易2020校招資料分析方向提前批筆試題解析筆試
- 資料探勘面試筆試題(附答案)面試筆試
- 資料探勘與分析(網際網路行業)行業
- 網易內推筆試筆試
- 資料探勘---BP神經網路神經網路
- 網易資料分析業務題
- logminer進行資料探勘分析測試
- Java實現網易企業163郵箱傳送郵件Java
- 資料探勘中易栽的10個坑,你中了沒?
- 如何提升企業的資料探勘能力
- 網易微專業大資料工程師大資料工程師
- 資料探勘技術
- 資料探勘與生活
- 資料探勘( TO DO LIST)
- 物聯網之智慧農業應用分析&大資料之資料探勘技術的應用大資料
- 資料探勘工具對企業有什麼價值
- 大資料的就業方向有哪些?大資料就業
- 大資料主要就業方向有哪些?大資料就業
- 《資料探勘導論》實驗課——實驗四、資料探勘之KNN,Naive BayesKNNAI
- 資料探勘和資料提取能做什麼?
- 常用資料探勘演算法演算法
- 資料探勘-層次聚類聚類
- 用Python做商業資料探勘,你學廢了嗎?Python
- 匹配網易郵箱正規表示式
- NLPIR中文資料探勘幫助企業執行最佳商業決策
- 網易某業務線的計算資源資料治理實踐
- 淺談大資料、資料分析、資料探勘的區別!大資料
- 資料探勘的步驟有哪些?
- 理解Transformer [資料探勘深度學習]ORM深度學習
- 大資料探勘有哪些技術大資料
- 資料探勘的過程有哪些
- 《資料探勘導論》讀後感
- 資料探勘技術功能有哪些
- 資料探勘的辦法有哪些
- 資料探勘-預測模型彙總模型
- 資料探勘之 層次聚類聚類
- 釐清企業資料治理難題,《網易資料治理白皮書》重磅釋出!
- 資料探勘和資料提取該怎麼區分?
- Yahoo前任資料官:資料探勘與分析技巧(下)IF