2015-03-22 網易筆試(資料探勘方向)——郵件事業部

Thinkgamer_gyt發表於2016-03-23

答案正在更新,有想法的也可以留言............

一:單選題

1:下列程式的輸出結果為()

#include <iostream.h>

void main()

{

int n[][] = {10,20,30,40,50,60};

int (*p)[3];

p = n;

cout<<[0][0] << "," <<*( p[0] + 1) << "," <<(*p)[2]<<endl;

}

A:   10,30,50

B:   10,20,30

C:   20,40,60

D:   10,30,60

解析: n[2][3] = {

10,20,30,

40,50,60

};

*(  p[0]  + 1) = p[i][j]  (與此類似的形式還有 *( *( p+i ) + j ))     故等於20

 (*p)[2]:*p指的是首行  2代表第三列 所以為 30       答案選B


2:儲存以下資料,佔用位元組最多的是()

A:  0

B:  '0'

C:  " 0 "

D:  0.0

:int 在不同位數的計算機上表現出的長度不一樣,其長度至少為2位元組(在16位的計算機上),在32位的計算機上其長度為4位元組,64位的計算機上長度為8位元組

 char 欄位位元組長度為8

“0”的長度為2   0.0的長度為8


3: 棧和佇列共同的特點是

A: 只允許在端點處插入和刪除

B: 都是先進後出

C: 都是先進先出

D: 沒有共同點

:棧和佇列都是資料結構中的一種,棧是先進後出,其刪除和插入資料只能在端點處進行,對列是先進先出型,插入和刪除資料也只能在端點處進行,另外一個比較混淆的點是 棧通常用於深度遍歷, 而佇列用於廣度遍歷。


4: 任何一顆二叉樹的葉節點在前序,中序,後序遍歷序列中的相對次序

A:  A和B 右方

B:  A 和B祖先

C:  A 和B左方

D:  A 是B子孫

:這道題題目的意思給的太迷亂了,所以我的理解也不一定正確,我的理解是A和B是兩個葉子節點,共有一個父結點,所以無論是前序,中序還是後序遍歷中,A總是在B的左邊,所以選擇C


5:下列關於MapReduce的說法正確的是?

A: MapReduce有多個輸入路徑時,檔案型別必須保持一致

B: 可以使用Counter觀察MR Job執行的各種細節資料

C; 使用TextInputFormat時,Mapper的key型別為Text,value型別為LongWritable

D:  以上都正確

:MapReduce有多個輸入路徑時不需要保證檔案型別一致,可以使用MultipleInouts類來指定多個Mapper函式,只要一個Map函式來處理一種型別的檔案即可。

MapReduce Counter為提供我們一個視窗:觀察MapReduce job執行期的各種細節資料

使用InputFormat時Mapper的key為LongWritable,表示偏移量,Text表示一行的文字

故選擇 B


6:PCA降維中用到的演算法是:

A: 牛頓法

B: sgd

C: svd

D: Cutting-Plane

:牛頓法:迭代演算法

sgd:梯度下降演算法

svd:推薦演算法(Singular Value Decomposition

Cutting-Plane:列生成演算法

其實小編對這幾個演算法並不大懂,所以具體的還望大神指導,具體答案小編目測是選B


7:


A: 0.59   0.514

B: 1.14   1.02

C:  0.59  1.02

D;  0.514   0.59

:B


8:請選出用於無監督學習問題的方法

A: SGD

B: 反向傳播

C: BFGS

D: 冪迭代

:D

SGD:梯度下降演算法

反向傳播:Backpropagation algorithm,簡稱:BP演算法,是一種監督學習演算法,常被用來訓練多層感知機

BFGS擬牛頓法,詳情參考

冪迭代:聚類演算法


9:Python中的淺拷貝會建立一個新的物件,但他包含的是對原始物件中包含項的引用,下列哪個操作不涉及淺拷貝

A:  copy()

B:  list()

C:  完全切片方法

D:  賦值(=)

:答案選D 

推薦一篇便於理解淺拷貝和深拷貝的文章:點選閱讀

思路一:利用切片操作和工廠方法list方法拷貝就叫淺拷貝,只是拷貝最外圍的物件本身,內部的元素都只是拷貝了一個引用而已。
思路二:利用copy中的deepcopy方法進行拷貝就叫做深拷貝,外圍和內部元素都進行了拷貝物件本身,而不是引用。
但是對於數字,字串和其他原子型別物件等,沒有被拷貝的說法,即便是用深拷貝,檢視id的話也是一樣的,如果對其重新賦值,也只是新建立一個物件,替換掉舊的而已。

10:有一個檔案ip.txt ,每行一條ip記錄,共若干行,下列哪個命令可以實現統計出現次數最多的前三個ip及其次數

A: uniq -c ip.txt  |  sort -rn  | head -n 3

B: sort ip.txt | uniq -c | sort -rn | head -n 3

C: cat ip.txt | count -n | sort -rn | head -n 3

D: cat ip.txt | sort | uniq -c | sort -rn | top -n 3

:B  linux基本命令具體自行百度



二:多選題

11:ls -l 顯示如下   -rwxrw-r--  1  aaa bbb 0 3月 4 11:21 ccc      下列那些說法是正確的/

A: 該檔案是個目錄

B: 該檔案擁有者所在的組使用者有許可權修改檔案

C: 該檔案的許可權數字表示為764

D: 該檔案的擁有者是bbb

:BC

參考


12:下列屬於線性分類器的是

A: 決策樹

B; 帶和核函式的SVM 

C: logistics迴歸

D: 感知器

:BCD

線性分類器:單層感知器網路、貝葉斯
非線性分類器:多層感知器網路、決策樹
SVM本身是線性分類器,帶核函式之後相當於把低維空間的資料對映到高維空間,之後就可以用線性分類器進行分類了


13: 下列常用的機器學習模型中那些屬於生成模型

A: 樸素貝葉斯

B: 隱馬爾可夫

C: 感知機

D: 決策樹

:B

樸素貝葉斯和隱馬爾可夫是生成模型

感知機,決策樹是判別模型

關於生成模型和判別模型結束


14:下列說法正確的是

A:StringBuilder是執行緒不安全的

B: java類可以同時用abstract 和 final宣告

C: HasnMap中,使用get(key)==null 可以判斷這個hashmap是否包含這個key

D: volatike關鍵字不保證對變數操作的原子性

:A,C,D

abstract類是抽象類,必須做父類


15:Python中怎樣替換一個字串

A: String模組的sub函式

B: re模組的replace()函式

C: re模組的subn()函式

D: re模組的sub()函式

:B,C,D

A中string模組meiyousub方法,有replace函式


16:Spark中的RDD的持久化操作,下面說法正確的是?

A: 呼叫persist()之後不需要主打unpersist()

B: MEMORY_ONLY_SEP模式比MEMORY_ONLY模式快

C: OFF_HEAP模式不需要序列化資料

D: MEMORY_ADD_DISK模式當記憶體放馬不下資料時會將部分資料儲存到磁碟中

:B,C,D

樓主不懂Spark,是百度之後的答案,僅供參考


17:對154個元素組成的有序表進行二分法查詢,可能的比較次數為:

A:  10

B:  8

C:  4

D:  1

:畫一個二叉樹共八層,所以小於等於8即可  B,C,D


18:有一棵二叉樹的前序遍歷和後序遍歷分別是1,2,3,4和4,3,2,1,則該二叉樹的中序遍歷可能是

A: 1,2,3,4

B: 2,3,4,1

C: 3,2,4,1

D: 4,3,2,1

:C,D


19:已知logistic迴歸分類器的分類閥值是0.5,訓練集中正負類比例為3:1,預測效能中正類的precision為0.88  recall為0.81  ,以下那些處理手段可能提高預測結果中正類的recall

A: 降低分類判斷的閥值為0.3

B: 訓練集中正負類的訓練比例調整為6:1

C: 加大logistic迴歸的正則項的權重值

D: 降低logistic迴歸的正則項的權重值


20:以下隨機變數的概率圖模型,那些圖是滿足p( c,b | a) = p(c | a)p(b |a )

A:


B:


C:


D:


:A,C(樓主不太懂的路過,,,,,)


三:主觀題

21:

解:

22:

解:

23:請描述Java的Thread類中的start()和run()兩個方法的區別?
解:

24:(1)在SVM模型中,核函式的作用是什麼?存在哪幾種核函式
(2)對於SVM模型來說,鬆弛變數有何作用?


25:現在有兩種型別的文字新聞:體育新聞和財經新聞各10000條(已分好類),想以此作為訓練樣本實現一個這兩種新聞的自動分類器,請描述如何實現(從如何將一條新聞轉化為一條用於訓練的特徵向量)
解:

相關文章