Intel因特爾 SSG大資料實習生面試

Peng__Ge發表於2018-03-11

2018/3/11更:

星期四去面試了一下大資料實習生;以下是兩個小時面試的問題,按回憶順序,有興趣的同學可以看一下,希望對你們有幫助

有兩個師兄,一個師姐都在Intel了;內推了一下,針對他們情況和個人面試情況,總結一下Intel對實習生要求:

如果你面測試;1、Linux你需要玩的很溜,而不是一點簡單的操作指令,shell指令碼要會;Python在測試指令碼里面很重要!

2、暑期應該是Intel招聘實習的高峰,缺人!我研一的時候也面過Intel測試,而且錄用了,但是需要我每週去4天,我要做論文,所以沒去成;

接下來是個人的面試問題:

1、根據簡歷問問題,Linux如何看埠是否被佔用, ps -ef | grep -i 埠號    netstat -tunple|grep 埠號

2、Hadoop和Spark主要區別,談談你對Spark的理解

HADOOP用的是mapreduce,spark是RDD,容錯率更高,速度上spark也會更快一些,因為MAPREDUCE的中間結果落地,保留在磁碟裡面;而Spark放在了記憶體裡面

3、談談對Python Pandas認識和個人程式碼量

Pandas 主要就是兩個東西,Series和DataFrame,前者類似於一維陣列、後者類似於二維資料,pandas經常用來讀取、儲存資料,用來做資料處理工作等等;而且切片功能是非常強大的!補充:Numpy主要是用來做陣列運算

4、手寫一下兩個DataFrame列相加

處於嚴謹,應該問清楚一下是放在新的列上還是放在原始的某列上;面試官也沒有細說

5、介紹一下再KAGGLE比賽上的東西和做法,還有論文的做法

主要講了三點:1、針對KAGGLE比賽,講了一下特徵處理過程,演算法選擇,選擇方法時考慮的優劣勢等;然後分析了一下論文的整個過程,感覺面我的對這方面並不是太瞭解,然後講了很久。。

6、資料庫設計三大正規化和事務四大準則

三大正規化:1、保證欄位的單元最小,2、保證欄位與主鍵有關係  3、保證欄位與主鍵是直接關係(非間接關係)

四大準則:1、孤立性、事務之間是隔離的  2、一致性、事務執行前後是一致的 3、原子性:事務是整體執行or不執行的,不會部分執行 4、永續性:事務執行之後,資料庫發生的變化是持久的!

7、你使用過那些Linux指令:

PS -ef:看程式     kill:殺死程式    cd cd..:進入路徑和返回上一層路徑  grep:正則匹配  ssh:遠端連線

scp:與伺服器之間的資料傳輸   mv:檔案移動  cp:複製拷貝   vim、touch:建立文字   mkdir:建立資料夾

rm:刪除檔案or資料夾,看引數;unzip:解壓  tar:打包或者解包。。 等等,基本的沒啥問題,但是面試官覺得太low了 

8:主管進來了,然後就是聊天;然後推薦我去看看最近研發的晶片,對我有幫助,我過幾天會去學習一下的!然後讓我回去等通知,十幾個裡面要兩個

從高中一直聊到研究生,各種聊天,其實就是對你的資訊挖掘,大家面試別緊張,多面幾次吧,抗壓很重要,每次兩個小時,來幾次你就會收穫很多的!

希望對你們有幫助!

相關文章