勵志!充滿乾貨的AI面經:純電力員工如何成功轉行NLP並薪資翻倍

七月線上實驗室發表於2019-03-21

640?wx_fmt=png

掃描上方二維碼  關注:七月線上實驗室 

後臺回覆:100  免費領取【機器學習面試100題】PDF版


導讀:“金三銀四”之季,都三月底了,金三也已過大半個月了,小夥伴們都找到心儀的工作了?拿到高薪offer了嗎?今天,小七和大家分享一篇AI面經,來自我們機器集訓營第五期童鞋寫的,絕對的勵志篇,乾貨滿滿!希望對大家有所幫助~

以下是面經原文

大家好,我是集五的學員,經過長時間的學習,我成功從電力行業轉行AI,薪酬翻倍。但需要要說明的是,作為電力行業的基層員工,工資本來就低,所以工資翻倍對於各位本就在IT行業內的朋友來說,沒有什麼參考價值,純粹貽笑大方,只能我自己偷偷竊喜一番。應July校長的邀請,我腆著臉來班門弄斧,和大家分享一下面經和經歷。


單刀直入,先分享我的面經,至於轉行的部分和我的經歷,我放在最後面,這樣有興趣的朋友,可以參考。


我選的方向是NLP。


通識部分(小編注:絕大部分面試題都可以在七月線上APP中通過搜尋相關關鍵詞搜到哦)

1.LR

介紹一下?公式推導?損失函式及其影象?與線性迴歸的關係?你在什麼地方用過?怎麼用的?


2.正則化

解釋下正則化?


3.DT

ID3?C4.5?CART?區別,優點、缺點,計算公式?

為什麼DT不適合稀釋資料?

預剪枝?後減枝?

3.1 Adaboost

介紹一下Adaboost?手推Adaboost

3.2 GBDT

GBDT騰訊面試必問,因為我去的鵝廠現場面試的,被問到了GBDT的相關內容,而旁邊一個面試官在電話面試,也是在問GBDT的內容。

介紹下GBDT?GBDT的基模型是什麼,是分類樹還是迴歸樹?Gradient的體現?為什麼要使用多棵樹來不斷縮小殘差?而不是使用一棵擬合得更好的數?GBDT如何構建特徵?GBDT如何用於分類,寫出公式?

3.3 XGBoost

手推XGBoost必備的。

你在什麼地方用到了XGBoost?它和GBDT的區別在哪裡?你為什麼不用LightGBM?

XGBoost不手推一下,說的內容感覺會很蒼白。

3.4 隨機森林

解釋下隨機森林?

你用它做過什麼?為什麼可以用它?

解釋下bagging?


4.SVM

手推SVM,必備的。

SVM的損失函式是什麼,為什麼選擇它作為損失函式?

為什麼用對偶?

核函式是什麼,有什麼作用?你用過哪幾種核函式?這裡最好寫出來。


5.深度學習部分

解釋一下交叉熵、相對熵,它們的關係?互資訊呢?

Cross Entropy是什麼,它和log loss的區別?

Dropout防止過擬合的原理?

CNN如何用於NLP?CNN和RNN在NLP中能到達什麼效果,怎麼選擇用哪一個?

梯度消失?梯度爆炸?

解釋下LSTM,畫出結構?GRU?為什麼用LSTM不用RNN?


6.特徵工程

如何處理缺失值?異常值?為什麼這麼處理?

怎麼降維?遇到的資料最大多少維?你怎麼做?為什麼這麼做?

類別型資料的處理?連續性資料的處理?你怎麼分桶的?

資料不平衡怎麼做?要注意什麼?


7.聚類演算法

你用過什麼聚類演算法?解釋下原理?

K-means有什麼問題?如何解決這些問題?

說一說“中餐館問題”——抱歉,這個我現在還沒搞明白。


8.降維

解釋下PCA?LDA?SVD?區別?手推。

解釋下協同過濾?


9.模型評估

Accuracy、Precision、Recall、F1-score、ROC、AUC

以上,概念、公式?

資料不平衡用什麼評估指標?

P-R曲線和ROC的區別?


NLP方向的問題:

1.TF-IDF

原理、公式?為什麼用log?為什麼“+1”?缺點?


2.NNLM、Word2vec、Doc2vec、FastText

介紹一下,解釋一下模型?

怎麼選擇使用Word2vec、Doc2vec?

解釋下Huffman Tree或Negative Sampling?詳細說下Huffman Tree或Negative Sampling的過程?

Word2vec有什麼優點、缺點?

Word2vec的模型引數怎麼設定的?

餘弦相似度?為什麼使用餘弦相似度?


3.Seq2seq、attention機制、self-attention機制、Transformer、bert

介紹下模型?

attention機制、self-attention機制的計算過程?為什麼使用attention?它們的優點?

bert的結構和應用?bert的為什麼這麼厲害?


CNN→RNN→LSTM/GRU→seq2seq→seq2seq-Attention→Transformer-self Attention→bert

這是一條線,我在說RNN的部分時,就把這條線順著說完。


NNLM→Word2vec→Doc2vec→FastText→ELMO→GPT→Bert

這是另一條線,被問到Word2vec時我先退回去說NNLM,然後在Word2vec,要是面試官不反感,又繼續沿著線走。


其他:

1.根據簡歷上寫的專案來進行具體的提問?

資料量?資料來源?為什麼想到真麼做?這麼做優點、缺點?

Python迭代器和生成器?


2.演算法題

不說了,我面了那麼多,一道題都沒答上來。校長說的四大金剛之一:leetcode(小編注:校長的口頭禪四大金剛指的就是:課程 題庫 OJ 競賽),因為自身原因,我戰略性放棄了,之後一定要補起來。

去某手機廠面試的時候,上來直接來3道題,把我幹懵了;

對於這方面能力和我不相伯仲的朋友,我建議電話面試優先!一般電話面試不會去問演算法題。


3.非技術面

為什麼轉行?

這是轉行的朋友肯定會被問到的問題,一定想好說辭,好好準備。

未來規劃?

薪資期望?

你遇到的最困難的事?你如何解決的?

評價下你自己?

你有什麼問題要問我們?


我的筆記全在印象筆記上,自己又根據七月線上的題庫對問題和答案進行了整理後,製作了Anki卡片,用來記憶各種知識點,如果有朋友需要,請看本文的置頂評論。(另外關於Anki和它的使用,自行百度即可,記憶知識點的神器。)


轉行的經歷

學歷本科,專業是動力,完全與IT無關,畢業後一直在電力系統做設計工作。後來工資實在太低了,活不下去了,得知我單位的一個好兄弟,轉行進了華為,年薪50W,目瞪口呆之下詢問了一波他的經歷,知道了七月線上和機器學習。再三權衡之後,也下定決心準備轉行,從事AI相關的工作。當然,他是清華核物理碩士,數學本來就很騷,大學期間學過Java,我和他沒有可比性。


我沒什麼程式設計基礎,大學裡學的C++早被門外的旺財吃了;因為是工科,對高數、概率論、線代還有點記憶;機器學習、深度學習相關演算法,在此之前從沒接觸過。


報名了集訓營第五期,是我的開端。不會就學唄,不懂就問、就查唄,CSDN、Github、stackoverflow、群裡提問,線下課有問題就問,沒什麼方法。看一遍不懂就看兩遍,不行就三遍以上,搞懂,能推導。沒什麼捷徑,真的。我是用了七八個月的時間,才達到了目前這個嘴炮菜雞水平,未來的路還很長,要學習和彌補的東西還很多,不過轉行了,做中學吧。我另一個兄弟,也是我的同事,集六的學員,在我之前拿到的offer。


推導公式,很重要,非常重要,就算面試官不讓你寫,你也搶過紙和筆,寫出來,不然我感覺真的太蒼白無力了。而且現在水漲船高,SVM和XGBoost的推導已經是常規操作了,不是特殊技能了。


Tensorflow必須掌握,別說自己會keras了,丟人,真的,不開玩笑,至少我遇到公司都是這樣。簡歷上最好把深度學習的知識具體的體現出來,比如你在某個專案上搭的模型是什麼樣子,這樣更容易獲得面試機會。


最好是會使用Hadoop和Spark,這也慢慢成了必備技能了,我目前還不會,雖然集訓營講了,得趕緊在入職前學習一波;最好會SQL,這個我就完全不知道了,後續又學習。


我覺得最重要的課程是七月線上的機器學習第八期或第九期;西瓜書、統計學習方法、花書,要是急你不看也行,但是我上面提到的問題,你必須都知道。


關於找工作,我是海投了一波,廣撒網,雙手合十,一切看天。真的得看運氣,說不好的。拿到Offer之前,少吹牛。我去年年終獎比別人少了一倍,怒火中燒,年會吃飯直接避開領導,當面回絕敬酒,只和身邊二三關係要好的同事酒到杯傾,一飲而盡,並篤定說年後自己要走。但是幾次面試折戟之後,心裡開始慌了,想到前路茫茫和自己之前恬不知恥的吹牛誇大,實在是羞愧難當。但是家境又確實不允許我辭掉工作去完全學習和等待面試,得斷糧餓死,所以又準備腆著臉繼續忍辱負重,希望守得雲開見月明。沒必要的牛皮給自己又添上了沉重的心裡壓力,真的沒必要。“悶聲發大財”,自己實力過硬是關鍵。


我現在還是孤陋寡聞的小菜雞,要學習的東西還非常多,不敢說分享成功經驗,只能說分享下自己的經歷。現在成功轉行了,我還是很開心的。當然,我能夠成功轉行,要感謝很多人:助教Yang,助教馬總,寒老師、July校長等,集五的波哥、成哥、飛哥、Miss Jiang、鋒哥、長林哥等等學員,還有甚者線下的Paul、安哥、瑞哥等,集四的九州、思佳,集六茂茂。你們對無知的我的給予的幫助,給了我非常大的助力,一直銘記於心,十分感謝。


640?wx_fmt=png



640?wx_fmt=gif


今日學習推薦


機器學習集訓營第八期

火熱報名中


2019年4月15日開課


前50人特惠價:14399 


報名加送18VIP[包2018全年線上課程和全年GPU]


且兩人及兩人以上組團還能各減500元

有意的親們抓緊時間嘍


諮詢/報名/組團可新增微信客服

julyedukefu_02


掃描下方二維碼

免費試聽

640?wx_fmt=png

長按識別二維碼


640?wx_fmt=gif


640?wx_fmt=gif

備戰AI求職季 | 100道機器學習面試題(上)

一文詳解:什麼是B樹?

機器學習中的數學基礎(微積分和概率統計)

一文詳解機器學習中最好用的提升方法:Boosting 與 AdaBoost

34個最優秀好用的Python開源框架

【實戰分享】電影推薦系統專案實戰應用

萬字長文概述NLP中的深度學習技術


諮詢,檢視課程,請點選“閱讀原文

「 在看的,麻煩點一下再走~ 」


相關文章