勵志!充滿乾貨的AI面經:純電力員工如何成功轉行NLP並薪資翻倍
掃描上方二維碼 關注:七月線上實驗室
後臺回覆:100 免費領取【機器學習面試100題】PDF版
導讀:“金三銀四”之季,都三月底了,金三也已過大半個月了,小夥伴們都找到心儀的工作了?拿到高薪offer了嗎?今天,小七和大家分享一篇AI面經,來自我們機器集訓營第五期童鞋寫的,絕對的勵志篇,乾貨滿滿!希望對大家有所幫助~
以下是面經原文
大家好,我是集五的學員,經過長時間的學習,我成功從電力行業轉行AI,薪酬翻倍。但需要要說明的是,作為電力行業的基層員工,工資本來就低,所以工資翻倍對於各位本就在IT行業內的朋友來說,沒有什麼參考價值,純粹貽笑大方,只能我自己偷偷竊喜一番。應July校長的邀請,我腆著臉來班門弄斧,和大家分享一下面經和經歷。
單刀直入,先分享我的面經,至於轉行的部分和我的經歷,我放在最後面,這樣有興趣的朋友,可以參考。
我選的方向是NLP。
通識部分(小編注:絕大部分面試題都可以在七月線上APP中通過搜尋相關關鍵詞搜到哦):
1.LR
介紹一下?公式推導?損失函式及其影象?與線性迴歸的關係?你在什麼地方用過?怎麼用的?
2.正則化
解釋下正則化?
3.DT
ID3?C4.5?CART?區別,優點、缺點,計算公式?
為什麼DT不適合稀釋資料?
預剪枝?後減枝?
3.1 Adaboost
介紹一下Adaboost?手推Adaboost
3.2 GBDT
GBDT騰訊面試必問,因為我去的鵝廠現場面試的,被問到了GBDT的相關內容,而旁邊一個面試官在電話面試,也是在問GBDT的內容。
介紹下GBDT?GBDT的基模型是什麼,是分類樹還是迴歸樹?Gradient的體現?為什麼要使用多棵樹來不斷縮小殘差?而不是使用一棵擬合得更好的數?GBDT如何構建特徵?GBDT如何用於分類,寫出公式?
3.3 XGBoost
手推XGBoost必備的。
你在什麼地方用到了XGBoost?它和GBDT的區別在哪裡?你為什麼不用LightGBM?
XGBoost不手推一下,說的內容感覺會很蒼白。
3.4 隨機森林
解釋下隨機森林?
你用它做過什麼?為什麼可以用它?
解釋下bagging?
4.SVM
手推SVM,必備的。
SVM的損失函式是什麼,為什麼選擇它作為損失函式?
為什麼用對偶?
核函式是什麼,有什麼作用?你用過哪幾種核函式?這裡最好寫出來。
5.深度學習部分
解釋一下交叉熵、相對熵,它們的關係?互資訊呢?
Cross Entropy是什麼,它和log loss的區別?
Dropout防止過擬合的原理?
CNN如何用於NLP?CNN和RNN在NLP中能到達什麼效果,怎麼選擇用哪一個?
梯度消失?梯度爆炸?
解釋下LSTM,畫出結構?GRU?為什麼用LSTM不用RNN?
6.特徵工程
如何處理缺失值?異常值?為什麼這麼處理?
怎麼降維?遇到的資料最大多少維?你怎麼做?為什麼這麼做?
類別型資料的處理?連續性資料的處理?你怎麼分桶的?
資料不平衡怎麼做?要注意什麼?
7.聚類演算法
你用過什麼聚類演算法?解釋下原理?
K-means有什麼問題?如何解決這些問題?
說一說“中餐館問題”——抱歉,這個我現在還沒搞明白。
8.降維
解釋下PCA?LDA?SVD?區別?手推。
解釋下協同過濾?
9.模型評估
Accuracy、Precision、Recall、F1-score、ROC、AUC
以上,概念、公式?
資料不平衡用什麼評估指標?
P-R曲線和ROC的區別?
NLP方向的問題:
1.TF-IDF
原理、公式?為什麼用log?為什麼“+1”?缺點?
2.NNLM、Word2vec、Doc2vec、FastText
介紹一下,解釋一下模型?
怎麼選擇使用Word2vec、Doc2vec?
解釋下Huffman Tree或Negative Sampling?詳細說下Huffman Tree或Negative Sampling的過程?
Word2vec有什麼優點、缺點?
Word2vec的模型引數怎麼設定的?
餘弦相似度?為什麼使用餘弦相似度?
3.Seq2seq、attention機制、self-attention機制、Transformer、bert
介紹下模型?
attention機制、self-attention機制的計算過程?為什麼使用attention?它們的優點?
bert的結構和應用?bert的為什麼這麼厲害?
CNN→RNN→LSTM/GRU→seq2seq→seq2seq-Attention→Transformer-self Attention→bert
這是一條線,我在說RNN的部分時,就把這條線順著說完。
NNLM→Word2vec→Doc2vec→FastText→ELMO→GPT→Bert
這是另一條線,被問到Word2vec時我先退回去說NNLM,然後在Word2vec,要是面試官不反感,又繼續沿著線走。
其他:
1.根據簡歷上寫的專案來進行具體的提問?
資料量?資料來源?為什麼想到真麼做?這麼做優點、缺點?
Python迭代器和生成器?
2.演算法題
不說了,我面了那麼多,一道題都沒答上來。校長說的四大金剛之一:leetcode(小編注:校長的口頭禪四大金剛指的就是:課程 題庫 OJ 競賽),因為自身原因,我戰略性放棄了,之後一定要補起來。
去某手機廠面試的時候,上來直接來3道題,把我幹懵了;
對於這方面能力和我不相伯仲的朋友,我建議電話面試優先!一般電話面試不會去問演算法題。
3.非技術面
為什麼轉行?
這是轉行的朋友肯定會被問到的問題,一定想好說辭,好好準備。
未來規劃?
薪資期望?
你遇到的最困難的事?你如何解決的?
評價下你自己?
你有什麼問題要問我們?
我的筆記全在印象筆記上,自己又根據七月線上的題庫對問題和答案進行了整理後,製作了Anki卡片,用來記憶各種知識點,如果有朋友需要,請看本文的置頂評論。(另外關於Anki和它的使用,自行百度即可,記憶知識點的神器。)
轉行的經歷
學歷本科,專業是動力,完全與IT無關,畢業後一直在電力系統做設計工作。後來工資實在太低了,活不下去了,得知我單位的一個好兄弟,轉行進了華為,年薪50W,目瞪口呆之下詢問了一波他的經歷,知道了七月線上和機器學習。再三權衡之後,也下定決心準備轉行,從事AI相關的工作。當然,他是清華核物理碩士,數學本來就很騷,大學期間學過Java,我和他沒有可比性。
我沒什麼程式設計基礎,大學裡學的C++早被門外的旺財吃了;因為是工科,對高數、概率論、線代還有點記憶;機器學習、深度學習相關演算法,在此之前從沒接觸過。
報名了集訓營第五期,是我的開端。不會就學唄,不懂就問、就查唄,CSDN、Github、stackoverflow、群裡提問,線下課有問題就問,沒什麼方法。看一遍不懂就看兩遍,不行就三遍以上,搞懂,能推導。沒什麼捷徑,真的。我是用了七八個月的時間,才達到了目前這個嘴炮菜雞水平,未來的路還很長,要學習和彌補的東西還很多,不過轉行了,做中學吧。我另一個兄弟,也是我的同事,集六的學員,在我之前拿到的offer。
推導公式,很重要,非常重要,就算面試官不讓你寫,你也搶過紙和筆,寫出來,不然我感覺真的太蒼白無力了。而且現在水漲船高,SVM和XGBoost的推導已經是常規操作了,不是特殊技能了。
Tensorflow必須掌握,別說自己會keras了,丟人,真的,不開玩笑,至少我遇到公司都是這樣。簡歷上最好把深度學習的知識具體的體現出來,比如你在某個專案上搭的模型是什麼樣子,這樣更容易獲得面試機會。
最好是會使用Hadoop和Spark,這也慢慢成了必備技能了,我目前還不會,雖然集訓營講了,得趕緊在入職前學習一波;最好會SQL,這個我就完全不知道了,後續又學習。
我覺得最重要的課程是七月線上的機器學習第八期或第九期;西瓜書、統計學習方法、花書,要是急你不看也行,但是我上面提到的問題,你必須都知道。
關於找工作,我是海投了一波,廣撒網,雙手合十,一切看天。真的得看運氣,說不好的。拿到Offer之前,少吹牛。我去年年終獎比別人少了一倍,怒火中燒,年會吃飯直接避開領導,當面回絕敬酒,只和身邊二三關係要好的同事酒到杯傾,一飲而盡,並篤定說年後自己要走。但是幾次面試折戟之後,心裡開始慌了,想到前路茫茫和自己之前恬不知恥的吹牛誇大,實在是羞愧難當。但是家境又確實不允許我辭掉工作去完全學習和等待面試,得斷糧餓死,所以又準備腆著臉繼續忍辱負重,希望守得雲開見月明。沒必要的牛皮給自己又添上了沉重的心裡壓力,真的沒必要。“悶聲發大財”,自己實力過硬是關鍵。
我現在還是孤陋寡聞的小菜雞,要學習的東西還非常多,不敢說分享成功經驗,只能說分享下自己的經歷。現在成功轉行了,我還是很開心的。當然,我能夠成功轉行,要感謝很多人:助教Yang,助教馬總,寒老師、July校長等,集五的波哥、成哥、飛哥、Miss Jiang、鋒哥、長林哥等等學員,還有甚者線下的Paul、安哥、瑞哥等,集四的九州、思佳,集六茂茂。你們對無知的我的給予的幫助,給了我非常大的助力,一直銘記於心,十分感謝。
今日學習推薦
【機器學習集訓營第八期】
火熱報名中
2019年4月15日開課
前50人特惠價:14399
報名加送18VIP[包2018全年線上課程和全年GPU]
且兩人及兩人以上組團還能各減500元
有意的親們抓緊時間嘍
諮詢/報名/組團可新增微信客服
julyedukefu_02
掃描下方二維碼
免費試聽
☟
長按識別二維碼
●一文詳解機器學習中最好用的提升方法:Boosting 與 AdaBoost
點
諮詢,檢視課程,請點選“閱讀原文”
「 在看的,麻煩點一下再走~ 」相關文章
- 【非廣告,純乾貨】本科畢業3年的我,是如何薪資翻倍拿到38萬年薪Offer的?【石杉的架構筆記】架構筆記
- AI offer面經分享:薪資近乎翻倍,題庫裡的xgboost筆記看了不下十遍AI筆記
- 集3學員AI面經:如何成功轉型一週連續拿下3個30萬offerAI
- 純乾貨:21天帶你玩轉容器
- 乾貨面經 | 初中級爬蟲工程師面試指北 - 畢業工作一年薪資翻番了爬蟲工程師面試
- ES6的概念以及執行環境~滿滿的乾貨
- 做為管理者如何有效的激勵員工?
- 勵志格言經典短句
- 如何解決員工執行力不強的問題
- 我在職場第一次薪資翻倍的經歷!
- 又跳槽!3年Java經驗收割成都大廠的面試心得(乾貨滿滿&文末有福利)Java面試
- 【乾貨】BAT面試經驗分享BAT面試
- 谷歌AI員工百萬年薪曝光,真相讓人心酸!谷歌AI
- 乾貨滿滿!!!面試必備OJ題:連結串列篇(一)面試
- AI客服上線 乾貨 乾貨 全是乾貨!AI
- 純乾貨分享 —— 大資料入門指南大資料
- 一位轉行成功並從事5年的大資料開發的經驗分享大資料
- 純乾貨分享: 如何在 React 框架中使用SpreadJSReact框架JS
- 乾貨|測試人員如何助軟體成功上線?如何建立一個好的部署計劃?
- 乾貨滿滿的 Go Modules 和 goproxy.cnGo
- GopherChina 2021 定了,乾貨滿滿的來了Go
- 關於PaaS的純乾貨總結
- React Native純乾貨總結React Native
- 老師講的真棒!如何在Android-Studio下進行NDK開發,滿滿乾貨指導Android
- 軟體測試員,聽說你在找工作!給你講講我是如何實現薪資翻倍的?
- Golang進階,揉碎資料庫中介軟體,乾貨滿滿!Golang資料庫
- 千萬不要錯過的後端[純乾貨]面試知識點整理 I後端面試
- 乾貨滿滿!2020版好程式設計師新電商大資料平臺全套學習資料程式設計師大資料
- 中國電力工業140週年 | 志翔科技:大資料助力電力數智化升級大資料
- 乾貨滿滿 | 微服務化的資料庫設計與讀寫分離微服務資料庫
- 非凸科技&CSDN,線上直播,乾貨滿滿
- 員工電腦資訊保安
- 千萬不要錯過的後端[純乾貨]面試知識點整理 I I後端面試
- 純乾貨分享,15個字教你如何寫好爆款文章
- 轉行學IT技術,薪資高嗎
- 一份資料工程師必備的學習資源,乾貨滿滿(附連結)工程師
- 上乾貨!大廠面試走心經驗分享!面試
- 乾貨丨如何水平擴充套件和垂直擴充套件DolphinDB叢集?套件