【資源】NLP 演算法工程師相關的面試題

視學演算法發表於2020-04-06

點選上方,選擇星標置頂,每天給你送乾貨smiley_20.png

閱讀大概需要4分鐘2_06.png

跟隨小博主,每天進步一丟丟smiley_28.png

作者 | songyingxin

https://github.com/songyingxin/NLPer-Interview

本專案記錄了面試NLP演算法工程師常會遇到的問題。

1. 程式語言基礎

該資料夾下主要記錄 python 和 c++ 的一些語言細節, 畢竟這兩大語言是主流,基本是都要會的,目前還在查缺補漏中。

  • C++面試題

  • Python 面試題

2. 數學基礎

該資料夾下主要記錄一些數學相關的知識,包括高數,線性代數,概率論與資訊理論, 老宋親身經歷,會問到, 目前尚在查缺補漏中。

  • 概率論

  • 高等數學

  • 線性代數

  • 資訊理論

3. 計算機基礎理論知識

這部分內容一般不怎麼考,因此,沒有把重心放在上面,至少現在幾乎沒有遇到問這方面的, 有意思的是,投了阿里某部的NLP演算法,居然來了個不懂NLP的來面,全程真的瞎聊,全是開發。

4. 機器學習基礎

這部分已經開始進入正題了,事實證明,部分大廠會提及一些基礎的機器學習演算法知識,因此,這部分我覺得幾個核心的模型是要會的。

  • 機器學習專案流程

  • 判別模型 vs 生成模型

  • 頻率派 vs 貝葉斯派

  • 資料預處理

  • 特徵工程

  • 特徵工程-關聯規

  • 模型 - SVM

  • 模型 - 聚類演算法

  • 模型 - 決策樹

  • 模型 - 邏輯迴歸

  • 模型 - 樸素貝葉斯

  • 模型 - 隨機森林

  • 模型 - 線性迴歸

5. 深度學習基礎

這部分主要講述深度學習方面的基礎知識,是核心點,但很多情況下,很多面試官的題基本差不多,不過我個人覺得,有這種全域性的,全面的知識框架是有益的。

  • 深度學習專案流程

5.1 基礎理論部分

  • 基礎理論 - 多工學習

  • 基礎理論 - 整合學習

  • 基礎理論 - 分類問題評估指標

  • 基礎理論 - 距離度量方法

  • 基礎理論 - 目標函式,損失函式,代價函式

  • 基礎理論 - 偏差 vs 方差,欠擬合 vs 過擬合

  • 基礎理論 - 資料角度看深度學習

  • 基礎理論 - 梯度消失,梯度爆炸問題

  • 基礎理論 - 維數災難問題

  • 基礎理論 - 指數加權平均

  • 基礎理論- 區域性最小值,鞍點

  • 基礎理論 - 整合學習

  • 基礎理論 - 整合學習

5.2 基本單元

  • 基本單元 - CNN

  • 基本單元 - MLP

  • 基本單元 - RNN

5.3 調參相關

  • 調參 - 超引數調優

  • 調參 - 啟用函式

  • 調參 - 權重初始化方案

  • 調參 - 優化演算法

5.4 Tricks

  • Trick - Dropout

  • Trick - Normalization

  • Trick - 融合訓練集,驗證集,測試集

  • Trick - 提前終止

  • Trick - 學習率衰減

  • Trick - 正則化

6. 統計自然語言處理

這部分前期的筆記做的不多,因此還沒怎麼開始。

7. 深度學習自然語言處理

這部分算是核心的知識了,這部分還需要逐漸完善,時間有點緊啊。

  • 文字資料預處理

  • 各大任務的評價指標

  • 改進 NLP 模型的一些思路

7.1 詞向量三部曲

  • 詞向量 - Word2Vec

  • 詞向量 - Glove

  • 詞向量 - FastText

7.2 預訓練語言模型

  • 預訓練語言模型 - BERT改進研究

  • 預訓練語言模型 - 融入知識圖譜

  • 預訓練語言模型 - 自然語言生成

7.3 Attention 機制

7.4 文字分類

7.5 語義匹配

7.6 閱讀理解

8. 原始碼閱讀

這部分主要推薦一些自己閱讀過的一些原始碼,有些原始碼是 NLP 相關, 有些是深度學習相關的,部分原始碼我個人有做註釋,會相應的列出來。

原文連結:

https://github.com/songyingxin/NLPer-Interview

- END -
如果看到這裡,說明你喜歡這篇文章,請轉發、點贊。微信搜尋「perfect_iscas」,關注後回覆「進群」或者掃描下方二維碼即可進入無廣告技術交流群。
掃描二維碼進群↓

640?wx_fmt=jpeg

640

640?wx_fmt=gif

在看 640?wx_fmt=jpeg

相關文章