開源!《AI 演算法工程師手冊》中文教程正式釋出!

紅色石頭發表於2019-05-09

最近紅色石頭在瀏覽網頁的時候,偶然發現一份非常不錯的 AI 資源,就是這本《AI 演算法工程師手冊》 。本文將給大家推薦這本優秀教材,並作詳細的介紹。

這本《AI 演算法工程師手冊》已正式開源,無需購買紙質書籍,可以直接線上閱讀,體驗感爆棚。線上閱讀地址為:

http://www.huaxiaozhuan.com/

作者簡介

首先不得不提一下本書的作者,作者華校專,曾經在阿里巴巴擔任資深演算法工程師,現任智易科技首席演算法研究員。他還是《Python 大戰機器學習》書籍的作者。

書籍介紹

這本《AI 演算法工程師手冊》是作者多年以來學習總結的筆記,經整理之後開源於世。關於為什麼將完整書籍開源,作者是這樣說的:曾有出版社約稿,但是考慮到出版時間週期較長,而且書本購買成本高不利於技術廣泛傳播,因此就採取開源的形式。

既然本書是 AI 演算法工程師的手冊,因此內容非常豐富,基本涵蓋了機器學習、深度學習等領域的很多重要理論知識和實戰經驗,同時也介紹了工程應用中經常使用的 AI 工具和程式設計庫。

書籍整體包含了 5 大塊內容,分別是:

  • 數學基礎
  • 統計學習

  • 深度學習

  • 自然語言處理

  • 工具

下面我們分別來看一下各模組的內容。

1. 數學基礎

提升 AI 內功心法離不開紮實的數學基礎。本書數學基礎這部分,作者主要介紹了最重要的 4 點:

  1. 線性代數基礎
  2. 機率論基礎

  3. 數值計算基礎

  4. 蒙特卡洛方法與 MCMC 取樣

例如線性代數部分最基本的基礎知識:

2. 統計學習

這部分內容作者花了比較大的篇幅,主要介紹的是機器學習中一些常見的演算法,包括線性迴歸、感知機、支援向量機、決策樹、整合學習等。同時還包括模型評估、特徵選擇、降維等。具體內容如下:

  1. 機器學習簡介
  2. 線性代數基礎

  3. 支援向量機

  4. 樸素貝葉斯

  5. 決策樹

  6. knn

  7. 整合學習

  8. 梯度提升樹

  9. 特徵工程

  10. 模型評估

  11. 降維

  12. 聚類

  13. 半監督學習

  14. EM演算法

  15. 最大熵演算法

  16. 隱馬爾可夫模型

  17. 機率圖與條件隨機場

  18. 邊際機率推斷

每個演算法的理論介紹非常詳細、數學推導完整,例如支援向量機中關於對偶問題的推導:

3. 深度學習

這部分主要介紹深度學習神經網路的基本知識和模型,包括前饋神經網路、卷積神經網路、迴圈神經網路等。具體內容如下:

  1. 深度學習簡介
  2. 反向傳播演算法

  3. 正則化

  4. 最最佳化基礎

  5. 卷積神經網路

  6. 迴圈神經網路

  7. 工程實踐指導原則

這部分詳細介紹了神經網路模型的基本結構和訓練方法,例如列舉了經典 CNN 結構:LeNet、AlexNet、VGG-Net、Inception、ResNet、ResNet 變種、SENet、DenseNet。

1998 年 LeCun 推出的 LeNet 網路:

4. 自然語言處理

這部分作者主要介紹了自然語言處理領域的 2 個方面:

**1. 主題模型 **

  • Unigram Model
  • pLSA Model

  • LDA Model

  • 型討論

2. 詞向量

  • 向量空間模型 VSM
  • LSA

  • Word2Vec

  • GloVe

5. 工具

這部分主要介紹了 AI 常用工具和函式庫,具體內容如下:

  1. CRF
  2. lightgbm

  3. xgboost

  4. scikit-learn

  5. spark

  6. numpy

  7. scipy

  8. matplotlib

  9. pandas

這部分的內容更加側重於 AI 實戰,包含很多具體函式庫的使用教程和程式碼。例如 lightbgm 是一個快速的,分散式的,高效能的基於決策樹演算法的梯度提升框架。可用於排序,分類,迴歸以及很多其他的機器學習任務中。本書對 lightbgm 的安裝、各引數含義、調參、使用等都作了詳細的介紹,宛如一份優秀的中文文件!

這裡附上 lightbgm 簡單的 pip 安裝方法:

pip install lightgbm
pip install --no-binary :all: lightgbm #從原始碼編譯安裝
pip install lightgbm --install-option=--mpi #從原始碼編譯安裝 MPI 版本
pip install lightgbm --install-option=--gpu #從原始碼編譯安裝 GPU 版本
pip install lightgbm --install-option=--gpu --install-option="--opencl-include-dir=/usr/local/cuda/include/" --install-option="--opencl-library=/usr/local/cuda/lib64/libOpenCL.so" #從原始碼編譯安裝,指定配置
#可選的配置有:
# boost-root
# boost-dir
# boost-include-dir
# boost-librarydir
# opencl-include-dir
# opencl-library

同樣,像 xgboost、scikit-learn 等庫,書中也作了詳盡的解釋。除此之外,還有 spark 的內容哦,可以說是非常全面了。

最後

不得不說,這本《AI 演算法工程師手冊》是一本比較完備的 AI 書籍,既包含了演算法理論,也有實戰 AI 演算法庫的使用。作為一份參考手冊還是非常不錯的!

更重要的是本書完全開源,直接線上閱讀就好了。不過注意該書籍僅供個人學習使用,非作者同意不得應用於商業領域。


相關文章