最近紅色石頭在瀏覽網頁的時候,偶然發現一份非常不錯的 AI 資源,就是這本《AI 演算法工程師手冊》 。本文將給大家推薦這本優秀教材,並作詳細的介紹。
這本《AI 演算法工程師手冊》已正式開源,無需購買紙質書籍,可以直接線上閱讀,體驗感爆棚。線上閱讀地址為:
http://www.huaxiaozhuan.com/
作者簡介
首先不得不提一下本書的作者,作者華校專,曾經在阿里巴巴擔任資深演算法工程師,現任智易科技首席演算法研究員。他還是《Python 大戰機器學習》書籍的作者。
書籍介紹
這本《AI 演算法工程師手冊》是作者多年以來學習總結的筆記,經整理之後開源於世。關於為什麼將完整書籍開源,作者是這樣說的:曾有出版社約稿,但是考慮到出版時間週期較長,而且書本購買成本高不利於技術廣泛傳播,因此就採取開源的形式。
既然本書是 AI 演算法工程師的手冊,因此內容非常豐富,基本涵蓋了機器學習、深度學習等領域的很多重要理論知識和實戰經驗,同時也介紹了工程應用中經常使用的 AI 工具和程式設計庫。
書籍整體包含了 5 大塊內容,分別是:
- 數學基礎<p>
-
統計學習
-
深度學習
-
自然語言處理
-
工具
下面我們分別來看一下各模組的內容。
1. 數學基礎
提升 AI 內功心法離不開紮實的數學基礎。本書數學基礎這部分,作者主要介紹了最重要的 4 點:
- 線性代數基礎<p>
-
機率論基礎
-
數值計算基礎
-
蒙特卡洛方法與 MCMC 取樣
例如線性代數部分最基本的基礎知識:
2. 統計學習
這部分內容作者花了比較大的篇幅,主要介紹的是機器學習中一些常見的演算法,包括線性迴歸、感知機、支援向量機、決策樹、整合學習等。同時還包括模型評估、特徵選擇、降維等。具體內容如下:
- 機器學習簡介<p>
-
線性代數基礎
-
支援向量機
-
樸素貝葉斯
-
決策樹
-
knn
-
整合學習
-
梯度提升樹
-
特徵工程
-
模型評估
-
降維
-
聚類
-
半監督學習
-
EM演算法
-
最大熵演算法
-
隱馬爾可夫模型
-
機率圖與條件隨機場
-
邊際機率推斷
每個演算法的理論介紹非常詳細、數學推導完整,例如支援向量機中關於對偶問題的推導:
3. 深度學習
這部分主要介紹深度學習神經網路的基本知識和模型,包括前饋神經網路、卷積神經網路、迴圈神經網路等。具體內容如下:
- 深度學習簡介<p>
-
反向傳播演算法
-
正則化
-
最最佳化基礎
-
卷積神經網路
-
迴圈神經網路
-
工程實踐指導原則
這部分詳細介紹了神經網路模型的基本結構和訓練方法,例如列舉了經典 CNN 結構:LeNet、AlexNet、VGG-Net、Inception、ResNet、ResNet 變種、SENet、DenseNet。
1998 年 LeCun 推出的 LeNet 網路:
4. 自然語言處理
這部分作者主要介紹了自然語言處理領域的 2 個方面:
**1. 主題模型 **
- Unigram Model<p>
-
pLSA Model
-
LDA Model
-
型討論
2. 詞向量
- 向量空間模型 VSM<p>
-
LSA
-
Word2Vec
-
GloVe
5. 工具
這部分主要介紹了 AI 常用工具和函式庫,具體內容如下:
- CRF<p>
-
lightgbm
-
xgboost
-
scikit-learn
-
spark
-
numpy
-
scipy
-
matplotlib
-
pandas
這部分的內容更加側重於 AI 實戰,包含很多具體函式庫的使用教程和程式碼。例如 lightbgm 是一個快速的,分散式的,高效能的基於決策樹演算法的梯度提升框架。可用於排序,分類,迴歸以及很多其他的機器學習任務中。本書對 lightbgm 的安裝、各引數含義、調參、使用等都作了詳細的介紹,宛如一份優秀的中文文件!
這裡附上 lightbgm 簡單的 pip 安裝方法:
pip install lightgbm
pip install --no-binary :all: lightgbm #從原始碼編譯安裝
pip install lightgbm --install-option=--mpi #從原始碼編譯安裝 MPI 版本
pip install lightgbm --install-option=--gpu #從原始碼編譯安裝 GPU 版本
pip install lightgbm --install-option=--gpu --install-option="--opencl-include-dir=/usr/local/cuda/include/" --install-option="--opencl-library=/usr/local/cuda/lib64/libOpenCL.so" #從原始碼編譯安裝,指定配置
#可選的配置有:
# boost-root
# boost-dir
# boost-include-dir
# boost-librarydir
# opencl-include-dir
# opencl-library
同樣,像 xgboost、scikit-learn 等庫,書中也作了詳盡的解釋。除此之外,還有 spark 的內容哦,可以說是非常全面了。
最後
不得不說,這本《AI 演算法工程師手冊》是一本比較完備的 AI 書籍,既包含了演算法理論,也有實戰 AI 演算法庫的使用。作為一份參考手冊還是非常不錯的!
更重要的是本書完全開源,直接線上閱讀就好了。不過注意該書籍僅供個人學習使用,非作者同意不得應用於商業領域。