《機器學習實踐應用》書中原始碼

李博Garvin發表於2017-09-28

下載地址:https://github.com/jimenbian/GarvinBook


注:本書程式碼部分參考了網際網路資源,已在書中註明引用。  
本專案程式碼嚴格遵循MIT開源協議,請大家用於參考和學習用途,謝謝。  
資料夾名對應書中章節程式碼。   

購書連結:
https://item.jd.com/12114501.html

本書簡介

《機器學習實踐應用》是人民出版社於2017年7月出版的圖書,作者李博。書中通過將機器學習演算法與實際業務場景結合,讓讀者可以快速入門並使用高深的演算法。在本書中,對整個資料探勘的流程都進行了詳細的介紹,包括資料預處理、特徵工程、機器學習與深度學習演算法、機器學習常用工具、真實案例、知識圖譜等章節。

內容簡介

機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度等多門學科,專門研究計算機怎樣模擬或實現人類的學習行為。機器學習是人工智慧的核心,是使計算機具有智慧的根本途徑。本書通過對機器學習的背景知識、演算法流程、相關工具、實踐案例以及知識圖譜等內容的講解,全面介紹了機器學習的理論基礎和實踐應用。書中涉及機器學習領域的多個典型演算法,並詳細給出了機器學習的演算法流程。本書適合任何有一定資料功底和程式設計基礎的讀者閱讀。通過閱讀本書,讀者不僅可以瞭解機器學習的理論基礎,也可以參照一些典型的應用案例擴充自己的專業技能。同時,本書也適合計算機相關專業的學生以及對人工智慧和機器學習感興趣的讀者閱讀。

章節目錄

1部分 背景知識
第1章 機器學習概述 3
1.1 背景 3
1.2 發展現狀 6
1.2.1 資料現狀 6
1.2.2 機器學習演算法現狀 8
1.3 機器學習基本概念 12
1.3.1 機器學習流程 12
1.3.2 資料來源結構 14
1.3.3 演算法分類 16
1.3.4 過擬合問題 18
1.3.5 結果評估 20
1.4 本章小結 222部分 演算法流程
第2章 場景解析 25
2.1 資料探查 25
2.2 場景抽象 27
2.3 演算法選擇 29
2.4 本章小結 313章 資料預處理 32
3.1 取樣 32
3.1.1 隨機取樣 32
3.1.2 系統取樣 34
3.1.3 分層取樣 35
3.2 歸一化 36
3.3 去除噪聲 39
3.4 資料過濾 42
3.5 本章小結 434章 特徵工程 44
4.1 特徵抽象 44
4.2 特徵重要性評估 49
4.3 特徵衍生 53
4.4 特徵降維 57
4.4.1 特徵降維的基本概念 57
4.4.2 主成分分析 59
4.5 本章小結 625章 機器學習演算法——常規演算法 63
5.1 分類演算法 63
5.1.1 K近鄰 63
5.1.2 樸素貝葉斯 68
5.1.3 邏輯迴歸 74
5.1.4 支援向量機 81
5.1.5 隨機森林 87
5.2 聚類演算法 94
5.2.1 K-means 97
5.2.2 DBSCAN 103
5.3 迴歸演算法 109
5.4 文字分析演算法 112
5.4.1 分詞演算法——Hmm 112
5.4.2 TF-IDF 118
5.4.3 LDA 122
5.5 推薦類演算法 127
5.6 關係圖演算法 133
5.6.1 標籤傳播 134
5.6.2 Dijkstra最短路徑 138
5.7 本章小結 1456章 機器學習演算法——深度學習 146
6.1 深度學習概述 146
6.1.1 深度學習的發展 147
6.1.2 深度學習演算法與傳統
演算法的比較 148
6.2 深度學習的常見結構 152
6.2.1 深度神經網路 152
6.2.2 卷積神經網路 153
6.2.3 迴圈神經網路 156
6.3 本章小結 1573部分 工具介紹
第7章 常見機器學習工具介紹 161
7.1 概述 161
7.2 單機版機器學習工具 163
7.2.1 SPSS 163
7.2.2 R語言 167
7.2.3 工具對比 172
7.3 開源分散式機器學習工具 172
7.3.1 Spark MLib 172
7.3.2 TensorFlow 179
7.4 企業級雲機器學習工具 190
7.4.1 亞馬遜AWS ML 191
7.4.2 阿里雲機器學習PAI 196
7.5 本章小結 2054部分 實戰應用
第8章 業務解決方案 209
8.1 心臟病預測 209
8.1.1 場景解析 209
8.1.2 實驗搭建 211
8.1.3 小結 216
8.2 商品推薦系統 216
8.2.1 場景解析 217
8.2.2 實驗搭建 218
8.2.3 小結 220
8.3 金融風控案例 220
8.3.1 場景解析 221
8.3.2 實驗搭建 222
8.3.3 小結 225
8.4 新聞文字分析 225
8.4.1 場景解析 225
8.4.2 實驗搭建 226
8.4.3 小結 230
8.5 農業貸款發放預測 230
8.5.1 場景解析 230
8.5.2 實驗搭建 232
8.5.3 小結 236
8.6 霧霾天氣成因分析 236
8.6.1 場景解析 237
8.6.2 實驗搭建 238
8.6.3 小結 243
8.7 圖片識別 243
8.7.1 場景解析 243
8.7.2 實驗搭建 245
8.7.3 小結 253
8.8 本章小結 2535部分 知識圖譜
第9章 知識圖譜 257
9.1 未來資料採集 257
9.2 知識圖譜的概述 259
9.3 知識圖譜開源
工具 261
9.4 本章小結 264
參考文獻 265  

相關文章