《機器學習實踐應用》書中原始碼
下載地址:https://github.com/jimenbian/GarvinBook
注:本書程式碼部分參考了網際網路資源,已在書中註明引用。
本專案程式碼嚴格遵循MIT開源協議,請大家用於參考和學習用途,謝謝。
資料夾名對應書中章節程式碼。
購書連結:
https://item.jd.com/12114501.html
本書簡介
《機器學習實踐應用》是人民出版社於2017年7月出版的圖書,作者李博。書中通過將機器學習演算法與實際業務場景結合,讓讀者可以快速入門並使用高深的演算法。在本書中,對整個資料探勘的流程都進行了詳細的介紹,包括資料預處理、特徵工程、機器學習與深度學習演算法、機器學習常用工具、真實案例、知識圖譜等章節。
內容簡介
機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度等多門學科,專門研究計算機怎樣模擬或實現人類的學習行為。機器學習是人工智慧的核心,是使計算機具有智慧的根本途徑。本書通過對機器學習的背景知識、演算法流程、相關工具、實踐案例以及知識圖譜等內容的講解,全面介紹了機器學習的理論基礎和實踐應用。書中涉及機器學習領域的多個典型演算法,並詳細給出了機器學習的演算法流程。本書適合任何有一定資料功底和程式設計基礎的讀者閱讀。通過閱讀本書,讀者不僅可以瞭解機器學習的理論基礎,也可以參照一些典型的應用案例擴充自己的專業技能。同時,本書也適合計算機相關專業的學生以及對人工智慧和機器學習感興趣的讀者閱讀。
章節目錄
第1部分 背景知識
第1章 機器學習概述 3
1.1 背景 3
1.2 發展現狀 6
1.2.1 資料現狀 6
1.2.2 機器學習演算法現狀 8
1.3 機器學習基本概念 12
1.3.1 機器學習流程 12
1.3.2 資料來源結構 14
1.3.3 演算法分類 16
1.3.4 過擬合問題 18
1.3.5 結果評估 20
1.4 本章小結 22
第2部分 演算法流程
第2章 場景解析 25
2.1 資料探查 25
2.2 場景抽象 27
2.3 演算法選擇 29
2.4 本章小結 31
第3章 資料預處理 32
3.1 取樣 32
3.1.1 隨機取樣 32
3.1.2 系統取樣 34
3.1.3 分層取樣 35
3.2 歸一化 36
3.3 去除噪聲 39
3.4 資料過濾 42
3.5 本章小結 43
第4章 特徵工程 44
4.1 特徵抽象 44
4.2 特徵重要性評估 49
4.3 特徵衍生 53
4.4 特徵降維 57
4.4.1 特徵降維的基本概念 57
4.4.2 主成分分析 59
4.5 本章小結 62
第5章 機器學習演算法——常規演算法 63
5.1 分類演算法 63
5.1.1 K近鄰 63
5.1.2 樸素貝葉斯 68
5.1.3 邏輯迴歸 74
5.1.4 支援向量機 81
5.1.5 隨機森林 87
5.2 聚類演算法 94
5.2.1 K-means 97
5.2.2 DBSCAN 103
5.3 迴歸演算法 109
5.4 文字分析演算法 112
5.4.1 分詞演算法——Hmm 112
5.4.2 TF-IDF 118
5.4.3 LDA 122
5.5 推薦類演算法 127
5.6 關係圖演算法 133
5.6.1 標籤傳播 134
5.6.2 Dijkstra最短路徑 138
5.7 本章小結 145
第6章 機器學習演算法——深度學習 146
6.1 深度學習概述 146
6.1.1 深度學習的發展 147
6.1.2 深度學習演算法與傳統
演算法的比較 148
6.2 深度學習的常見結構 152
6.2.1 深度神經網路 152
6.2.2 卷積神經網路 153
6.2.3 迴圈神經網路 156
6.3 本章小結 157
第3部分 工具介紹
第7章 常見機器學習工具介紹 161
7.1 概述 161
7.2 單機版機器學習工具 163
7.2.1 SPSS 163
7.2.2 R語言 167
7.2.3 工具對比 172
7.3 開源分散式機器學習工具 172
7.3.1 Spark MLib 172
7.3.2 TensorFlow 179
7.4 企業級雲機器學習工具 190
7.4.1 亞馬遜AWS ML 191
7.4.2 阿里雲機器學習PAI 196
7.5 本章小結 205
第4部分 實戰應用
第8章 業務解決方案 209
8.1 心臟病預測 209
8.1.1 場景解析 209
8.1.2 實驗搭建 211
8.1.3 小結 216
8.2 商品推薦系統 216
8.2.1 場景解析 217
8.2.2 實驗搭建 218
8.2.3 小結 220
8.3 金融風控案例 220
8.3.1 場景解析 221
8.3.2 實驗搭建 222
8.3.3 小結 225
8.4 新聞文字分析 225
8.4.1 場景解析 225
8.4.2 實驗搭建 226
8.4.3 小結 230
8.5 農業貸款發放預測 230
8.5.1 場景解析 230
8.5.2 實驗搭建 232
8.5.3 小結 236
8.6 霧霾天氣成因分析 236
8.6.1 場景解析 237
8.6.2 實驗搭建 238
8.6.3 小結 243
8.7 圖片識別 243
8.7.1 場景解析 243
8.7.2 實驗搭建 245
8.7.3 小結 253
8.8 本章小結 253
第5部分 知識圖譜
第9章 知識圖譜 257
9.1 未來資料採集 257
9.2 知識圖譜的概述 259
9.3 知識圖譜開源
工具 261
9.4 本章小結 264
參考文獻 265
相關文章
- 為什麼要寫《機器學習實踐應用》這本書機器學習
- 評書:《美團機器學習實踐》機器學習
- 機器學習在高德起點抓路中的應用實踐機器學習
- C# Span 原始碼解讀和應用實踐C#原始碼
- 探索機器學習:從基礎概念到應用實踐機器學習
- 每週一書《Python機器學習實踐指南 附隨書程式碼》分享!Python機器學習
- [Vue CLI 3] 多頁應用實踐和原始碼設計Vue原始碼
- 《機器學習實戰》中英文電子書 + 原始碼下載機器學習原始碼
- 混合應用中的javascript實踐JavaScript
- Lua 指令碼在 Redis 事務中的應用實踐指令碼Redis
- Lua指令碼在Redis事務中的應用實踐指令碼Redis
- vivo前端智慧化實踐:機器學習在自動網頁佈局中的應用前端機器學習網頁
- 機器學習實踐中應避免的7種常見錯誤機器學習
- 《機器學習實戰》pdf書籍&書本原始碼詳細解析&書本資料集下載機器學習原始碼
- 策略模式在應用中的實踐模式
- SAP高階應用開發一書原始碼包原始碼
- redux 原始碼解析與實際應用Redux原始碼
- 華為:AR洞察及應用實踐白皮書(附下載)
- [原始碼解析]機器學習引數伺服器ps-lite(4) ----- 應用節點實現原始碼機器學習伺服器
- GroovyShell 應用實踐
- RxJava在安卓開發中應用原始碼RxJava安卓原始碼
- 人肉工程在機器學習實踐中的作用機器學習
- AI大模型+低程式碼,在專案管理中的應用實踐AI大模型專案管理
- 監督式機器學習演算法的應用:擇時【附原始碼】機器學習演算法原始碼
- 《業務安全白皮書》:頂象防禦雲的應用實踐
- Zoho推出《中國ToB超級應用探索與實踐白皮書》
- 《大資料:技術與應用實踐指南》圖書資訊大資料
- 機器學習實踐指南機器學習
- Zebra 條碼印表機應用開發實踐
- 在物聯網中應用機器學習機器學習
- 機器學習與微博:TensorFlow在微博的大規模應用與實踐機器學習
- co原始碼分析及其實踐原始碼
- Optional原始碼解析與實踐原始碼
- Function原始碼解析與實踐Function原始碼
- TiDB應用實踐TiDB
- Oracle Audit 應用實踐Oracle
- 機器學習實戰 | SKLearn最全應用指南機器學習
- Vuex 原始碼解析(如何閱讀原始碼實踐篇)Vue原始碼