每週一書《大資料時代的演算法:機器學習、人工智慧及其典型例項 》分享!
《大資料時代的演算法:機器學習、人工智慧及其典型例項》介紹在網際網路行業中經常涉及的演算法,包括排序演算法、查詢演算法、資源分配演算法、路徑分析演算法、相似度分析演算法,以及與機器學習相關的演算法,包括資料分類演算法、聚類演算法、預測與估算演算法、決策演算法、關聯規則分析演算法及推薦演算法。《大資料時代的演算法:機器學習、人工智慧及其典型例項》涉及的相關演算法均為解決實際問題中的主流演算法,對於工作和學習都有實際參考意義。《大資料時代的演算法:機器學習、人工智慧及其典型例項》是一本演算法領域內的技術參考書籍,涵蓋數十種演算法,通過由淺入深的介紹基礎演算法和機器學習演算法相關理論和應用,闡述了各個演算法的應用場景及演算法複雜度,使讀者對演算法的理解不只是停留在表面,還從應用的角度提供了大量例項,使讀者能夠快速、高效進階各類演算法,並能夠熟練應用到將來的工作實踐中。
目錄:
第1章演算法基礎...................................1
I.I 基礎演算法分析型別………..…………. I
1.1.l 分治法................................. I
1.1.2 動態規劃法......................... 2
1.1.3 回溯法................................. 3
1.1.4 分支限界法…...……………….4
l.1.5 貪心法................................. 4
1.2 演算法效能分析….......……………….5
1.3 概率論與數理統計基礎………..….6
1.4 距離計算......................................... 8
1.4.1 歐氏距離............................. 8
1.4.2 馬氏距離............................. 9
1.4.3 曼哈頓距離......................... 9
1.4.4 切比雪夫距離....…………….. 9
1.4.5 閔氏距離............................. 9
1.4.6 海明距離........................... 10
1.5 排序演算法....................................... 10
1.5.1 快速排序........................... 11
1.5.2 歸併排序........................... 11
1.5.3 堆排序............................... 13
l.5.4 基數排序........................... 15
1.5.5 外排序............................... 16
1.6 字元壓縮編碼............................... 17
1.6.1 哈夫曼編碼....................... 17
1.6.2 夏農-範諾編碼…...…….21
1.7 本章小結....................................... 24
第2章資料查詢與資源分配演算法…....25
2.1 數值查詢演算法.....…..…..…......... 25
2.1.1 二分搜尋演算法···········25
2.1.2 分塊查詢演算法…………….. 27
2.1.3 雜湊查詢演算法...………...… 28
2.2 字串查詢演算法…...…...……....….. 30
2.2.1 Knuth-Morris-Pratt 演算法... 31
2.2.2 Boyer-Moore 演算法…….34
2.2.3 Sunday 演算法······················37
2.3 海址資料中的查詢………...…….... 39
2.3.1 基於布隆過濾器查詢…... 39
2.3.2 倒排索弓I查詢..............….. 41
2.4 銀行家演算法................................... 43
2.5 揹包問題······································· 44
2.5.1 0-1揹包問題.................... 45
2.5.2 部分揹包問題………………. 46
2.6 本章小結....................................... 47
第3章路徑分析演算法......……....…...... 49
3.1 基千Dijkstra演算法的路徑分析............49
3.1.1 應用示例:極地探險....... 49
3.1.2 基於Dijkstra的最短路徑規劃............... 50
3.2 基千Floyd演算法的路徑分析…..... 53
3.2. 1 應用示例:任意兩個城
市之間的最短路徑............……... 53
3.2.2 Floyd原理........................ 54
3.2.3 基於Floyd演算法計算兩
個城市最短距離……....….. 56
3.3 基於A*演算法的路徑搜尋……...... 58
3.3.1 應用例項:繞過障礙區
到達目的地....................... 58
3.3.2 A*演算法與最短距離計算… 59
3.4 基於維特比演算法的概率路徑...... 61
3.4.1 應用例項:推斷天氣狀態... 61
3.4.2 維特比演算法思想……… 62
3.4.3 計算天氣狀態..... 62
3.5 最長公共子序列問題…………….. 64
3.5.1 概要................................... 64
3.5.2 最長公共子串………...…… 64
3.5.3 最長公共子序列原理…... 66
3.5.4 例項:求兩宇符串的最
長公共子序列……..…...….. 66
3.6 本章小結·······································68
第4章相似度分析演算法…..........69
4.1 應用例項:海量網頁相似度分析............ 69
4.2 基千Jaccard相似係數的相似
度計算........................................... 70
4.2.1 計算流程........................... 70
4.2.2 狹義Jaccard相似係數..... 71
4.2.3 廣義Jaccard相似係數..... 71
4.3 基於MinHash的相似性符法….. 71
4.3.l 與Jaccard相似性關係..... 71
4.3.2 計算網頁文字相似性過程............ 72
4.4 向撮空間模型............................... 73
4.4. l 詞袋模型....................73
4.4.2 TF-IDF演算法…..…...…....….74
4.5 基千餘弦相似性演算法的相似度
分析············································76
4.5.1 原理基礎........................... 76
4.5.2 公式解析························… 77
4.5.3 計算網頁文字相似性過程... 77
4.6 基千語義主題模型的相似度
演算法............................................... 78
4.7 基於SimHash演算法的指紋碼....... 80
4.7.1 SimHash弓l入..............….. 81
4.7.2 SimH ash的計算流程…….81
4.7.3 計算重複資訊…….....….. 83
4.8 相似度演算法的差異性………..….84
4.9 本章小結........................ 85
第5章資料分類演算法………………..….86
5.1 基於樸素貝葉斯分類器………..... 86
5.1.1 有監督分類與無監督
分類................................... 87
5.1.2 應用例項:識別車釐子
與櫻桃............................... 88
5.1.3 分類流程歸納................... 91
5.1.4 應用擴充套件:垃圾郵件
識別···································92
5.1.5 常用評價指標................... 96
5.2 基千AdaBoost分類器…………... 100
5.2.1 AdaBoost概述………….. 100
5.2.2 AdaBoost演算法具體流程...........101
5.2.3 AdaBoost演算法的應用
例項................................. 102
5 .2.4 AdaBoost演算法的優點…. 105
5.3 基千支援向扯機的分類器……… 105
5.3.1 線性可分與線性不可分.. 106
5.3.2 感知器·····························107
5.3.3 支援向量機………......…... 108
5.4 基於K鄰近演算法的分類器…..... 109
5.4.1 應用例項:電影觀眾
興趣發現·························109
5.4.2 核心思想......................... 109
5.4.3 電影觀眾興趣發現…….. 110
5.5 本章小結..................................... 1 I 3
第6章資料聚類演算法…………....…. 115
6.1 基於系統聚類法…...………………. 115
6.1.1 概述................................. 116
6.1.2 最短距離法..................... 117
6.1.3 重心聚類法..................... 119
6.1.4 動態聚類法.................... 120
6.2 基千K-Means聚類演算法…..….. 122
6.2.l 應用例項:新聞聚類...............…. 122
6.2.2 邏輯流程......................... 123
6.2.3 實現新聞聚類分析.....…124
6.2.4 K-Means++ ·················]28
6.2.5 K-中心點聚類演算法....................…129
6.2.6 ISODATA聚類演算法……. 130
6.3 基於密度的DBSCAN演算法....... 131
6.4 基於BIRCH演算法的聚類分析... 133
6.4.1 聚類特徵......................... 133
6.4.2 聚類特徵樹…...………... 134
6.5 聚類與分類差異……....……….. 135
6.6 本章小結..................................... 136
第7章資料預測與估算演算法……….... 137
7.1 產生式模型與判別式模型…..... 137
7.2 基於最大似然估計的預測……... 138
7.3 基千線性迴歸的估算……………. 140
7.3.1 概要................................. 140
7.3.2 最4、二乘法..................... 141
7.4 基千最大期望演算法分析....…..… 143
7.5 基於隱馬爾科夫模型預測.....… 144
7.5.J 應用例項:高溫天氣與
行為概率......................... 144
7.5.2 原理分析......................... 145
7.5.3 高溫天氣與行為概率….. 147
7.6 基於條件隨機場的序列預測….. 151
7.6.1 應用例項......................... 151
7.6.2 原理分析…................ 15 I
7.6.3 條件隨機場的優缺點….. 153
7.7 本章小結·····································154
第8章資料決策分析演算法……..…….. 155
8.1 基千ID3演算法的決策分析....….. 156
8.1.1 資訊量............................. 156
8.1.2 資訊嫡............................. 156
8.1.3 資訊增益......................... 157
8.1.4 ID3演算法流程…....…........ 157
8.1.5 ID3演算法的應用………….. 157
8.2 基千C4.5演算法的分類決策樹.. 159
8.2.1 概要................................. 159
8.2.2 應用例項......................... 159
8.3 基於分類迴歸樹的決策劃分… 161
8.3.l 概要................................. 162
8.3.2 應用例項: 決策劃分..... 163
8.3.3 剪枝................................. 164
8.4 基於隨機森林的決策分類.…... 168
8.4.1 隨機森林的特點……..….. 169
8.4.2 隨機森林的構造方法.…. 169
8.4.3 應用例項: 決定車釐子
的售價層次………………… 170
8.5 本章小結..................................... 172
第9章資料關聯規則分析演算法…...... 174
9.1 基千Apriori演算法的關聯項
分析............................................. 174
9.1.1 應用例項:超市的貨架
擺放問題......................... 175
9.1.2 基本概要......................... 175
9.1.3 演算法原理·························176
9.1.4 有效擺放貨架……………. 176
9.2 基於FP-Growth演算法的關聯性
分析............................................. 179
9.2.1 構建FP樹....................... 179
9.2.2 頻繁項分析......………….. 181
9.2.3 與Apripri演算法比較…. 184
9.3 基於Eclat演算法的頻繁項集
挖掘............................................. 184
9.4 本章小結..................................... 185
第10章資料推薦演算法……………..….. 187
10.1 概要........................................... 187
10.1.1 推薦演算法發展…………... 188
10.1.2 協同過泥推薦…...… ·…. 189
10.2 基於Item-Based協同過濾推薦········190
I 0.2.1 Item-Based基本思想.… 190
I 0.2.2 Slope One例項:基於評分推薦······190
10.3 基千User-Based協同過濾推薦........ 193
10.3.1 應用例項:根據人群的推薦............. 194
10.3.2 User-Based與Item-Based對比..... 197
10.4 基於潛在因子演算法的推薦... 198
I 0.4. l 應用例項:新聞推薦... 198
10.4.2 流行度與推薦….....…… 200
10.5 推薦演算法與效果評價…..……….201
10.6 本章小結···································203
如果想得到下載地址,請訪問中科院計算所培訓中心官網 http://www.tcict.cn/ 新增官網上的客服微信索取!
相關文章
- 每週一書:290頁《機器學習導論》分享!機器學習
- 每週一書《Spark與Hadoop大資料分析》分享!SparkHadoop大資料
- 每週一書《Python機器學習實踐指南 附隨書程式碼》分享!Python機器學習
- 每週一書《Python資料科學手冊》分享!Python資料科學
- 機器學習一週心得分享機器學習
- 每週一書:162頁《笨辦法學 Python》分享!Python
- 例項複習機器學習數學 - 2. 幾種典型離散隨機變數分佈機器學習隨機變數
- 大資料 機器學習 演算法概論大資料機器學習演算法
- 機器學習 大資料機器學習大資料
- 每週一書:400頁《Python資料處理》分享!資料處理領域真正需要的一本書!Python
- 大資料時代,從零學習資料思維大資料
- 2018年大資料,機器學習和人工智慧預測!大資料機器學習人工智慧
- 入選《時代》的科學牛人,人工智慧和機器學習最權威的學者之一人工智慧機器學習
- 大資料時代,再不學習就OUT了大資料
- 51微控制器學習資料書籍分享
- 分享學習大資料的方法大資料
- 人工智慧-機器學習-深度學習-電子書大全人工智慧機器學習深度學習
- [轉載] Python 機器學習經典例項Python機器學習
- [機器學習]協同過濾演算法的原理和基於Spark 例項機器學習演算法Spark
- 每週一書《系統架構設計師》分享!架構
- 資料科學系統學習 機器學習演算法 # 西瓜書學習記錄 [12] 整合學習實踐資料科學機器學習演算法
- 誰說.NET不適合搞大資料,機器學習、人工智慧大資料機器學習人工智慧
- 大資料24小時:微軟開發新型機器學習演算法,立思辰成立“人工智慧+教育”產業加速器大資料微軟機器學習演算法人工智慧產業
- 機器學習 10大演算法機器學習演算法
- 大資料學習注意事項大資料
- 大資料如何學習,大資料工程師學習經驗分享大資料工程師
- 大資料、人工智慧、機器學習與深度學習都是什麼?有什麼關係?大資料人工智慧機器學習深度學習
- 機器學習演算法公式的書寫規範機器學習演算法公式
- 大資料學習的必要性,讓你走向時代前沿!大資料
- 談談人工智慧和機器學習的資料架構人工智慧機器學習架構
- 每週一練 之 資料結構與演算法(Stack)資料結構演算法
- 每週一練 之 資料結構與演算法(Tree)資料結構演算法
- 每週一練 之 資料結構與演算法(Set)資料結構演算法
- 每週一練 之 資料結構與演算法(Queue)資料結構演算法
- 每週一練 之 資料結構與演算法(LinkedList)資料結構演算法
- 知物由學 | 機器學習在資訊保安領域的五大典型應用機器學習
- [譯] 資料科學領域十大必知機器學習演算法資料科學機器學習演算法
- Spotify 每週推薦功能:基於機器學習的音樂推薦機器學習