第一章 緒論
1.1 引言
機器學習的經典定義:利用經驗(資料)改善系統自身的效能
經典的機器學習過程:
機器學習最重要的理論模型:PAC(概覽近似正確)
1.2 基本術語
資料集:一組記錄的集合
學習/訓練:透過執行某個學習演算法,得到模型,學的的模型對應資料的某種潛在規律
示例:不包含結果(標記label) , 樣例:包含結果(標記label)
樣本 , 屬性(eg.色澤) , 屬性值
屬性空間、樣本空間、輸入空間:
學習器:模型
分類:離散的輸出(是or否) ,迴歸:連續的輸出(0->1)
二分類(正類,負類<可交換>),多分類
無監督學習:不知道結果(任務:密度統計) , 監督學習:知道結果(任務:分類,迴歸)
1.3 假設空間
學習過程:在所有假設組成的空間中進行搜尋的過程(目標:找到與訓練集匹配的假設)
版本空間:與訓練集一致的假設集合
1.4 歸納偏好
有效的機器學習必有其偏好
學習演算法的歸納偏好是否與問題本身匹配,決定了演算法的效能
1.5 NFL定理
一個演算法a若在某些問題上比另一個演算法b好,必存在另一些問題b比a好
具體問題,具體分析