《機器學習初步》筆記

iciy道格發表於2024-10-07

第一章 緒論

1.1 引言

機器學習的經典定義:利用經驗(資料)改善系統自身的效能

經典的機器學習過程:

機器學習最重要的理論模型:PAC(概覽近似正確)

1.2 基本術語

資料集:一組記錄的集合

學習/訓練:透過執行某個學習演算法,得到模型,學的的模型對應資料的某種潛在規律

示例:不包含結果(標記label) , 樣例:包含結果(標記label)

樣本 , 屬性(eg.色澤) , 屬性值

屬性空間、樣本空間、輸入空間:

學習器:模型

分類:離散的輸出(是or否) ,迴歸:連續的輸出(0->1)

二分類(正類,負類<可交換>),多分類

無監督學習:不知道結果(任務:密度統計) , 監督學習:知道結果(任務:分類,迴歸)

1.3 假設空間

學習過程:在所有假設組成的空間中進行搜尋的過程(目標:找到與訓練集匹配的假設)

版本空間:與訓練集一致的假設集合

1.4 歸納偏好

有效的機器學習必有其偏好

學習演算法的歸納偏好是否與問題本身匹配,決定了演算法的效能

1.5 NFL定理

一個演算法a若在某些問題上比另一個演算法b好,必存在另一些問題b比a好

具體問題,具體分析

相關文章