機器學習基本概念

FreeeLinux發表於2017-11-15

1.基本概念

訓練集、測試集、特徵值、監督式學習、非監督學習、半監督學習、分類、迴歸

2.概念學習

概念學習是指從某個布林函式的輸入輸出訓練樣例中推斷出該布林函式。

3.
樣例 天氣 溫度 溼度 風力 水溫 預報 享受運動
1 晴 暖 普通 強 暖 一樣 是
2 晴 暖 大 強 暖 一樣 是
3 雨 冷 大 強 暖 變化 否
4 晴 暖 大 強 冷 變化 是

 天氣:晴,陰,雨
 溫度:暖,冷
 溼度:普通,大
 風力:強,弱
 水溫:暖,冷
 預報:一樣,變化

 享受運動:是,否

 概念定義在例項(instance)集合之上,這個集合表示為X。(X:所有可能的日子,每個日子的值由 天氣,溫度,溼度,風力,水溫,預          報6個屬性表示。
 待學習的概念或目標函式成為目標概念(target concept), 記做c。
 c(x) = 1, 當享受運動時, c(x) = 0 當不享受運動時,c(x)也可叫做y
 x: 每一個例項
 X: 樣例, 所有例項的集合
 學習目標:f: X -> Y

4.訓練集(training set/data)/訓練樣例(training examples):用來進行訓練,也就是產生模型或者演算法的資料集
測試集(testing set/data)測試樣例(testing examples):用來專門進行測試已經學習好的模型或者演算法的資料集
特徵向量(features/feature vector):屬性的集合,通常用一個向量來表示,附屬於一個例項
標記(label):c(x),例項類別的標記
正例(positive example)
反例(negative example)

5.分類(classfication):目標標記為類別性資料(category)
迴歸(regression):目標標記為連續性數值(continuous numeric value)

6.有監督學習(supervised learning):訓練集有類別標記(class label)
無監督學習(unsupervised leadning):無類別標記(class label)
半監督學習(semi-supervised-learning):訓練集有一部分有label,有一部分沒有label

相關文章