機器學習——監督學習&無監督學習

yucheng1998發表於2019-07-24

機器學習定義

  • Tom Mitchell給出了一個更現代的定義:“據說,一個計算機程式從經驗E中學習某些型別的任務T和效能度量P,如果它在任務T中的效能(用P度量)隨著經驗E的提高而提高的話。”
  • 經驗E:程式成千上萬次的練習得到的經驗
  • 任務T:計算機訓練時所做的任務
  • 效能度量P:計算機訓練完成後做下一次任務完成的概率 例如:玩跳棋。 E =下棋的經驗 T =下跳棋的任務。 P =程式贏得下一場比賽的概率。

簡單說,監督學習這個想法是指,我們將教計算機如何去完成任務,而在無監督學習中,我們打算讓它自己進行學習。

監督學習

  • 在監督學習中,我們得到一個資料集,並且已經知道我們的正確輸出應該是什麼樣的,知道輸入和輸出之間存在關係。
  • 其基本思想是,監督學習中,對於資料集中的每個資料, 都有相應的正確答案,(訓練集) 演算法就是基於這些來做出預測。

監督學習問題分為“迴歸”問題和“分類”問題。在迴歸問題中,我們試圖預測連續輸出中的結果,這意味著我們試圖將輸入變數對映到某個連續函式。在分類問題中,我們試圖預測離散輸出的結果。換句話說,我們試圖將輸入變數對映到離散類別中。

  1. 分類問題。 分類是要預測一個離散值輸出。 (0或1)
  2. 迴歸問題。 即通過迴歸來預測一個連續值輸出

示例1: 根據房地產市場上房屋大小的資料,試著預測它們的價格。價格作為規模的函式是一個連續的輸出,所以這是一個迴歸問題。 我們可以把這個例子變成一個分類問題,我們可以輸出房子的“售價是高於還是低於要價”。這裡我們根據房價將房屋分為兩類。 示例2: (a)迴歸- -給定一張人的照片,我們必須根據給定的照片預測他們的年齡 (b)分類-給定一個腫瘤患者,我們必須預測腫瘤是惡性還是良性。

無監督學習

無監督學習,我們沒有提前告知這個演算法,這些是第一類,這些是第二類,這些是第三類等等,相反我們只是告訴演算法,你看。這兒有一堆資料,我不知道這個資料是什麼東東,我不知道里面都有些什麼型別,叫什麼名字,我甚至不知道都有哪些型別,但是,請問你可以自動的找到這些資料中的型別嗎?然後自動的 按得到的型別把這些個體分類,雖然事先我並不知道哪些型別,因為對於這些資料樣本來說,我們沒有給演算法一個,正確答案,所以,這就是無監督學習。

  • 無監督學習使我們能夠在幾乎不知道或根本不知道結果應該是什麼樣子的情況下解決問題。我們可以從不需要知道變數影響的資料中得到結構。
  • 我們可以根據資料中變數之間的關係對資料進行聚類,從而得到這種結構。
  • 在無監督學習中,沒有基於預測結果的反饋。

例子: 聚類:收集100萬個不同的基因,並找到一種方法自動將這些基因分組,這些基因在某種程度上與不同的變數(如壽命、位置、角色等)相似或相關。 非聚類:“雞尾酒會演算法”,允許您在混亂的環境中找到結構。(例如,在雞尾酒會上從一堆聲音中辨別出個人的聲音和音樂)。

相關文章