機器學習個人筆記(三)之無監督學習

快樂小隆發表於2020-10-27

前言:
該系列文章主要用於記錄自己學習機器學習的過程,目的是為了鞭策自己和激勵自己
我是跟著網易雲課堂的吳恩達機器學習來學的,所以筆記也基本上是視訊學習記錄

定義

宣告:本定義僅為個人理解,並非是官方專業定義
無監督學習即,讓機器通過某種演算法,自動的從一堆資料集裡區分開來不同屬性的資料,然後當機器具有區分類別的能力之後,再給他一個他沒見過的樣本,讓他用他的能力來識別這個樣本屬於哪一類。

舉例

這部分會給出幾個例子來幫助理解什麼是無監督學習。吳恩達的課程裡沒有貓狗問題的舉例,這個是我覺得比較好理解的,所以把這個問題也加進來了

舉例一、貓狗區分問題

給電腦一堆貓狗的照片,讓他能區分開來這兩類,“區分”在這裡的含義僅僅是電腦能知道有A、B兩類照片,但不知道A類照片代表貓,B類照片代表狗。然後電腦有這個“區分”能力之後,再給他一張貓或者狗的照片,讓他識別出來這個照片是屬於A類還是B類。
在這個問題中電腦並不知道某張照片的正確答案是什麼,它只知道這些照片能分成不同的組,在電腦執行一段時間後,他才知道這些照片能分成兩組。這就是無監督學習,即沒有標準答案的學習

舉例二、基因序列表達

給你一組基因序列,這些基因序列可能某一個或某幾個地方共同影響人的一個性狀。但是目前人類不知道有哪些性狀,以及哪些基因序列會影響某些特定的性狀,這時就要設計一個“聚類演算法”,把表達出不同性狀的一個或者一些基因聚成類。
在這個問題中,不僅電腦不知道正確答案,甚至人類都不知道正確答案是什麼,最後的結果能分成幾組(至少在貓狗問題中,我們還可以預料到最後的結果是兩組)。雖然電腦不知道最後會分成幾組,但它也會根據你給他設計的聚類演算法,把這些基因分成特定的一些組別。這也是無監督學習。

相關文章