如何假裝你懂機器學習?

Morven.Huang發表於2023-05-09

AI梗圖,早期的“AI”,是大量手寫的規則(hand crafted rules),而眼下我們討論AI,通常是在討論機器學習,在理清機器學習領域的諸多概念之前,我們先來白話一下機器學習的本質。

機器學習的本質是:尋找一個函式。

機器學習的本質是:尋找一個函式。

機器學習的本質是:尋找一個函式。

(重要的事情說三遍)

 

0函式

函式是什麼就不解釋了,我2歲的表弟都知道。

我們可以使用一個線性函式(例如:f(x)=a*x+b)來解決一個簡單的問題,這就是我們常聽到的“線性迴歸”。

我們也不一定使用線性函式,因為世界規律不一定是線性的,例如,我們可以使用Logistic函式,這就是我們常聽到的“邏輯迴歸”。

我們還可以把線性函式替換成Sigmoid函式、ReLU函式,並且把一批此類函式組合在一起,這就是我們常聽到的“神經網路”。

我們還可以把更多的神經網路疊成不同的層,上一層的輸出作為下一層的輸入,這就是我們常聽到的“深度神經網路”。(你耳熟能詳的GPT,也屬於深度神經網路)

如果你覺得神經網路、深度神經網路概念還是有點複雜,那麼在宏觀上,你也可以把他們整體看成是一個“大函式”,一個可以擁有億萬個引數的函式。

以上,實際上是從模型層面對機器學習進行歸類。

 

02 “尋找”

這個尋找,就是確定引數值的數學過程(例如:確定f(x)=a*x+b中的a和b的值),用fancy的詞來說,就叫做“學習”,或者也可以叫做“訓練”,它們基本上是一個意思。

確定引數值的過程中使用的資料,就叫做“訓練資料”,訓練資料通常包含成對的函式輸入值x,和函式輸出值f(x),函式輸出值我們也稱為“標籤”或“Label”,使用帶標籤的資料進行訓練的過程,就叫“監督學習”。

使用一部分帶標籤的資料和一部分不帶標籤的資料進行訓練,這就是我們常聽到的“半監督學習”。

完全使用不帶標籤的資料進行訓練,這就是我們常聽到的“無監督學習”。

以上,實際上是從訓練層面對機器學習進行歸類。

 

03 其他

當然,我們還可以從任務層面對機器學習進行分類,將其分為Regression, Classification, Structured Learning,這個太簡單,不贅述了。

 

下面是我整理的思維導圖,hope u find it informative!

 

相關文章