專欄推薦
正文
線性分類器是這樣的:

當大於0 的時候為正類,當小於0的時候為負類,在神經網路中我們可以使用圖來表示這樣的分類器。

我們稱這個為單層的神經網路,這個簡單的神經網路可以完成如下兩個操作:

一個是OR操作,一個是AND操作,舉例OR操作,當我們設定輸入特徵x1和x2的權重為1的時候,只要結果大於0,那麼y=1,如果小於0那麼y=0.這樣就實現了OR操作。
這兩個操作,線性分類器也可完成,所以我們可以認為單層的神經網路就是簡單的線性分類器。
那麼什麼是線性分類器無法表示的呢?

沒有任何直線可以將加號和減號區別開來,這個操作叫做邏輯異或運算,也就是線性分類器無法完成邏輯異或運算,而單層的神經網路也無法完成邏輯異或運算。

所以線性特徵就無法完成這個任務了,我們需要一些非線性的特徵z1和z2。那麼怎樣才可以得到非線性特徵呢?

總結為神經網路就是將我們的特徵進行多層的線性和非線性變換,最終變為 非線性的特徵。
深度學習在計算機視覺中的應用:
在計算機視覺裡,影像特徵就是區域性探測器,把這些探測器綜合起來就能做出預測,也就是影像識別。
假如我們要預測一張圖片是否是人臉,我們需要各種探測器來識別這個影像,比如鼻子探測器,眼睛探測器等等

其實,在實際中是沒有鼻子和嘴巴探測器的,影像特徵就是區域性興趣點的組合,組合在一起構成分類器。

以前的時候描述這些特徵是手工完成的

而深度學習方法不需要手動構建這些特徵,而是需要自動學習這些特徵,比如我們的影像輸入到三層的神經網路

你會發現神經網路的每一層都會發現這些特徵,第一層只能抓取到邊邊角角,而第三層可以抓取到人體軀幹或者珊瑚。