如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

AIBigbull2050發表於2019-09-11
2019-09-09 21:46:16

專欄推薦

(此處已新增圈子卡片,請到今日頭條客戶端檢視)

正文

線性分類器是這樣的:

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

當大於0 的時候為正類,當小於0的時候為負類,在神經網路中我們可以使用圖來表示這樣的分類器。

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

我們稱這個為單層的神經網路,這個簡單的神經網路可以完成如下兩個操作:

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

一個是OR操作,一個是AND操作,舉例OR操作,當我們設定輸入特徵x1和x2的權重為1的時候,只要結果大於0,那麼y=1,如果小於0那麼y=0.這樣就實現了OR操作。

這兩個操作,線性分類器也可完成,所以我們可以認為單層的神經網路就是簡單的線性分類器。

那麼什麼是線性分類器無法表示的呢?

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

沒有任何直線可以將加號和減號區別開來,這個操作叫做邏輯異或運算,也就是線性分類器無法完成邏輯異或運算,而單層的神經網路也無法完成邏輯異或運算。

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

所以線性特徵就無法完成這個任務了,我們需要一些非線性的特徵z1和z2。那麼怎樣才可以得到非線性特徵呢?

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

總結為神經網路就是將我們的特徵進行多層的線性和非線性變換,最終變為 非線性的特徵。

深度學習在計算機視覺中的應用:

在計算機視覺裡,影像特徵就是區域性探測器,把這些探測器綜合起來就能做出預測,也就是影像識別。

假如我們要預測一張圖片是否是人臉,我們需要各種探測器來識別這個影像,比如鼻子探測器,眼睛探測器等等

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

其實,在實際中是沒有鼻子和嘴巴探測器的,影像特徵就是區域性興趣點的組合,組合在一起構成分類器。

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

以前的時候描述這些特徵是手工完成的

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

而深度學習方法不需要手動構建這些特徵,而是需要自動學習這些特徵,比如我們的影像輸入到三層的神經網路

如何理解神經網路空間,深度學習在計算機視覺中的應用有哪些?

你會發現神經網路的每一層都會發現這些特徵,第一層只能抓取到邊邊角角,而第三層可以抓取到人體軀幹或者珊瑚。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2656697/,如需轉載,請註明出處,否則將追究法律責任。

相關文章