機器學習-特徵提取

AIBigbull2050發表於2019-09-07



現實生活當中我們往往會根據物體具有的一些特點來區分它們,比如判別不同鳶尾花品種的時候,依據的是鳶尾花的花瓣大小。像這種對事物具有某些方面的特點進行刻畫的資料或者屬性,我們稱為特徵。

在鳶尾花分類中,怎麼得到可以被人工智慧系統所使用的特徵呢?經過嘗試,人們發現花瓣的長度和寬度作為鳶尾花的特徵,可以讓分類器有效地分類。提取特徵時,直接用尺子量即可,選用這樣的特徵也符合人們根據花瓣大小來區分種類的生活經驗。

機器學習-特徵提取

特徵是在分類器乃至所有人工智慧系統中非常重要的概念。對同樣的事物,我們可以提取各種各樣的特徵。我們可以用鳶尾花植株高度或者花瓣顏色作為特徵。但是,鳶尾花的植株高度和品種沒有直接關係,一朵鳶尾花在生命的不同階段也有著不同高度:不同鳶尾花品種又都有著顏色相近的花瓣,所以用鳶尾花的植株高度和花瓣顏色很難有效區分鳶尾花的品種,我們看到,不同的特徵對於分類器的準確分類會有很大的影響。

因此,我們需要根據物體和資料本身的特點,考慮不同類別之間的差異,並在此基礎上設計出有效的特徵。而不是一件簡單的事——他往往需要我們真正理解事物特點和不同型別之間的差異。特徵的質量很大程度上決定了分類器最終分類效果的好壞。

特徵向量

透過實際的測量,我們得到了鳶尾花的特徵——花瓣的長度和寬度,那麼在數學上它們是如何表達的呢?我們可以用x來表示花瓣長度,用x₂來表示花瓣的寬度。為了方便使用,進一步把這兩個數字一起放進括號中,寫成(x₁,x₂)。這種形式的一組資料在數學中被稱為向量(vector)

機器學習-特徵提取



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2656380/,如需轉載,請註明出處,否則將追究法律責任。

相關文章