自然語言處理(nlp)比計算機視覺(cv)發展緩慢,而且更難!

dicksonjyl560101發表於2018-11-05

1 .    搶跑的nlp

 

nlp發展的歷史非常早,因為人從計算機發明開始,就有對語言處理的需求。各種字串演算法都貫穿於計算機的發展歷史中。偉大的喬姆斯基提出了生成文法,人類擁有的處理語言的最基本框架,自動機(正規表示式),隨機上下文無關分析樹,字串匹配演算法KMP,動態規劃。

 

nlp任務裡如文字分類,成熟的非常早,如垃圾郵件分類等,用樸素貝葉斯就能有不錯的效果。20年前通過純統計和規則都可以做機器翻譯了。相比,在cv領域,那時候mnist分類還沒搞好呢。

 

90年代,資訊檢索的發展提出BM25等一系列文字匹配演算法,Google等搜尋引擎的發展將nlp推向了高峰。相比CV領域暗淡的一些。

2 .    特徵抽取困難的cv

 

cv的前身就有一個領域叫影像處理,研究圖片的壓縮、濾波、邊緣提取,天天擺弄著一個叫lenna的美女。

 

早期的計算機視覺領域受困於特徵提取的困難,無論是HOG還是各種手工特徵提取,都沒辦法取得非常好的效果。

 

大規模商業化應用比較困難。而同期nlp裡手工特徵➕svm已經搞的風生水起了。

 

3 .    深度學習的崛起- 自動特徵提取

 

近些年,非常火爆的深度學習模型簡單可以概括為:

深度學習 = 特徵提取器➕分類器

一下子解決cv難於手工提取特徵的難題,所以給cv帶來了爆發性的進展。深度學習的思路就是讓模型自動從資料中學習特徵提取,從而生成了很多人工很難提取的特徵:

 

 

4 .    nlp的知識困境

 

不是說nlp在這波深度學習浪潮下沒有進展,而是說突破並沒有cv那麼巨大。很多文字分類任務,你用一個巨複雜的雙向LTSM的效果,不見得比好好做手工feature + svm好多少,而svm速度快、小巧、不需要大量資料、不需要gpu,很多場景真不見得深度學習的模型就比svm、gbdt等傳統模型就好用。

 

而nlp更大的難題在於知識困境。不同於cv的感知智慧,nlp是認知智慧,認知就必然涉及到知識的問題,而知識卻又是最離散最難於表示的。


轉自: https://mp.weixin.qq.com/s/kWw0xce4kdCx62AflY6AzQ


 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2218686/,如需轉載,請註明出處,否則將追究法律責任。

相關文章