CNN之於CV和NLP
自然語言處理是對一維訊號(詞序列)做操作,計算機視覺是對二維(影象)或三維(視訊流)訊號做操作。不同:自然語言處理的輸入資料通常是離散取值(例如表示一個單詞或字母通常表示為詞典中的one hot向量),計算機視覺則是連續取值(比如歸一化到0,1之間的灰度值)。
為什麼CNN用在CV上更得心應手,卻不一定適合NLP?要看清這點就要理解CNN的原理。CNN有兩個主要特點,區域不變性(location invariance)和組合性(Compositionality)。
1. 區域不變性:濾波器在每層的輸入向量(影象)上滑動,檢測的是區域性資訊,然後通過pooling取最大值或均值。pooling這步綜合了區域性特徵,失去了每個特徵的位置資訊。這很適合基於影象的任務,比如要判斷一幅圖裡有沒有貓這種生物,你可能不會去關心這隻貓出現在影象的哪個區域。但是在NLP裡,詞語在句子或是段落裡出現的位置,順序,都是很重要的資訊。
2. 區域性組合性:CNN中,每個濾波器都把較低層的區域性特徵組合生成較高層的更全域性化的特徵。這在CV裡很好理解,畫素組合成邊緣,邊緣生成形狀,最後把各種形狀組合起來得到複雜的物體表達。在語言裡,當然也有類似的組合關係,但是遠不如影象來的直接。而且在影象裡,相鄰畫素必須是相關的,相鄰的詞語卻未必相關。
當然,還有些技術細節,CNN具體應用在CV和NLP上會有些不同,就不贅述了。比如,濾波器的大小,在CV裡濾波器一般覆蓋一個區域性的小區域,NLP會覆蓋整個詞彙向量的寬度,等等。。。那為什麼最近很多專案把CNN用在NLP上取得了很好的結果?很多時候,理論上嚴格正確的模型在實際上不一定比理論不完整的模型更好用。
---------------------
作者:BlackEyes_SGC
原文:https://blog.csdn.net/u011204487/article/details/76944398
相關文章
- 八年之癢!除了NLP和CV,人工智慧就不能幹點別的啥了?人工智慧
- NLP-使用CNN進行文字分類CNN文字分類
- CV之後,純MLP架構又來搞NLP了,效能媲美預訓練大模型架構大模型
- CV+NLP,使用tf.Keras構建影像搜尋引擎Keras
- CNN也能用於NLP任務,一文簡述文字分類任務的7個模型CNN文字分類模型
- 深度學習與CV教程(10) | 輕量化CNN架構 (SqueezeNet,ShuffleNet,MobileNet等)深度學習CNN架構
- 消除NLP中的刻板印象:程式設計師之於男性=家政人員之於女性?程式設計師
- 比CNN表現更好,CV領域全新卷積操作OctConv厲害在哪裡?CNN卷積
- 對比學習(Contrastive Learning)在CV與NLP領域中的研究進展AST
- OpenCV(cv::Point、cv::Rect、cv::Mat)OpenCV
- 深度學習與CV教程(12) | 目標檢測 (兩階段,R-CNN系列)深度學習CNN
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(1.13-1.19)iOS
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(1.5-1.12)iOS
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(3.1-3.7)iOS
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(2.9-2.15)iOS
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(3.15-3.21)iOS
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(2.16-2.22)iOS
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(3.8-3.14)iOS
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(2.3-2.9)iOS
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(3.22-3.28)iOS
- ArXiv Weekly Radiostation:本週NLP、CV、ML精選論文30篇(12.29-1.4)iOS
- CV總結之邊緣檢測
- CNN,GAN,AE和VAE概述CNN
- CNN,RNN 和DNN是什麼CNNRNNDNN
- 自然語言處理(nlp)比計算機視覺(cv)發展緩慢,而且更難!自然語言處理計算機視覺
- 經典目標檢測方法Faster R-CNN和Mask R-CNN|基於PaddlePaddle深度學習平臺的實戰ASTCNN深度學習
- CNN神經網路之卷積操作CNN神經網路卷積
- NLP:Gensim庫之word2vec
- 煩死人的“cv2.cv2”
- Python-OpenCV:cv2.imread(),cv2.imshow(),cv2.imwrite()PythonOpenCV
- 7.72 CV
- 基於PaddlePaddle的官方NLP模型總覽模型
- (一)文字分類經典模型之CNN篇文字分類模型CNN
- 微軟內部研究資料集正式對外開放,覆蓋NLP、CV等9個領域微軟
- nlp基礎之詞、子詞或字元字元
- 基於CNN的新詞發現演算法CNN演算法
- CV待研究
- cv::fitLine用法