學習了哪些知識,計算機視覺才算入門?

dicksonjyl560101發表於2020-02-29

作者:言有三
連結:
來源:知乎
著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。
 

從兩個方向來回答這個問題,第一個是從零開始怎麼系統性入門計算機視覺,這是一個路線問題。第二個是如何系統性學習,涉及到計算機視覺的各個方向。

第一個問題,如何系統性進階,我斗膽將學習深度學習的同志分為5大境界,分別是 白身,初識,不惑,有識,不可知,下面一個一個道來,以 計算機視覺方向為例。

1 白身

所謂白身境界,就是基本上什麼都不會,還沒有進入角色。在這個境界需要修行的內容包括:

(1) 熟練掌握linux及其環境下的各類工具的使用

(2) 熟練掌握python及機器學習相關庫的使用

(3) 掌握c++等高效能語言的基本使用

(4) 知道如何獲取和整理,理解資料

(5) 掌握相關的數學基礎

(6) 瞭解計算機視覺的各大研究方向

(7) 瞭解計算機視覺的各大應用場景

(8) 瞭解行業的優秀研究人員,知道如何獲取最新的資訊,能夠熟練閱讀簡單的技術資料

如果掌握了這些,那麼就從白痴,不,是白身境界晉級了。怎麼判斷這個境界呢?可以參考以下的文章,看看掌握的如何。

AI白身境界系列完整連結:

第一期: 【AI白身境】深度學習從棄用windows開始

第二期: 【AI白身境】Linux幹活三板斧,shell、vim和git

第三期: 【AI白身境】學AI必備的python基礎

第四期: 【AI白身境】深度學習必備影像基礎

第五期: 【AI白身境】搞計算機視覺必備的OpenCV入門基礎

第六期: 【AI白身境】只會用Python?g++,CMake和Makefile瞭解一下

第七期: 【AI白身境】學深度學習你不得不知的爬蟲基礎

第八期:  【AI白身境】深度學習中的資料視覺化

第九期: 【AI白身境】入行AI需要什麼數學基礎:左手矩陣論,右手微積分

第十期: 【AI白身境】一文覽盡計算機視覺研究方向

第十一期:【AI白身境】AI+,都加在哪些應用領域了

第十二期: 【AI白身境】究竟誰是paper之王,全球前10的電腦科學家

2 初識

所謂初識,就是對相關技術有基本瞭解,掌握了基本的使用方法。在這個階段,需要修行以下內容。

(1) 熟練掌握神經網路

(2) 培養良好的資料敏感性,知道如何正確準備和使用資料

(3) 至少熟練掌握一個深度學習框架的使用

(4) 熟悉深度學習模型的基本訓練和調參,網路設計

(5) 掌握歸一化,啟用機制,最最佳化等對模型效能的影響

(6) 能熟練評估自己的演算法,使用合適的最佳化準則

AI初識境界系列完整連結:

第一期: 【AI初識境】從3次人工智慧潮起潮落說起

第二期: 【AI初識境】從頭理解神經網路-內行與外行的分水嶺

第三期: 【AI初識境】近20年深度學習在影像領域的重要進展節點

第四期: 【AI初識境】啟用函式:從人工設計到自動搜尋

第五期: 【AI初識境】什麼是深度學習成功的開始?引數初始化

第六期: 【AI初識境】深度學習模型中的Normalization,你懂了多少?

第七期: 【AI初識境】為了圍剿SGD大家這些年想過的那十幾招

第八期: 【AI初識境】被Hinton,DeepMind和史丹佛嫌棄的池化,到底是什麼?

第九期: 【AI初識境】如何增加深度學習模型的泛化能力

第十期: 【AI初識境】深度學習模型評估,從影像分類到生成模型

第十一期: 【AI初識境】深度學習中常用的損失函式有哪些?

第十二期: 【AI初識境】給深度學習新手開始專案時的10條建議

3 不惑

進入到不惑境界,就是向高手邁進的開始了,在這個境界的重點就是進一步鞏固知識,並且開始獨立思考。如果說學習是一個從模仿,到追隨,到創造的過程,那麼到這個階段,應該跳過了追隨,進入了創造的階段。

如果是在學校讀研究生,就要能夠發表水平不錯的文章,如果是在公司做業務,就要能夠提出正確且快速的解決方案,如果是寫技術文章,就要能夠信手拈來原創寫作而不需要參考。

這個階段需要修行以下內容:

(1) 熟練玩轉資料和模型對一個任務的影響

(2) 能夠準確的分析出模型的優劣,瓶頸

(3) 對於新的任務能夠快速尋找和敲定方案

(4) 擁有各種各樣的深刻理解深度學習模型的技能,從視覺化到引數分析等等等

(5) 能夠最佳化模型到滿足業務的需求,實現工業級落地

(6) 瞭解行業的最新進展,並在某些領域有自己的獨到理解

不惑境界的內容

第一期: 【AI不惑境】資料壓榨有多狠,人工智慧就有多成功

第二期: 【AI不惑境】網路深度對深度學習模型效能有什麼影響?

第三期: 【AI不惑境】網路的寬度如何影響深度學習模型的效能?

第四期: 【AI不惑境】學習率和batchsize如何影響模型的效能?

第五期: 【AI不惑境】殘差網路的前世今生與原理

第六期: 【AI不惑境】移動端高效網路,卷積拆分和分組的精髓

第七期: 【AI不惑境】深度學習中的多尺度模型設計

第八期: 【AI不惑境】計算機視覺中注意力機制原理及其模型發展和應用

4 有識

到這裡,就步入高手境界了。可以大膽地說自己是一個非常合格的深度學習演算法工程師甚至是研究員了,在自己研究的領域裡處於絕對的行業前沿,對自己暫時不熟悉的領域也能快速地觸類旁通。

無論是眼界,學習能力,還是學習態度都是一流水平,時而大智若愚,時而鋒芒畢露,當之無愧的大師兄。

這個修行之路仍然在更新中,我們釋出了超過360頁的指導手冊和GitHub專案,大家可以去自行獲取。

 

 

作者:言有三
連結:
來源:知乎
著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。
 

下面是一些綜述性質的總結文章和兩個適合初學者的專欄內容。

1 深度學習模型設計

模型解讀系列文章:

第一期: 【模型解讀】從LeNet到VGG,看卷積+池化串聯的網路結構

第二期: 【模型解讀】network in network中的1*1卷積,你懂了嗎

第三期: 【模型解讀】GoogLeNet中的inception結構,你看懂了嗎

第四期: 【模型解讀】說說移動端基準模型MobileNets

第五期: 【模型解讀】pooling去哪兒了?

第六期: 【模型解讀】resnet中的殘差連線,你確定真的看懂了?

第七期: 【模型解讀】“不正經”的卷積神經網路

第八期: 【模型解讀】“全連線”的卷積網路,有什麼好?

第九期: 【模型解讀】從“區域性連線”回到“全連線”的神經網路

第十期: 【模型解讀】深度學習網路只能有一個輸入嗎

第十一期: 【模型解讀】從2D卷積到3D卷積,都有什麼不一樣

第十二期: 【模型解讀】淺析RNN到LSTM

第十三期: 【模型解讀】歷數GAN的5大基本結構

2 開源框架速成(更新完)

開源框架速成系列:

第一篇: 【caffe速成】caffe影像分類從模型自定義到測試

第二篇: 【tensorflow速成】Tensorflow影像分類從模型自定義到測試

第三篇: 【pytorch速成】Pytorch影像分類從模型自定義到測試

第四篇: 【paddlepaddle速成】paddlepaddle影像分類從模型自定義到測試

第五篇: 【Keras速成】Keras影像分類從模型自定義到測試

第六篇: 【mxnet速成】mxnet影像分類從模型自定義到測試

第七篇: 【cntk速成】cntk影像分類從模型自定義到測試

第八篇: 【chainer速成】chainer影像分類從模型自定義到測試

第九篇: 【DL4J速成】Deeplearning4j影像分類從模型自定義到測試

第十篇: 【MatConvnet速成】MatConvnet影像分類從模型自定義到測試

第十一篇: 【Lasagne速成】Lasagne/Theano影像分類從模型自定義到測試

第十二篇: 【darknet速成】Darknet影像分類從模型自定義到測試

 

 

https://blog.csdn.net/weixin_42137700/article/details/104569932




來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2677738/,如需轉載,請註明出處,否則將追究法律責任。

相關文章