影像處理和計算機視覺中的經典論文整理
1990 年之前
Peter Burt, Edward Adelson | The Laplacian Pyramid as ACompact Image Code | 雖說這個Laplacian Pyramid是有冗餘的,但使用起來非常簡單方便,對理解小波變換也非常有幫助。這位Adelson是W.T.Freeman的老闆,都是大牛. |
J Canny | A Computational Approach to Edge Detection | 經典不需要解釋。在 Sonka的書裡面對這個演算法也有比較詳細的描述。 |
S Mallat. | A theory for multiresolution signal decomposition: The wavelet representation | Mallat的代表作 |
M Kass, A Witkin, D Terzopoulos. | Snakes: active contour models | Deformable model的開山鼻祖。 |
RM HARALICK | Textural Features for Image Classification | 這三篇都是關於紋理特徵的,雖然過去這麼多年了,現在在檢索和識別中依然很有用。 |
RM HARALICK | Statistical and structural approaches | |
Tamura等 | Texture features corresponding to visual perception | |
A P Dempster, N M Laird, D B Rubin. 1977 | Maximum likelihood from incomplete data via the EM algorithm | EM 演算法在計算機視覺中有著非常重要的作用 |
L Rabiner. 1989 | A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition | HMM 同樣是計算機視覺必須掌握的一項工具 |
B D Lucas, T Kanade | An iterative image registration technique with an application to stereo- vision | Lucas 光流法 |
J R Quinlan | Induction of decision trees | 偏模式識別和機器學習一點 |
1990 年
P Perona, J Malik. PAMI | Scale-space and edge detection using anisotropic diffusion | 關於 scale space 最早的一篇論文之一,引用率很高 |
T Lindeberg | Scale-space for discrete signals. | Lindeberg 關於 scale space 比較早的一篇,後續還有好幾篇 |
anzad, A.; Hong, Y.H. | Invariant image recognition by Zernike moments | Zernike moment,做過模式識別或者檢索的應該都知道這個東東 |
1991 年
W Freeman, E Adelson. | The design and use of steerable filters | Freeman最早的一篇力作,現在Freeman在 MIT 風生水起,早已是IEEE Fellow了 |
Michael J. Swain , Dana H. Ballard | Color Indexing. | google scholar 上引用將近五千次 |
MA Turk CVPR | Face recognition using eigenfaces |
1992 年
L G Brown. | A survey of image registration techniques. | 比較早的一篇關於配準的綜述了 |
1993 年
S G Mallat, Z Zhang. | Matching pursuits with time-frequency dictionaries | Mallat另一篇關於小波的文章,不研究小波的可以無視之 |
L Vincent. | Morphological grayscale reconstruction in image analysis: Applications and efficient algorithms | |
DP Huttenlocher | Comparing images using the Hausdorff distance | Google scolar 上引用2200多次 |
1994 年
J Shi, C Tomasi. | Good feature to track. | Tomasi這個名字還會出現好幾次,真的很牛 |
Linderberg | Scale-space theory in computer vision | |
J L Barron, D J Fleet, S S Beauchemin. | Performance of optical flow techniques. |
1995 年
R Malladi, J Sethian, B Vemuri. | Shape Modeling with Front Propagation: A Level Set Approach | Level set的經典文章 |
TF COOTES | Active Shape Models-Their Training and Application | ASM |
MA Stricker | Similarity of color images | 顏色檢索相關 |
C Cortes, V Vapnik. | Support-vector networks. | SVM 在計算機視覺中也有著非常重要的地位 |
1996 年
T MCINERNEY. | Deformable models in medical image analysis: A survey | 活動模型的一篇較早的綜述 |
Tai Sing Lee | Image Representation Using 2D Gabor Wavelets | Google引用也有近千次 |
Amir Said, A. Pearlman | A New, Fast, and Efficient Image Codec Based on Set Partitioning in Hierarchical Tree | SPIHT。影像壓縮領域與 EBCOT齊名的經典演算法。 |
L P Kaelbling, M L Littman, A W Moore. | Reinforcement learning: A survey | 機器學習裡面的一篇綜述,引用率比較高,就列在這了。 |
B. S. Manjunath and W. Y. Ma | Texture features for browsing and retrieval of image data | 檢索的文章比較多,其實它們的應用不僅僅是檢索。只要是需要提取特徵的地方,檢索裡面的方法都可以用到 |
comparing images using color coherence vectors | 檢索中的CCV方法 | |
Image retrieval using color and shape | 關於形狀特徵後面有一篇綜述 |
1997 年
V Caselles, R Kimmel, G Sapiro. | Geodesic active contours | 活動輪廓模型的一個小分支 |
R E Schapire, Y Freund, P Bartlett, W S Lee. | Boosting the Margin: A New Explanation for the Effectiveness of Voting Methods. | Schapire 和 Freund 發 明 了Adaboost,給計算機視覺帶來了不少經典演算法 |
F Maes, D Vandermeulen, G Marchal, P Suetens. | Multimodality image registration by maximization of mutual information | 互資訊量配準 |
E Osuna, R Freund, F Girosi. | Training support vector machines: An application to face detection. | SVM在人臉檢測中的應用。不過人臉檢測最經典的方法應 該是Viola-Jones |
J Huang, S Kumar, M Mitra, W-J Zhu, R Zabih. | Image indexing using color correlogram | Color correlogram,檢索中的又一個顏色特徵。和前面的 CCV 以及顏色矩特徵基本上覆蓋了所有的顏色特徵。 |
Y Freund, R Schapire. | A decisiontheoretic generalization of on-line learning and an application to boosting. | Adaboost的經典文章 |
1998 年
1998 年是影像處理和計算機視覺經典文章井噴的一年。大概從這一年開始,開始有了新的趨勢。由於競爭的加劇,一些好的演算法都先發在會議上了,先佔個坑,等過一兩年之後再擴充套件到會議上。
T Lindeberg | Feature detection with automatic scale selection | Linderberg的 scale space到此為止基本結束了。在一些邊緣提取,道路或者血管檢測中,scale space 確實是一種很不錯的工具 |
C J C Burges. | A tutorial on support vector machines for pattern recognition. | 使用 svm的話,這篇文章應該是必讀的了。比 95 年那篇原始文章引用率還高 |
M Isard, A Blake. | CONDENSATION – Conditional TrackingDensity Propagation for Visual | Tracking中的經典文章了 |
L Page, S Brin, R Motwani, T Winograd | The PageRank citation ranking: bringing order to the web | 這篇文章應該不屬於 CV 的範疇,鑑於作者的大名鼎鼎,暫且列在這 |
C Tomasi, R Manduchi. | Bilateral filtering for gray and color images. | 做過影像濾波平滑去噪或者 HDR的應該都知道Bilateral filter。原理非常非常簡單,簡單到一個公式就可以概括這篇文章,簡單到實在無法擴充到期刊。這也是 Tomasi 第二次出現了。一直很納悶,這個很直觀的思想在這之前怎麼就從來沒人提呢。 |
C Xu, J L Prince. | Snakes, shapes and gradient vector flow. | 終於碰到中國人寫的文章了,很榮幸還是校友。GVF是 snake和levelset領域的重要分支和方法 |
Wim Sweldens. | The lifting scheme: A construction of second generation wavelets. | 第二代小波。真正讓小波有了實用價值,在 JPEG2000 中就採用的提升小波。個人更喜歡的是下一篇,簡單易懂,字型也大 |
Daubechies Wim Sweldens | Factoring wavelet transforms into lifting steps | 另一位作者也很牛,小波十講的作者 |
H A Rowley, S Baluja, T Kanade. | Neural Network-based Face Detection. | 做人臉的應該是必看的了。不做人臉的話應該可以不用看吧 |
J B A Maintz, M A Viergever. | A survey of medical image registration. | 關於影像配準的另一篇綜述 |
T F Cootes, G J Edwards, C J Taylor. | Active Appearance Models | AAM |
1999 年
D Lowe. | Object Recognition from Local Scale-invariant Features | 大名鼎鼎的SIFT,後面有一篇IJCV上的 Journal版本,更全面一點。 |
R E Schapire. | A brief Introduction to Boosting | 還是 boosting |
D M Gavrila. | The visual analysis of human movements: a survey | 綜述文章的引用一般都比較高 |
Y Rui, T S Huang, S F Change. | Image retrieval: current techniques, promising directions, and open issues | TSHuang小組對檢索的一個總結 |
J K Aggarwal, Q Cai. | Human motion analysis: a review | 人體運動分析的一個綜述 |
2000 年
世紀之交,各種綜述都出來了
J Shi, J Malik. | Normalized Cuts and Image Segmentation | NCuts的引用率相當高,Jianbo Shi也因為這篇文章成為計算機視覺界引用率最高的作者之一 |
Z Zhang. | A Flexible New Technique for Camera Calibration | 張正友的關於攝像機標定的經典短文 |
A K Jain, R P W Duin, J C Mao. | Statistical pattern recognition: a review. | 統計模式識別綜述,這一年 pami上兩篇很有名的綜述之一。 在這裡推薦 Web 寫的 Statistical Pattern Recognition第三版,相當不錯,網上有電子版。 |
C Stauffe | Learning Patterns of Activity Using Real-Time Tracking | 搜 TLD 的時候發現這篇文章引用率也很高,兩千多次。還沒來得及讀。 |
D Taubman. | High performance Scalable Image Compression With EBCOT | EBCOT,JPEG2000 中的演算法 |
A W M Smeulders, M Worring, S Santini, A Gupta, R Jain. | Content-based image retrieval at the end of the early years | 在世紀之交對影像檢索的一篇很權威的綜述。感覺在這之後檢索的研究也沒那麼熱了。不過在工業界熱度依舊,各大網上購物平臺,比如淘寶, 亞馬遜,京東等都在做這方面的研發,衣服檢索是一個很不錯的應用點。 |
M Pantic, L J M Rothkrantz. | Automatic analysis of facial expressions: the state of the art. | |
N Paragios, R Deriche. | Geodesic active contours and level sets for the detection and tracking of moving objects | 使用 level set做跟蹤 |
Y Rubner, C Tomasi, L Guibas. | TThe earth mover’s distance as a metric for image retrieval. | EMD演算法。Tomasi再次出現 |
PicToSeek Combining Color and Shape Invariant Features for Image Retrieval | 依然是檢索特徵 |
2001 年
Paul Viola, Michael J Jones. | Robust real-time object detection | 這是一篇很牛的文章,在人臉檢測上幾乎成了標準。比較坑爹的是,號稱發在IJCV2001 上,但怎麼找也找不到。應該是 IJCV2004年的那篇“Robust real-time face detection”吧。 他們在這一年另一篇比較出名的文章是在CVPR上的“Rapid ObjectDetection using a Boosted Cascade of Simple Features”這篇才是04年那篇著名文章的會議版。 |
Y Boykov, Kolmogorov. | An experimental comparison of min-cut/max-flow algorithms for energy minimization in vision. | 俄羅斯人在 graph cut 領域開始發力了 |
T Moeslund, E Granum. | A Survey of Computer Vision Based Human Motion Capture | 人體運動綜述 |
T F Chan, L Vese. | Active contours without edges. | Snake 和 level set領域的經典文章 |
A M Martinez, A C Kak. | PCA versus LDA | PCA 也是計算機視覺中非掌握不可的工具。LDA在模式識別中有很重要的地位 |
BS Manjunath | Color and texture descriptors | 顏色和紋理的描述子,在識別中很有用 |
2002 年
D Comaniciu, P Meer. | Mean shift: A robust approach toward feature space analysis. | Mean shift的經典文章。前兩天發現 Comaniciu 已經是 IEEE Fellow了 |
Ming-Husan Yang, David J Kriegman, Narendra Ahuja. | Detecting Faces in Images: A Survey. | 人臉檢測綜述,引用率想不高都難 |
R Hsu, M Abdel-Mottaleb. | Face Detection in Color Images. | 依然是人臉檢測,名字都起得這麼霸氣 |
J-L Starck, E J Candès, D L Donoho. | The curvelet transform for image denoising. | Geometrical wavelet 中的一篇代表 作 。 其 他 的 如 ridgelet, contourlet, bandelet 等在這裡就不贅述了。研究這方面的很容易找到這方面的經典文獻。個人以為不研究這方面的看了後對自己的研究也不會有多大啟發。曾經以為這個方向會很火,到最後還是沒火起來。 我覺得原因可能是現在儲存和傳輸能力的大大提高,使得對壓縮的需求沒有那麼大了,這方面的研究自然就停滯了,就如同JPEG2000沒有成氣候 |
Shape matching and object recognition using shape contexts | Shape context。用形狀匹配達到目標識別目的。這方面最經典的文章了。隨後後續也有一些這方面的文章,但基本都是很小的改進或者應用。作者提供了原碼,可以在 matlab上執行看看效果。 | |
N Paragios, R Deriche. | Geodesic active regions and level set methods for supervised texture segmentation | |
Statistical Color Models with Application to Skin Detection | ||
A tutorial on particle filters for online nonlinear non-Gaussian Bayesian tracking | particle filter 的一個綜述 |
2003 年
W Zhao, R Chellappa, P J Phillips, A Rosenfeld. | Face recognition: A literature survey. | 人臉檢測的綜述 |
J Sivic, A Zisserman. | Video Google: A text retrieval approach to object matching in videos. | 好像是Visual words的起源文章。引用率很高,先列出來再看。 |
D Comaniciu, V Ramesch, P Meer. | Kernel-Based Object Tracking. | 基於核的跟蹤。 |
B Zitová, J Flusser. | Image registration methods: A survey. | 又一篇影像配準的綜述。做影像配準的比較有福氣,綜述很多 |
K Mikolajczyk, C Schmid. | A performance evaluation of local descriptors. | 比較各種描述子的,包括SIFT |
M J Wainwright, M I Jordan. | Graphical models, exponential families, and variational inference. | 喬丹的名氣太大,不露露臉說不過去 |
J Portilla, V Strela, M Wainwright, E Simoncelli. | Image denoising using scale mixtures of gaussians in the wavelet domain. | 影像去噪,小波變換,混合高斯 |
Robert E. Schapire | The Boosting Approach to Machine Learning An Overview | boosting作者自己寫的綜述,自然值得一看。 |
2004 年
Lucas-Kanade 20 Years On A Unifying Framework | 引用文章摘要的第一句話Since the Lucas-Kanade algorithm was proposed in 1981 image alignment has become one of the most widely used techniques in computer vision. Applications range from optical flow and tracking to layered motion, mosaic construction, and face coding. | |
D G Lowe. | Distinctive image features from scale-invariant keypoints. | SIFT,不解釋 |
Chih-ChungChang,Chih-Jen Lin. | LIBSVM: A library for support vectormachines | 我實在懷疑引用這篇文章的人是否都看過這篇文章。貌似不看這篇文章也可以使用 LIBSVM |
Z Wang, A C Bovik, H R Sheikh, E P Simoncelli. | Image quality assessment: From error visibility to structural similarity | 影像質量評價,最近 Bovik 還有一篇類似的文章也刊登在 TIP上 |
Y Ke, R Sukthankar. | Pca-sift: a more distinctive representation for local image descriptors | SIFT 的變形 |
Review of shape representation and description techniques | ||
Efficient Graph-Based Image Segmentation |
2005 年
N Dalal, B Triggs. | Histograms of oriented gradients for human detection. | HOG 雖然很新,但很經典 |
A C Berg, T L Berg, J Malik. | Shape matching and object recognition using low distortion correspondences. | 還是 shape matching |
S Roth, M Black. | Fields of experts: A framework for learning image priors. | 這篇應該要歸結到影像統計特性的範疇吧 |
Z Tu, X Chen,A L Yuille, S C Zhu. | Image parsing: Unifying segmentation, detection, and recognition. | |
Geodesic active regions and level set methods for motion estimation and tracking | ||
Chunming Li, Chenyang Xu, Changfeng Gui, and Martin D. Fox | Level Set Evolution Without Re-initialization: A New Variational Formulation | 這篇文章解決了level set中需要不停的重初始化的問題。在 2010 年的 TIP上有一篇 Journal版本 Distance Regularized Level Set Evolution and its Application to Image Segmentation |
A Performance Evaluation of Local Descriptors | 前面那篇是會議的,這篇是 PAMI上的。比較各種描述子的,包括SIFT |
2006 年
D Donoho. | Compressed sensing. | CS 壓縮感知 最近很火的一個名詞 |
Greg Welch, Gary Bishop. | An introduction to the Kalman Filter. | kalman濾波 |
S Lazebnik, C Schmid, J Ponce. | Beyond bags of features: spatial pyramid matching for recognizing natural scene categories. | Visual words |
Xiaojin Zhu. | Semi-supervised learning literature survey. | |
A Yilmaz, O Javed, M Shah. | Object Tracking: A survey. | tracking的一篇綜述 |
Image Alignment and Stitching: A Tutorial |
2007 年
A Review of Statistical Approaches to Level Set Segmentation: Integrating Color, Texture, Motion and Shape | ||
The Appearance of Human Skin: A Survey | ||
Local Invariant Feature Detectors: A Survey |
2008 年
H Bay, A Ess, T Tuytelaars, L V Gool. | SURF: Speeded Up Robust Features. | |
K E A van de Sande, T Gevers, C G M Snoek. | Evaluation of Color Descriptors for Object and Scene Recognition | |
M Yang | A Survey of Shape Feature Extraction Techniques | 雖然這篇文章的引用率目前來看並不高,但個人認為這是一篇在shape feature方面很不錯的文章 |
P.Felzenszwalb, D. McAllester, D. Ramanan | A Discriminatively Trained, Multiscale, Deformable Part Model | 2008 年的 CVPR,到現在引用已有四百多次,潛力巨大。rosepink提供 |
2009 年
J Wright, A Y Yang, A Ganesh, S S Sastry, Ma. | Robust Face Recognition via Sparse Representation. | |
B Settles. | Active learning literature survey |
2011 年
Hough Forests for Object Detection, Tracking, and Action Recognition | ||
Robust Principal Component Analysis? | Candes 和 UIUC 的Ma Yi等人 |
2012 年
Zdenek Kalal, Krystian Mikolajczyk,and Jiri Matas, | Tracking-Learning-Detection | PAMI上的,雖然還沒有正式發表,但肯定會火。在作者的主頁上有幾篇相關的會議文章, demo和code。用到了 Lucas-Kanade方法 |
相關文章
- 計算機經典論文計算機
- 計算機視覺 の1. 影像預處理計算機視覺
- Python 計算機視覺(十五)—— 影像特效處理Python計算機視覺特效
- 論文資源: CVPR、ICCV、ECCV、IJCAI等計算機視覺、影像處理頂會頂刊歷年論文連結AI計算機視覺
- 計算機視覺經典任務分類計算機視覺
- OpenCV計算機視覺學習(15)——淺談影像處理的飽和運算和取模運算OpenCV計算機視覺
- 計算機視覺實戰的深度學習實戰二:影像預處理計算機視覺深度學習
- 2024年5月計算機視覺論文推薦:包括擴散模型、視覺語言模型、影像編輯和生成、影片處理和生成以及影像識別等各個主題計算機視覺模型
- 計算機視覺論文集計算機視覺
- 計算機視覺中的影像標註工具總結計算機視覺
- 必看,10篇定義計算機視覺未來的論文計算機視覺
- 淺析機器視覺在醫療影像處理中的應用視覺
- 【計算機視覺】利用GAN Prior來處理各種視覺任務計算機視覺
- OpenCV計算機視覺學習(12)——影像量化處理&影像取樣處理(K-Means聚類量化,區域性馬賽克處理)OpenCV計算機視覺聚類
- 視覺化影像處理 | 視覺化訓練器 | 影像分類視覺化
- 2024年3月的計算機視覺論文推薦計算機視覺
- 計算機視覺、機器學習相關領域論文和原始碼大集合計算機視覺機器學習原始碼
- 2024年4月計算機視覺論文推薦計算機視覺
- 目標檢測和影像分類及其相關計算機視覺的影像分佈計算機視覺
- 【機器視覺與影象處理】基於MATLAB的角度計算視覺Matlab
- 計算機視覺崗實習面經計算機視覺
- webgl 影像處理 加速計算Web
- 計算機視覺中的深度學習計算機視覺深度學習
- 一文讀懂計算機視覺中的深度域適應計算機視覺
- 2020年十大計算機視覺論文 - kdnuggets計算機視覺
- CV:計算機視覺基礎之影像儲存到計算機的原理daiding計算機視覺AI
- 機器學習、資料探勘、計算機視覺等領域經典書籍推薦機器學習計算機視覺
- 計算機視覺中的注意力機制計算機視覺
- [計算機視覺]基於內容的影像搜尋實現計算機視覺
- 大模型時代的計算機視覺!CVPR 2024線上論文分享會啟動大模型計算機視覺
- 計算機視覺領域如何從別人的論文裡獲取自己的idea?計算機視覺Idea
- 解讀 | 2019年10篇計算機視覺精選論文(上)計算機視覺
- 計算機視覺面試經歷| 掘金技術徵文計算機視覺面試
- 【計算機視覺前沿研究 熱點 頂會】ECCV 2024中目標檢測有關的論文計算機視覺
- 全球計算機視覺頂會CVPR 2019論文出爐:騰訊優圖25篇論文入選計算機視覺
- OpenCV計算機視覺學習(2)——影像算術運算 & 掩膜mask操作(數值計算,影像融合,邊界填充)OpenCV計算機視覺
- HuggingFace在NLP和計算機視覺中的應用 - Reddit計算機視覺
- 2024年6月計算機視覺論文推薦:擴散模型、視覺語言模型、影片生成等計算機視覺模型