計算機視覺--CV技術指南文章彙總

CV技術指南(公眾號)發表於2022-01-15

前言 

本文彙總了過去本公眾號原創的、國外部落格翻譯的、從其它公眾號轉載的、從知乎轉載的等一些比較重要的文章,並按照論文分享、技術總結三個方面進行了一個簡單分類。點選每篇文章標題可閱讀詳細內容

 

歡迎關注公眾號 CV技術指南 ,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀。

今年是進入計算機視覺領域的第四年,做公眾號的第一年,寫了不少原創文章,從國外部落格上翻譯了不少我認為比較不錯的文章,也從知乎上找了不少不錯的文章在經作者授權後轉載到公眾號。

整體上來說,這一年基本保持初心,始終在做一個專注於計算機視覺技術總結、最近技術跟蹤、最新論文分享和經典論文解讀的公眾號。公眾號從未採用誇大的標題,寧可不更,也不會強行找一篇無用文章、無用新聞來更新。

今年公眾號創立了一個計算機視覺的微信交流群,目前群內氛圍還算不錯,基本有問有答,想要加群的朋友可以掃描文末的二維碼新增編輯微信,經邀請後加群。

與此同時,公眾號與一部分網際網路企業進行了合作,釋出一些計算機視覺的招聘崗位,讀者可通過公眾號直接內推給HR。

今年主要更新的內容是論文分享和技術總結。

論文分享方面主要介紹論文的研究背景、創新思路和簡要介紹創新方法。基本不涉及到程式碼解讀,只提供官方程式碼的連結,這主要是考慮到對讀者負責。計算機是一個對動手能力要求特別高的領域,如果你覺得論文中的方法可以用在你自己的專案或研究上,你應該自己去結合原始碼完整地閱讀整篇論文,這是一種做研究或做專案的正確態度。如果習慣於閱讀別人解讀得非常詳盡的文章,無異於衣來伸手飯來張口,白白丟失了鍛鍊自己能力的機會,其結果將是始終不具備自學的能力,做事效率極低。

技術總結方面主要對現有的一些技術進行總結,如目標檢測、語義分割中的常見的特徵金字塔、注意力機制等,神經網路中的初始化方法、歸一化方法、損失函式等,各個方向上的一些技術等。通過這些總結,讀者能夠非常清晰地瞭解這些方法之間的優缺點,改進思路等。吐槽一句,幾乎每篇技術總結都花費了將近兩三天的時間,一天時間全面搜尋相關文章,儘可能總結全面,一天時間思考如何寫,一天時間完成整體寫作,每次更新完一篇技術總結文章,都極其勞累,連玩手機的精力都沒有。

接下來一年將繼續進行論文分享、技術總結,此外,將會擴充套件一些程式碼技術方面的內容。今年始終沒有面向讀者約稿,這是因為公眾號收入比較低,給不出稿費。

如果有讀者願意免費分享的話,可以向公眾號提供自己原創的一些技術總結、經驗、論文解讀等文章,讓更多人一起學習進步,共同推動計算機視覺領域的發展。與此同時,讀者朋友們也可以把公眾號當作是一個自我激勵的平臺,如一週或兩週分享一篇文章到公眾號,讓自己始終保持不斷輸入不斷輸出的狀態。公眾號也會記錄大家供稿的次數,日後若公眾號有比較不錯的收入,將會向那些給公眾號多次供稿的讀者們發一些稿費。

補充一句:希望大家養成鍛鍊身體的習慣,每次更新公眾號,都要在座位上四五個小時一動不動,實在辛苦。如果讀者朋友們看到覺得不錯的文章,可以文末點個贊,會讓我更有創作動力。

論文分享


ICCV2021 | 簡單有效的長尾視覺識別新方案:蒸餾自監督(SSD)

ICCV2021 | Swin Transformer: 使用移位視窗的分層視覺Transformer

ICCV2021 | SOTR:使用transformer分割物體

ICCV2021 | PnP-DETR:用Transformer進行高效的視覺分析

ICCV2021 | Vision Transformer中相對位置編碼的反思與改進

ICCV2021 | 重新思考視覺transformers的空間維度

ICCV2021 | TOOD:任務對齊的單階段目標檢測

ICCV2021 | 用於視覺跟蹤的學習時空型transformer

ICCV2021 | 漸進取樣式Vision Transformer

ICCV2021 | Tokens-to-Token ViT:在ImageNet上從零訓練Vision Transformer

ICCV2021 | 梯度歸一化用於GAN

ICCV2021 | 醫學影像等小資料集的非自然影像領域能否用transformer?

ICCV2021 | TransFER:使用Transformer學習關係感知的面部表情表徵

ICCV2021 | SMCA:即插即用的共同注意力模型,可使DETR收斂加速10倍

ICCV2021 | MicroNet:以極低的 FLOPs 改進影像識別

ICCV2021 | 深度理解CNN

ICCV2021 Oral | AdaFocus:利用空間冗餘性實現高效視訊識別

 


CVPR2021 | TrivialAugment:不用調優的SOTA資料增強策略

CVPR2020 | D3S: 判別式單鏡頭分割跟蹤器

CVPR2021 | SETR: 使用 Transformer 從序列到序列的角度重新思考語義分割

CVPR2021 | 開放世界檢測綜述

CVPR2021 | 開放世界的目標檢測

CVPR2021 | TransCenter: transformer用於多目標跟蹤演算法

CVPR2021 | Transformer用於End-to-End視訊例項分割

CVPR2021提出的一些新資料集彙總

CVPR2021|特徵金字塔的新方式YOLOF

CVPR2021 | 重新思考BatchNorm中的Batch

CVPR2021|一個高效的金字塔切分注意力模組PSA

CVPR2021 | 華為諾亞實驗室提出Transformer in Transformer

CVPR2021 | 繼SE,CBAM後的一種新的注意力機制Coordinate Attention

CVPR2021 | 開放世界的目標檢測

CVPR2021 | TimeSformer-視訊理解的時空注意模型

CVPR2021 | 一個高效的金字塔切分注意力模組PSA

CVPR2021 | PVT--無卷積密集預測的多功能backbone

CVPR2021 | 特徵金字塔的新方式YOLOF

CVPR2021 | 華為諾亞實驗室提出Transformer in Transformer

CVPR2021 | 行人搜尋中的第一個anchor-free模型

從CVPR 2021的論文看計算機視覺的現狀

 


Panoptic SegFormer:端到端的 Transformer 全景分割通用框

MobileVIT:輕量級視覺Transformer+移動端部署

AAAI2021 | 任意方向目標檢測中的動態Anchor學習

ICML2021 | 二值化網路訓練方法

NeurlPS2021 | WBF:繼NMS和Soft-NMS後的過濾候選框新方法

ML2021 | PatrickStar:通過基於塊的記憶體管理實現預訓練模型的並行訓練

ImageNet上表現好的模型遷移到其它資料集上也會更好嗎

速度提升2倍,超強悍CPU級骨幹網路PP-LCNet出世

OCR開源神器PaddleOCR再升級:效果提升7%、速度增加220%

 


經典論文系列 | 縮小Anchor-based和Anchor-free檢測之間差距的方法:自適應訓練樣本選擇

經典論文系列 | 膠囊網路:新的深度學習網路

經典論文系列 | 例項分割中的新正規化-SOLO

經典論文系列--GhostNet:廉價操作生成更多特徵

經典論文系列 | 重新思考在ImageNet上的預訓練

經典論文系列 | Group Normalization & BN的缺陷

經典論文系列 | 目標檢測--CornerNet  & 又名 anchor boxes的缺陷

經典論文系列 | NLN: Non-Local Neural Network

經典論文系列 | BatchNorm

經典論文系列| transformer解讀

經典模型系列 | Inception系列之Inception_v1

經典模型系列 | Inception系列之Inception_v2-v3

經典模型系列 | Inception系列之Inception_v4

經典模型系列 | MobileNet系列之MobileNet_v1

經典模型系列 | MobileNet系列之MobileNet_v2

經典模型系列 | MobileNet系列之MobileNet_v3

經典模型系列 | ShuffleNet系列之ShuffleNet_v1

經典模型系列 | ShuffleNet系列之ShuffleNet_v2

經典模型系列 | DenseNet

 


2021-視訊監控中的多目標跟蹤綜述

影像修復必讀的 10 篇論文

Anchor-free目標檢測論文彙總

例項分割綜述總結綜合整理版

單階段例項分割綜述

視訊理解綜述:動作識別、時序動作定位、視訊Embedding

語義分割綜述

基於 U-Net 的醫學影像分割演算法綜述

計算機視覺 10 年發展之觀察:1.5萬篇論文的大綜述!

單目深度估計方法綜述

近十年的VI-SLAM演算法綜述與發展

2021年小目標檢測最新研究綜述

綜述專欄 | 姿態估計綜述

深度學習中的人體姿態估計概述

Few-shot Learning 小白入門筆記

少樣本目標檢測

教程 | 單級式目標檢測方法概述:YOLO與SSD

增量學習深度神經網路

歡迎關注公眾號 CV技術指南 ,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀。

在公眾號中回覆關鍵字 “入門指南“可獲取計算機視覺入門所有必備資料。

計算機視覺--CV技術指南文章彙總

 

技術總結


歸一化方法總結

神經網路的初始化方法總結 | 又名“如何選擇合適的初始化方法”

欠擬合與過擬合技術總結

NMS總結           

損失函式技術總結

注意力機制技術總結

特徵金字塔技術總結   

池化技術總結    

資料增強方法總結   

論文創新的常見思路總結

CV方向的高效閱讀英文文獻方法總結

高效閱讀英文文獻的方法總結(二)

CNN結構演變總結(一)經典模型

CNN結構演變總結(二)輕量化模型

CNN結構演變總結(三)設計原則

CNN視覺化技術總結(一)特徵圖視覺化

CNN視覺化技術總結(二)卷積核視覺化

CNN視覺化技術總結(三)類視覺化

CNN視覺化技術總結(四)視覺化工具與專案

計算機視覺專業術語總結(一)構建計算機視覺的知識體系

計算機視覺中的資料預處理與模型訓練技巧總結

計算機視覺中的傳統特徵提取方法總結

計算機視覺中的影像標註工具總結

神經網路中的泛化總結

計算機視覺入門路線

 


PyTorch和TensorFlow在模型可用性、部署便捷度和生態系統方面的對比

Pytorch 資料流中常見Trick總結

工程Tricks | PyTorch有什麼節省視訊記憶體的小技巧?

使用 PyTorch Lightning 將深度學習管道速度提高 10 倍

Pytorch高效訓練的十條建議

使用 Ray 將 PyTorch 模型載入速度提高 340 倍

PyTorch 中的 ModuleList 和 Sequential: 區別和使用場景

PNNX: PyTorch 神經網路交換格式

Pytorch Lightning Flash 簡介

TorchShard 簡介

聊聊Pytorch中的dataloader

GPU多卡並行訓練總結(以pytorch為例)

Pytorch程式碼除錯工具--torchsnooper

資源分享 | PyTea:不用執行程式碼,靜態分析pytorch模型的錯誤

 


CB Loss:基於有效樣本的類別不平衡損失

基於深度學習的影像分割:網路結構設計

計算機視覺中的transformer模型創新思路總結

給模型加入先驗知識的常見方法總結

計算機視覺中的自注意力

特徵選擇的通俗講解!

HOG和SIFT影像特徵提取簡述

全面理解目標檢測中的anchor

目標檢測中迴歸損失函式總結

小目標檢測常用方法總結

資源分享 | SAHI:超大圖片中對小目標檢測的切片輔助超推理庫

乾貨 | CV 面試問題詳解寶典--目標檢測篇

深入瞭解目標檢測深度學習演算法的技術細節

目標檢測mAP的計算 & COCO的評價指標

YOLOR 與 YOLOX的battle

YOLOv4論文總結和分析

不帶Anchors和NMS的目標檢測

使用Dice loss實現清晰的邊界檢測

視覺目標檢測和識別之過去,現在及可能

在計算機視覺領域,都是怎麼檢測煙霧的?

 


AI 框架部署方案之模型轉換

AI框架的演進趨勢和MindSpore的構想

AI 模型部署概述

卷積神經網路壓縮方法總結

卷積神經網路的複雜度分析

多標籤分類概述

Siamese network總結

如何理解計算機視覺中的圖神經網路

深度學習編譯之模型即時翻譯技術

提高機器學習模型效能的常用策略

Softmax 函式和它的誤解

Batch Size對神經網路訓練的影響

padding在深度學習模型中重要嗎?

神經網路訓練不收斂或訓練失敗的原因總結

神經網路超引數的調參方法總結

深度學習有哪些trick?

為什麼GEMM是深度學習的核心

使用深度神經網路為什麼8位足夠?

視覺化的BatchNorm--它的工作方式以及為什麼神經網路需要它

在邊緣裝置上擬合大型神經網路的方法總結

如何使用 TensorFlow 量化神經網路

邊緣 AI 平臺的比較

 


OpenCV高效能運算基礎介紹

優化OpenCV視訊的讀取速度

FLOPS與FLOPs區別

為什麼FLOPs小的模型反而推理時間較長?

資源分享 | Glint360K: 全球最大人臉資料集, 共36萬類別、1800萬影像

資源分享 | 一個集影像分割的所有論文、benchmarks、資料集、專案程式碼等資源的github專案

資源分享 | 使用 FiftyOne 加快您的論文寫作速度

論文的科學寫作與哲學

CV演算法工程師的一年工作經驗與感悟

在做演算法工程師的道路上,你掌握了什麼概念或技術使你感覺自我提升突飛猛進?

 

歡迎關注公眾號 CV技術指南 ,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀。

在公眾號中回覆關鍵字 “入門指南“可獲取計算機視覺入門所有必備資料。

 
 

相關文章