Computer Vision
https://zhuanlan.zhihu.com/p/44420871
1.1 概念
計算機視覺(Computer Vision)是研究計算機如何像人類視覺系統
一樣,從數字影像或影片中理解其高層內涵的一門學科,簡言之就是研究如何讓計算機看懂世界,由於它包括對數字影像或影片進行預處理、特徵提取、特徵分類、分析理解幾個過程,才能實現將現實世界中的高維資料向低維符號資訊的對映,進而觸發自主決策,所以這門學科是一門跨學科的科學,包括機率論與數理統計、計算幾何、訊號處理、最最佳化理論
、凸最佳化等學科。
計算機視覺的應用方向包括場景重建、影片跟蹤、影像恢復
、目標物識別等等。其中目標物識別還能細分為物體識別、人臉識別、姿態識別、手勢識別、步態識別、動作/行為識別等等。還有一個類似的概念是機器視覺(Machine Vision),相對於計算機視覺來說是更偏工業界的一種說法,而且概念的使用範圍主要在工業檢測與工業控制場景中,本課程不使用這個概念。
1.3 行業應用
計算機視覺的行業應用,已成熟產業化的主要有如下六個領域:
(1). 安防監控領域,包括人臉識別、行為識別、運動跟蹤、人群分析等等,利用卡口精準位置布控影片監測,實現了監控區域內異常的自動識別,例如動態影片中的人臉與黑名單庫實時比對檢測,多視點影片協同分析執行軌跡,影片資料結構化後對關鍵目標的檢索等等;
(2). 網際網路娛樂場景,包括拍照最佳化、影片最佳化、實時人像美顏、AR特效、自定義背景等等,豐富了直播、短影片等網際網路娛樂應用;
(3). 金融身份認證場景,包括各種刷臉的金融應用,如遠端開戶、支付取款等等;
(4). 無人商場與廣告營銷,包括線下零售、商品識別、廣告AR賦能等等;
(5). 工業機器的視覺系統,包括物品分揀、缺陷檢驗
等等,通常是自動影像分析與光學成像等其他方法技術相結合;
(6). 無人機無人車控制,包括視覺導航、行人分析、障礙物檢測等等,通常作為一種感測器和鐳射雷達、毫米波雷達、紅外探頭與慣性測量單元
融合生成供自主決策的資訊;
此外,在醫療影像
分析上,計算機視覺也有很廣闊的發展前景。例如從醫學影像資料中(超聲影像、X射線影像
、CT影像)提取資訊可對腫瘤、動脈硬化等進行檢測或對器官尺寸、血流等測量,從而進行自動診斷。另一方面在軍事化用途上,現代軍事概念中有“戰場感知技術”的概念,即透過包含影像感測器的各類感測器,利用計算機視覺中自主分析、3D重建技術提供一套資料豐富的戰鬥實景來支撐戰略決策。下圖是艾瑞諮詢關於計算機視覺產業不同層次的應用領域與廠商列表。
圖1 計算機視覺應用領域及相關廠商(圖片來源於艾瑞諮詢)
從技術角度,計算機視覺有如下應用方向:
(1). 影像分類 image classification
(2). 影片分類 video classification
(3). 目標物定位 object localization/detection
(4). 影像內目標物分割 object segmentation
(5). 影片內目標物分割 video segmentation
(6). 目標追蹤 visual tracking
(7). 行為識別 action/activity recognition
(8). 行為定位 temporal action/activity localization
(9). 姿態估計
pose estimation
應用領域與技術對照表如下圖所示
圖2 應用領域與所用技術