AI中的影像識別技術的原理及過程

AIBigbull2050發表於2019-11-25
2019-11-25 16:23:31

伴隨著影像處理技術的飛速發展,推動了影像識別技術的產生和發展,並逐漸成為人工智慧領域中重要的組成部分,並廣泛地運用於面部識別、指紋識別、醫療診斷等等領域中,發揮重要作用。

AI中的影像識別技術的原理及過程

這也給學生思考課題給了更多的空間,今天小編就來淺談熱門課題方向中影像識別技術,希望給學生更多的啟發!

影像識別技術概述

影像識別技術的含義

影像識別是人工智慧的一個重要領域,是指利用計算機對影像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。一般工業使用中,採用工業相機拍攝圖片,然後再利用軟體根據圖片灰階差做進一步識別處理。

AI中的影像識別技術的原理及過程

在具體應用實踐中,特別識別除了要弄清識別的物件具有是什麼樣的物體外,還應該明確其所在的的位置和姿態。當前影像識別已經被廣泛應用到各個領域中,例如交通領域中的車牌號識別、交通標誌識別、軍事領域中的飛行物識別、地形勘察、安全領域中的指紋識別、人臉識別等。

AI中的影像識別技術的原理及過程

影像識別技術的原理

影像識別原理主要是需處理具有一定複雜性的資訊,處理技術並不是隨意出現在計算機中,主要是根據一些醫學研究人員的實踐,結合計算機程式對相關內容模擬並予以實現。該技術的計算機實現與人類對影像識別的基本原理基本類似,在人類感覺及視覺等方面只是計算機不會受到任何因素的影響。人類不只是結合儲存在腦海中的影像記憶進行識別,而是利用影像特徵對其分類,再利用各類別特徵識別出圖片。計算機也採用同樣的影像識別原理,採用對影像重要特徵的分類和提取,並有效排除無用的多餘特徵,進而使影像識別得以實現。有時計算機對上述特徵的提取比較明顯,有時就比較普通,這將對計算機影像識別的效率產生較大影響。

AI中的影像識別技術的原理及過程

影像識別技術的過程

由於影像識別技術的產生是基於人工智慧的基礎上,所以計算機影像識別的過程與人腦識別影像的過程大體一致,歸納起來,該過程主要包括4個步驟:

1是獲取資訊,主要是指將聲音和光等資訊透過感測器向電訊號轉換,也就是對識別物件的基本資訊進行獲取,並將其向計算機可識別的資訊轉換;

2是資訊預處理,主要是指採用去噪、變換及平滑等操作對影像進行處理,基於此使影像的重要特點提高;

3是抽取及選擇特徵,主要是指在模式識別中,抽取及選擇影像特徵,概括而言就是識別影像具有種類多樣的特點,如採用一定方式分離,就要識別影像的特徵,獲取特徵也被稱為特徵抽取;

4是設計分類器及分類決策,其中設計分類器就是根據訓練對識別規則進行制定,基於此識別規則能夠得到特徵的主要種類,進而使影像識別的不斷提高辨識率,此後再透過識別特殊特徵,最終實現對影像的評價和確認。

影像識別技術的常見形式

首先影像識別的發展經歷了三個階段:文字識別、數字影像處理與識別、物體識別。

文字識別的研究是從 1950年開始的,一般是識別字母、數字和符號,從印刷文字識別到手寫文字識別,應用非常廣泛。

數字影像處理和識別的研究開始於1965年。數字影像與模擬影像相比具有儲存,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優勢,這些都為影像識別技術的發展提供了強大的動力。

物體的識別主要指的是對三維世界的客體及環境的感知和認識,屬於高階的計算機視覺範疇。它是以數字影像處理與識別為基礎的結合人工智慧、系統學等學科的研究方向,其研究成果被廣泛應用在各種工業及探測機器人上。

隨著計算機及資訊科技的迅速發展,影像識別技術的應用逐漸擴大到諸多領域,尤其是在面部及指紋識別、衛星雲圖識別及臨床醫療診斷等多個領域日益發揮著重要作用。通常影像識別技術主要是指採用計算機按照既定目標對捕獲的系統前端圖片進行處理,在日常生活中影像識別技術的應用也十分普遍,比如車牌捕捉、商品條碼識別及手寫識別等。隨著該技術的逐漸發展並不斷完善,未來將具有更加廣泛的應用領域。

AI中的影像識別技術的原理及過程

基於神經網路的影像識別技術

目前,基於神經網路的影像識別是一種比較新型的技術,是以傳統影像識別方式為基礎,有效融合神經網路演算法。在此,神經網路主要是指人工神經網路,換而言之就是本文中的神經網路不是動物體的神經網路,而主要是指人類採用人工模擬動物神經網路方式的一種神經網路。針對基於神經網路的影像識別技術,目前,在基於神經網路的影像識別技術中,遺傳演算法有效結合 BP 神經網路是最經典的一種模型,該模型可在諸多領域中進行應用。諸如智慧汽車監控中採用的拍照識別技術,若有汽車從該位置經過時,檢測裝置將產生相應的反應,檢測裝置啟動影像採集裝置,獲取汽車正反面的特徵影像,在對車牌字元進行識別的過程中,就採用了基於神經網路和模糊匹配的兩類演算法。

基於非線性降維的影像識別技術

採用計算機識別影像是基於高維形式的一種識別技術,不管原始圖片的解析度如何,該圖片產生的資料通常都具有多維性特徵,這在一定程度上增大了計算機識別的難度。為使計算機的影像識別效能更為高效,採用隨影像降維方法就是一種最直接而有效的方法。一般情況下,可對降維劃分為非線性降維與線性降維兩類,比如最普遍的線性降維方式就是主成分分與線性奇異分析等,該方式的特點是簡單、理解更容易等,再對資料集合採用線性降維方式處理求解的投影影像使該資料集合的低維最優。

在資訊科技中作為近年來新興的影像識別技術已廣泛應用於眾多應用領域,隨著資訊科技的日新月異,影像識別技術也得到十分迅猛的發展。在眾多社會領域中,有效應用影像識別技術將使社會與經濟價值得到充分發揮。



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2665619/,如需轉載,請註明出處,否則將追究法律責任。

相關文章