EasyPR--中文開源車牌識別系統 開發詳解(1)

計算機的潛意識發表於2014-09-30

  在上篇文件中作者已經簡單的介紹了EasyPR,現在在本文件中詳細的介紹EasyPR的開發過程。

  正如淘寶誕生於一個購買來的LAMP系統,EasyPR也有它誕生的原型,起源於CSDN的taotao1233的一個部落格,博主以讀書筆記的形式記述了通過閱讀“Mastering OpenCV”這本書完成的一個車牌系統的雛形。

  這個雛形有幾個特點:1.將車牌系統劃分為了兩個過程,即車牌檢測和字元識別。2.整個系統是針對西班牙的車牌開發的,與中文車牌不同。3.系統的訓練模型來自於原書。作者基於這個系統,誕生了開發一個適用於中文的,且適合與協作開發的開源車牌系統的想法,也就是EasyPR

   當然了,現在車牌系統滿大街都是,隨便上下百度首頁都是大量的廣告,一些甚至宣稱自己實現了99%的識別率。那麼,作者為什麼還要開發這個系統呢?這主要是基於時勢與機遇的原因。

  眾所皆知,現在是大資料的時代。那麼,什麼是大資料?可能有些人認為這個只是一個概念或著炒作。但是大資料確是實實在在有著基礎理論與科學研究背景的一門技術,其中包含著分散式計算、記憶體計算、機器學習、計算機視覺、語音識別、自然語言處理等眾多計算機界嶄新的技術,而且是這些技術綜合的產物。事實上,大資料的“大”包含著4個特徵,即4V理念,包括Volume(體量)、Varity(多樣性)、Velocity(速度)、Value(價值)。

  見下圖的說明:

圖1 大資料技術的4V特徵

 

  綜上,大資料技術不僅包含資料量的大,也包含處理資料的複雜,和處理資料的速度,以及資料中蘊含的價值。而車牌識別這個系統,雖然傳統,古老,卻是包含了所有這四個特偵的一個大資料技術的縮影。

  在車牌識別中,你需要處理的資料是影象中海量的畫素單元;你處理的資料不再是傳統的結構化資料,而是影象這種複雜的資料;如果不能在很短的時間內識別出車牌,那麼系統就缺少意義;雖然一副影象中有很多的資訊,但可能僅僅只有那一小塊的資訊(車牌)以及車身的顏色是你關心,而且這些資訊都蘊含著巨大的價值。也就是說,車牌識別系統事實上就是現在火熱的大資料技術在某個領域的一個聚焦,通過了解車牌識別系統,可以很好的幫助你理解大資料技術的內涵,也能清楚的認識到大資料的價值。

  很神奇吧,也許你覺得車牌識別系統很低端,這不是隨便大街上都有的麼,而你又認為大資料技術很高階,似乎高大上的感覺。其實兩者本質上是一樣的。另外對於覺得大資料技術是虛幻的炒作念頭的同學,你們也可以瞭解一下車牌識別系統,就能知道大資料落在實地,事實上已經不知不覺進入我們的生活很長時間了,像一些其他的如搶票系統,語音助手等,都是大資料技術的真真切切的體現。所謂再虛幻的概念落到實處,就成了下里巴人,應該就是這個意思。所以對於炒概念要有所警覺,但是不能因此排除一切,要了解具體的技術內涵,才能更好的利用技術為我們服務。

  除了幫忙我們更好的理解大資料技術,使我們跟的上時代,開發一個車牌系統還有其他原因。

  那就是、現在的車牌系統,仍然還有許多待解決的挑戰。這個可能很多同學有疑問,你別騙我,百度上我隨便一搜都是99%,只要多少多少元,就可以99%。但是事實上,車牌識別系統業界一直都沒有一個成熟的百分百適用的方案。一些90%以上的車牌識別系統都是跟高清攝像機做了整合,由攝像頭傳入的高解析度圖片進入識別系統,可以達到較高的識別率。但是如果影象解析度一旦下來,或者圖裡的車牌髒了的話,那麼很遺憾,識別率遠遠不如我們的肉眼。也就是說,距離真正的智慧的車牌識別系統,目前已有的系統還有許多挑戰。什麼時候能夠達到人眼的精度以及識別速率,估計那時候才算是完整成熟的。

  那麼,有同學問,就沒有辦法進一步優化了麼。答案是有的,這個就需要談到目前火熱的深度學習與計算機視覺技術,使用多隱層的深度神經網路也許能夠解決這個問題。但是目前EasyPR並沒有採用這種技術,或許以後會採用。但是這個方向是有的。也就是說,通過研究車牌識別系統,也許會讓你一領略當今人工智慧與計算機視覺技術最尖端的研究方向,即深度學習技術。怎麼樣,聽了是不是很心動?最後扯一下,前端時間非常火熱Google大腦技術和百度深度學習研究院,都是跟深度學習相關的。

  下圖是一個深度學習(右)與傳統技術(左)的對比,可以看出深度學習對於資料的分類能力的優勢。

圖2 深度學習(右)與PCA技術(左)的對比

 

  總結一下:開發一個車牌識別系統可以讓你瞭解最新的時勢---大資料的內涵,同時,也有機遇讓你瞭解最新的人工智慧技術---深度學習。因此,不要輕易的小看這門技術中蘊含的價值。

  好,談價值就說這麼多。現在,我簡單的介紹一下EasyPR的具體過程。

  在上一篇文件中,我們瞭解到EasyPR包括兩個部分,但實際上為了更好進行模組化開發,EasyPR被劃分成了六個模組,其中每個模組的準確率與速度都影響著整個系統。

  具體說來,EasyPRPlateDetectCharsRecognize各包括三個模組。

  PlateDetect包括的是車牌定位,SVM訓練,車牌判斷三個過程,見下圖。

圖3 PlateDetect過程詳解 

  通過PlateDetect過程我們獲得了許多可能是車牌的圖塊,將這些圖塊進行手工分類,聚集一定數量後,放入SVM模型中訓練,得到SVM的一個判斷模型,在實際的車牌過程中,我們再把所有可能是車牌的圖塊輸入SVM判斷模型,通過SVM模型自動的選擇出實際上真正是車牌的圖塊。

  PlateDetect過程結束後,我們獲得一個圖片中我們真正關心的部分--車牌。那麼下一步該如何處理呢。下一步就是根據這個車牌圖片,生成一個車牌號字串的過程,也就是CharsRecognisze的過程。

  CharsRecognise包括的是字元分割,ANN訓練,字元識別三個過程,具體見下圖。

 

 圖4 CharsRecognise過程詳解

  在CharsRecognise過程中,一副車牌圖塊首先會進行灰度化,二值化,然後使用一系列演算法獲取到車牌的每個字元的分割圖塊。獲得海量的這些字元圖塊後,進行手工分類(這個步驟非常耗時間,後面會介紹如何加速這個處理的方法),然後喂入神經網路(ANN)的MLP模型中,進行訓練。在實際的車牌識別過程中,將得到7個字元圖塊放入訓練好的神經網路模型,通過模型來預測每個圖塊所表示的具體字元,例如圖片中就輸出了“蘇EUK722”,(這個車牌只是示例,切勿以為這個車牌有什麼特定選取目標。車主既不是作者,也不是什麼深仇大恨,僅僅為學術說明選擇而已)。

  至此一個完整的車牌識別過程就結束了,但是在每一步的處理過程中,有許多的優化方法和處理策略。尤其是車牌定位和字元分割這兩塊,非常重要,它們不僅生成實際資料,還生成訓練資料,因此會直接影響到模型的準確性,以及模型判斷的最終結果。這兩部分會是作者重點介紹的模組,至於SVM模型與ANN模型,由於使用的是OpenCV提供的類,因此可以直接看openCV的原始碼或者機器學習介紹的書,來了解訓練與判斷過程。

  好了,本期就介紹這麼多。下面的篇章中作者會重點介紹其中每個模組的開發過程與內容,但是時間不定,可能幾個星期發一篇吧。

  最後,祝大家國慶快樂,闔家幸福!

 

 

 

 

 

相關文章