[免費下載應用]iNeuKernel.Ocr 影像資料識別與採集原理和產品化應用

iNeuOS工業網際網路系統發表於2022-02-10

目       錄

1..... 應用概述... 2

2..... 免費下載試用... 2

3..... 視訊介紹... 2

4..... iNeuLink.Ocr影像資料採集應用... 2

5..... 資料上傳到iNeuOS工業網際網路作業系統... 4

6..... Ocr基本概念... 7

1.   應用概述

  在工業、軍工或航天等領域,有些裝置及軟體系統比較陳舊,但是更換的成本比較高,在實驗或生產過程中不能夠完整的記錄資料,給資料應用和分析造成了很大的障礙,更無法解決實驗和生產人員的勞動強度

  通過OCR影像識別的技術可以很好的解決上述問題,但是沒有一個完整的產品化的軟體實現操作級應用。儘管OCR技術相對比較成熟,除特定應用場景使用外,普及使用率並不高。

  iNeuKernel.Ocr影像資料採集軟體,實現了實時自動獲得螢幕截圖或是應用程式截圖、動態增加資料識別標籤資訊、後臺任務自動切片採集資料以及實時轉發資料,與iNeuOS工業網際網路作業系統互聯互通,完整資料採集、傳輸、儲存、檢視建模、分析等應用過程。示意如下圖:

2.   免費下載試用

  連結:https://pan.baidu.com/s/1joGfBefaBKiFJ1l08N3KZg

  提取碼:v242

3.   視訊介紹

   視訊介紹:iNeuKernel.Ocr 影像資料識別與採集

4.   iNeuLink.Ocr影像資料採集應用

(1)執行的主介面,應用相對簡單。如下圖:

  (2)配置圖源,可以使用快捷鍵,全屏截圖或是程式截圖,以便定位資料標籤的座標的相對位置,進行資料提取。如下圖:

[免費下載應用]iNeuKernel.Ocr 影像資料識別與採集原理和產品化應用

  (3)增加或編輯識別標籤,單擊【資料識別】可以用紅色方框在圖源上標註要誤別的資料位置資訊,在【資料識別結果】中可以看到識別資料的結果,並且填寫資料標籤名稱。如下圖:

[免費下載應用]iNeuKernel.Ocr 影像資料識別與採集原理和產品化應用

  (4)轉發資料,可以把識別的資料結果轉發給其他系統,填寫站點編號、遠端IP、遠端Port轉發週期和是否啟用等資訊。如下圖:

5.   資料上傳到iNeuOS工業網際網路作業系統

  下載iNeuOS離線安裝包,安裝過程參見:一鍵部署。進入系統後,選擇桌面【裝置模型】,單擊左上角小加號圖示,增加一個新的裝置。選擇【服務例項】後面的【編輯】按鈕連結,配置【基本設定】和【Socket】,【Socket】預設偵聽埠為6699,其他資訊一般不需要修改,如下圖:

[免費下載應用]iNeuKernel.Ocr 影像資料識別與採集原理和產品化應用

     選擇配置好的【服務例項】,並且配置通訊型別、應用協議和選擇驅動等,配置如下圖:

[免費下載應用]iNeuKernel.Ocr 影像資料識別與採集原理和產品化應用

     選擇左上角旋轉圖示,會重新啟動後臺服務,應用當前配置好的資訊。硬體閘道器與iNeuOS平臺第一次通訊時會同步閘道器的裝置和資料點資訊,會在當前iNeuOS裝置驅動下生成子裝置,在子裝置上會有iNeuKernel硬體閘道器的資料點資訊。如下圖:

[免費下載應用]iNeuKernel.Ocr 影像資料識別與採集原理和產品化應用

    iNeuOS工業網際網路試用:試用地址

6.   Ocr基本概念

 (1)OCR的應用場景

   根據OCR的應用場景而言,我們可以大致分成識別特定場景下的專用OCR以及識別多種場景下的通用OCR。就前者而言,證件識別以及車牌識別就是專用OCR的典型案例。針對特定場景進行設計、優化以達到最好的特定場景下的效果展示。那通用的OCR就是使用在更多、更復雜的場景下,擁有比較好的泛性。在這個過程中由於場景的不確定性,比如:圖片背景極其豐富、亮度不均衡、光照不均衡、殘缺遮擋、文字扭曲、字型多樣等等問題,會帶來極大的挑戰。

 (2)OCR的技術路線

   典型的OCR技術路線如下圖所示:

   其中OCR識別的關鍵路徑在於文字檢測和文字識別部分,這也是深度學習技術可以充分發揮功效的地方。PaddleHub為大家開源的預訓練模型的網路結構是Differentiable Binarization+ CRNN,基於icdar2015資料集下進行的訓練。

   首先,DB是一種基於分割的文字檢測演算法。在各種文字檢測演算法中,基於分割的檢測演算法可以更好地處理彎曲等不規則形狀文字,因此往往能取得更好的檢測效果。但分割法後處理步驟中將分割結果轉化為檢測框的流程複雜,耗時嚴重。因此作者提出一個可微的二值化模組(Differentiable Binarization,簡稱DB),將二值化閾值加入訓練中學習,可以獲得更準確的檢測邊界,從而簡化後處理流程。DB演算法最終在5個資料集上達到了state-of-art的效果和效能。參考論文:Real-time Scene Text Detection with Differentiable Binarization

   下圖是DB演算法的結構圖:

 

 

  接著,我們使用 CRNN(Convolutional Recurrent Neural Network)即卷積遞迴神經網路,是DCNN和RNN的組合,專門用於識別影像中的序列式物件。與CTC loss配合使用,進行文字識別,可以直接從文字詞級或行級的標註中學習,不需要詳細的字元級的標註。參考論文:An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition

   下圖是CRNN的網路結構圖:

 


物聯網&大資料技術 QQ群:54256083
物聯網&大資料專案 QQ群:727664080
QQ:504547114
微信:wxzz0151
部落格:https://www.cnblogs.com/lsjwq
微信公眾號:iNeuOS
[免費下載應用]iNeuKernel.Ocr 影像資料識別與採集原理和產品化應用

相關文章