超讚!PaddleOCR在國產麒麟系統中的離線綠色部署

饶玉田發表於2024-08-27

一、背景

在信創(資訊科技應用創新)背景下,OCR(Optical Character Recognition,光學字元識別)技術的需求日益增長,主要體現在以下幾個方面:

首先,隨著國家信創戰略的推進,自主可控和資訊保安成為關鍵議題。OCR技術作為資訊科技的重要組成部分,其國產化、自主可控的需求日益迫切。這要求OCR技術必須適配國產作業系統、硬體裝置及CPU、GPU等核心元件,以確保資料安全和資訊科技的自主可控。

其次,OCR技術在各行業的應用場景不斷擴充。在文件處理領域,OCR技術可以快速將紙質文件轉換為電子文件,實現文件的數字化、編輯、儲存和傳輸,提升工作效率。在影像分析領域,OCR技術能夠識別影像中的文字資訊,輔助人們更好地理解和分析影像內容。在智慧搜尋領域,OCR技術將影像中的文字資訊轉換為可搜尋的文字資料,為人們提供更加便捷、精準的搜尋體驗。

再次,隨著數字化轉型的加速,各行業對自動化、智慧化處理的需求不斷提升。OCR技術以其高效、準確的文字識別能力,在金融、醫療、物流等多個領域得到廣泛應用,幫助企業提高業務處理效率和準確性。

最後,隨著深度學習、人工智慧等技術的快速發展,OCR技術的識別準確率和效率得到顯著提升。針對複雜背景、模糊文字、手寫字型等難點問題,OCR技術不斷最佳化,提高了識別的精度和穩定性,進一步滿足了使用者的多樣化需求。

綜上所述,在信創背景下,OCR技術的需求不斷增長,其國產化、自主可控、高效準確的特點使其在各行業的應用前景廣闊。

二、國產麒麟作業系統

銀河麒麟桌面作業系統V10 SP1是一款基於Linux開發的圖形化桌面作業系統,由麒麟軟體有限公司釋出,旨在滿足國產軟硬體平臺的需求,並實現了多項技術突破和最佳化。以下是對該系統的詳細簡介:

系統概述

  • 開發背景:銀河麒麟桌面作業系統是在“863計劃”和國家科技重大支援下,由中國國防科技大學研發,後由天津麒麟和上海中標軟體有限公司合併而成的麒麟軟體有限公司繼續開發和維護。
  • 版本更新:V10 SP1是銀河麒麟桌面作業系統的加強版,於2021年10月27日正式釋出,針對中國網信產業轉型升級的實際需求,以及雲端計算和移動網際網路進一步普及的產業大勢下,進行了全面升級。

系統特點

  1. 多平臺支援
    • 系統實現了同源支援飛騰、龍芯、申威、兆芯、海光、鯤鵬等自主CPU及x86平臺,提供廣泛的硬體相容性。
    • 新增了對龍芯3A6000、飛騰D3000、兆芯KX-7000等處理器的支援,以及709 GP201、芯瞳GB2062等顯示卡和蘇州速通SCM26205無線網路卡的支援。
  2. 使用者體驗
    • 提供類似Win 10風格的使用者介面,操作簡便,上手快速。
    • 在國產平臺的功耗管理、核心鎖及頁複製、網路、VFS、NVME等方面進行了最佳化,系統載入迅速,穩定性和效能大幅提升。
    • 桌面環境改進,包括最佳化檔案管理器、工作列、賬戶管理、登入、網路、聲音、顯示和觸控等功能,提升使用者體驗。
  3. 生態相容性
    • 精選數百款常用軟體,同時相容支援2000餘款安卓應用,補全了Linux生態應用短缺的短板。
    • 與數千家合作伙伴攜手,實現適配認證的軟硬體生態產品從一萬餘款迅速突破十萬款,涵蓋了桌面辦公、影音娛樂、工控設計、網路安全、協同管理、行業軟體等幾乎所有門類。
  4. 安全性
    • 作為國內外首款實現具有內生安全體系的作業系統,銀河麒麟V10 SP1創新研發了外來程式碼主動防禦技術和資料保護技術,自研KYSEC安全機制,採用內外一體化安全體系,提供集中安全管控,實現從核心到應用的多維度安全保護。
    • 支援崑崙韌體安全啟動,最佳化防火牆規則命名,升級Kysec至v1.5版本,進一步提升系統安全性。
  5. 易用性
    • 提供輕量級桌面,易操作、上手快。
    • 創新基於外掛模式實現系統主題、桌面、工作列、開始選單等桌面元件的並行載入。
    • 系統介面增加可自由切換的夜間模式以保護視力,並加入雲賬戶功能,實現應用軟體和系統的一鍵同步。
  6. 新功能和特性
    • 支援蒙古文和繁體語言,應用可選擇不同裝置播放聲音,支援色溫自動調節,
    • 系統安裝和桌面環境修復了多項問題,提升了系統的穩定性和可靠性。

應用領域

銀河麒麟桌面作業系統V10 SP1憑藉其卓越的效能和創新的功能,廣泛應用於政府、金融、教育、財稅、公安、審計、交通、醫療、製造等多個領域,為使用者提供安全、流暢、個性化的作業系統體驗。同時,該系統也支援工業自動化領域的工控機,助力企業實現數字化轉型和升級。

綜上所述,銀河麒麟桌面作業系統V10 SP1是一款功能強大、安全可靠的國產作業系統,能夠滿足不同使用者在不同場景下的需求。

三、PaddleOCR在麒麟系統中的綠色部署

首先麒麟官方網站下載相關的作業系統映象,使用虛擬機器安裝銀河麒麟桌面作業系統V10 SP1。選擇試用銀河麒麟作業系統,然後進入到桌面。

複製PaddleOCR_Linux_4.4.0綠色檔案包到麒麟作業系統桌面內。

離線綠色部署包內包含OCR的模型檔案,以及所有的.so依賴庫。一個由.net6.0編譯的呼叫OCR示例控制檯程式。

啟動命令:

LD_LIBRARY_PATH=./lib ./ConsoleAppNET

也可以執行run.sh檔案,

效果如下:

perfect

離線、綠色、高效能、極簡部署OCR

.net示例極簡程式碼,僅一行即可

Console.WriteLine(new PaddleOCRSharp.PaddleOCREngine().DetectText("test.jpg").Text);



四、PaddleOCR介紹

PaddleOCRSharp 是一個基於百度飛槳PaddleOCR的開原始碼修改並最佳化的.NET版本OCR可離線使用類庫。專案核心元件PaddleOCR.dll,由C++編寫,根據百度飛槳PaddleOCR的C++程式碼修改並最佳化而成。目前已經支援C++、.NET、Python、Golang、Rust等眾多開發語言的直接API介面呼叫。專案包含文字識別、文字檢測、表格識別功能。本專案針對小圖識別不準的情況下做了最佳化,同時做了其他最佳化,比飛槳原始碼識別準確率有所提高,速度更快。包含總模型僅8.6M的超輕量級中文OCR,單模型支援中英文數字組合識別、豎排文字識別、長文字識別。同時支援中英文、純英文以及多種語言文字檢測識別。

PaddleOCRSharp封裝極其簡化,實際呼叫僅幾行程式碼,極大的方便了中下游開發者的使用和降低了PaddleOCR的使用入門級別,同時提供不同的.NET框架使用,方便各個行業應用開發與部署。Nuget包即裝即用,可以離線部署,不需要網路就可以識別的高精度中英文OCR。

本專案支援官方所有公開的通用OCR模型,PPOCRV2、PPOCRV3、PPOCRV4。

★windows系統支援:win7SP1、win10、win11、winserver2012R2、winserver2016、winserver2019、winserver2022等

★linux系統支援(付費支援):統信UOS、麒麟、ubuntu等。

支援智慧標註

視覺化訓練工具

五、結束語

PaddleOCR部署採用C++編碼,具有以下特點:

高效能:

PaddleOCR基於PaddlePaddle深度學習框架,後者具有強大的計算效能和高效的平行計算能力。這使得PaddleOCR能夠快速處理大規模的文字識別任務,尤其適用於需要高速處理大量影像資料的場景。

透過C++的部署方案,PaddleOCR能夠進一步利用C++的高效能特性,最佳化記憶體管理和計算效率,從而提升整體效能。

多功能性:

PaddleOCR支援多種文字識別任務,包括文字檢測、文字識別、場景文字識別等。這些功能透過C++的部署方案同樣可以得到支援,滿足不同場景下的文字識別需求。

此外,PaddleOCR還支援多種語言和手寫體的識別,進一步擴充套件了其應用場景。

易用性:

PaddleOCR提供了簡潔易用的API介面,方便開發者在C++環境中快速部署和使用OCR功能。

同時,PaddleOCR還提供了詳細的文件和示例程式碼,幫助開發者快速上手並進行二次開發。

開源免費:

PaddleOCR是開源專案,其程式碼和模型都可以免費獲取和使用。這意味著開發者可以根據自己的需求自由修改和定製PaddleOCR,以滿足特定的應用場景。

支援定製化和擴充套件:

開發者可以根據自己的需求選擇合適的PaddleOCR模型,並進行定製化和擴充套件。例如,可以透過訓練自己的模型來最佳化特定場景下的識別效果。

此外,PaddleOCR還支援多種後端和前端技術的整合,方便開發者將其嵌入到自己的應用系統中。

透過結合PaddlePaddle深度學習框架的強大功能和C++的高效能特性,PaddleOCR能夠為使用者提供高效、準確、易用的OCR解決方案。

歡迎掃碼關注微信公眾號,或者加入QQ群,瞭解更多內容。

相關文章