潦草手寫體也能輕鬆識別,快速提取文字不用愁

HMSCore發表於2022-12-08

基於文字識別(OCR)技術的成熟與應用,日常生活中的大部分“印刷體識別”需求都能被滿足,替代了人工資訊錄入與檢測等操作,大大降低輸入成本。

而對於複雜的手寫體識別需求,業界識別質量卻參差不齊。大部分手寫體存在字跡潦草,排版不固定,背景複雜,且不同的字型風格各異等問題,給手寫體識別帶來極大的挑戰,不過華為HMS Core機器學習服務的OCR文字識別技術可以幫助解決識別問題。

華為HMS Core 機器學習服務基於OCR識別技術推出最新手寫體識別能力,使用拍照裝置將紙質資訊轉化為圖片,對圖片中橫排的手寫中文、英文、阿拉伯數字等符號進行檢測和識別,支援印刷體識別、手寫體識別、行間混排等,可以精準返回手寫體和印刷體的類別。同時,對字跡潦草、連筆等情況和試卷、書信等場景進行專項最佳化,識別準確率可達95%以上。

效果演示:

應用場景:

由於手寫體字跡的隨意性很大,如背景繁雜、字型大小不一、角度傾斜等,這些問題都有可能直接影響到字元的識別準確率。

基於此,HMS Core 機器學習服務透過海量樣本集訓練來提升其魯棒性,不管是淺色背景、田字格、米字格、四方格,還是在有下劃線的情況下,識別準確率均可達95%以上,同時支援45°傾斜字型的識別。

手寫體識別具有很強的實用性,可廣泛應用於試卷批改、筆記電子化、大規模的資料統計如人口普查、資訊登記等場景中。

1.智慧批改

使用手寫體識別技術,對學生日常作業、考試試卷中的手寫內容進行自動識別,實現學生作業、考卷的線上批改,大幅提升教師的工作效率和質量。

2.筆記電子化

針對紙質手寫文件、手寫筆記等內容,同時支援墨水屏識別,實現對手寫文字內容的掃描及儲存。

開發者只需整合手寫體識別服務,就可以將手寫紙質文件、筆記、發票等圖片中的文字轉換成文字格式,供文書處理軟體進一步編輯加工。有了它,即使是潦草、模糊的手寫資訊也能夠識別,可以有效解決人工錄入速度慢、易出錯的問題,從而大大節約時間成本,提高錄入效率。

總之,不管是印刷體,還是手寫體,HMS Core機器學習服務都能準確識別,開發者們可以根據自己的業務需求自主選擇。

瞭解更多詳情>>

訪問華為開發者聯盟官網
獲取開發指導文件
華為移動服務開源倉庫地址:GitHubGitee

關注我們,第一時間瞭解 HMS Core 最新技術資訊~

相關文章