達觀OCR文字識別賦能公積金中心實現業務辦理再提速

達觀資料DataGrand發表於2021-10-19
隨著智慧政務理念的提出,利用先進的AI技術和手段提高政府部門在辦公、監管、服務和決策等多方面的智慧化水平已經成為大家的共識。而OCR作為成熟且落地應用多的AI技術,是眾多智慧政務業務系統的重要底層支撐元件。只有 應用識別精度高、速度快的OCR平臺才能 讓智慧政務系統的業務審批再提速,從而使人民群眾辦理自助辦理審批業務時更加便捷化和無感化。

公積金1

以某一線城市公積金中心業務為例,在申辦和審批業務中的貸款、歸集和處罰業務流程中需要識別身份證、結婚證、銀行卡、公積金提取申請表、貸款合同、規劃許可證等多類文件的多種關鍵資訊。前端業務人員接收到的申請資料五花八門,且不同型別文件的樣本質量參差不齊,對識別模型的準確率影響很大。

達觀智慧OCR 平臺可從同類文件不同樣本中分析共性、提取特徵,從而獲得高精度的識別模型。獨創的多模態資訊識別可從文字佈局、文字語義、字型形式、周邊特徵詞等因素去識別提取樣本中的關鍵資訊,實現了OCR+CV+NLP的完美結合。

以不動產登記證明為例:

1、 透過版面分析,將一張圖片自動切分為兩頁,預處理使得識別效果大幅上升;

2、 透過文字語義分析,將切分好的內容歸入“不動產登記證明”型別的文件,自動選擇相應的識別模型進行識別抽取,抽取;

3、 透過字型形式、表格識別,“理解”文字、分辨出標題、落款、蓋章、編號以及表格內的重要資訊。

公積金

對於證照中的印章,達觀自研有強大的 印章文字識別技術,可快速找到文件中的所有印章並精準識別其中的文字,對文件中是否有印章、印章是否正確作雙重驗證。 目前可處理的包括紅章、黑章、圓章、方章、橢圓章、三角章等。

公積金3

圖:印章識別技術示例

目前達觀在某一線城市公積金中心已完成 18類文件、100多個關鍵資訊的智慧識別和提取, 有效減少前端業務人員的錄入工作、加快了業務辦理速度。此外,文件識別與抽取最佳化了業務流轉方式,實現了無紙化、智慧化、線上化的業務辦理,市民群眾辦理公積金業務時已不再必須跑線下網點取號排隊辦理、加快了全市的公積金業務的審批速度。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69997703/viewspace-2838108/,如需轉載,請註明出處,否則將追究法律責任。

相關文章