達觀OCR首創無錨點文字提取演算法,攻克行業難點

達觀資料DataGrand發表於2022-02-18
lQLPDhspQpU0cCbNAczNBDiwZp7WMcaK88sCFEYSWwCXAA_1080_460

達觀OCR平臺基於自主研發的視覺技術,結合知識增強的跨模態語義理解關鍵技術,提供 影像矯正、影像分割、版面標籤分類、文字識別、資訊扣取、文件比對、表格識別、文字過濾、資訊稽核、文字二次加工等一整套全流程OCR模型定製與應用能力。

多語言識別

達觀自研OCR支援包括中文、英文、繁體中文、日語、韓語、德語、法語、西班牙語在內的 數十種語言識別。

lQLPDhspQpjH94fNAd7NBDiwV1TD_5Bv0i0CFEYYkkDiAA_1080_478

文件理解

文件智慧是文件資訊識別與處理最重要的環節。達觀OCR基於百萬級文件資料預訓練跨模態理解模型,借鑑人類閱讀理解方式,綜合文字、佈局和影像資訊、 讓計算機像人一樣理解文件版面佈局、語義資訊

lQLPDhspQpvC6C3NAlvNA26wpeGscw163nACFEYdZACaAA_878_603

資訊抽取

達觀OCR採用機器學習來讀取和處理任何型別的文件,可以精確地提取文字、手寫字、表格和其他資料,無需人工干預,快速自動處理文件。無論是自動信貸審批單還是財務報銷發票,都可在 數秒內完成關鍵資訊提取,此外還可以新增人工稽核,對模型提供監督,並對敏感資料執行稽核。

lQLPDhspQp691ivNAiLNBDiwGi74YOfOAIoCFEYiXoCXAA_1080_546

表格識別

複雜表格識別一直是行業難點。各種文件表格樣式不一、排版極為複雜。為此,達觀OCR表格識別演算法採用空間位置關係特徵結合語義資訊,快速定位表格位置、還原表格結構、迴圈抽取重要資訊、輸出結構化表格資料。

lQLPDhspQqG4x6jNAgHNBDiwSj_nKhVyW4YCFEYnSMDiAA_1080_513

手寫文字識別

達觀自研OCR支援對圖片中的手寫中文、手寫數字進行檢測和識別,針對 不規則的手寫字型進行專項優化識別,確保識別精度。

lQLPDhspQqQbIr3NAp_NBDiwXqPdDwFh9CQCFEYreQCaAA_1080_671

零門檻自主建模

達觀OCR 首創 無錨點文字提取演算法,支援 視覺化拖拽建模,無需人工版式配置或程式碼開發,滑鼠拖拽即可訓練模型。模型可自動對影像拍照扭曲透視、二次列印偏移等情形進行矯正識別,自適應 多種變化樣式,1個模型即可覆蓋,無需考慮同種票 據的多種變化。

lQLPDhspQqcWEHLNAZ7NA36w8xBYWMd4RMQCFEYv1cCXAA_894_414

OCR將影像文件上的資料轉變成可由計算機識別理解的結構化資料,有效搭建知識橋樑,構建業務應用。達觀OCR已服務於銀行、證券、保險、汽車製造、醫藥等眾多頭部客戶,每年產生數以億級有效資料,為客戶有效降本增效、防範風險、創造多元業務價值。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69997703/viewspace-2856301/,如需轉載,請註明出處,否則將追究法律責任。

相關文章