達觀OCR,影像文字抽取演算法平臺滿足業務場景快速定製

達觀資料DataGrand發表於2022-01-14

——全新OCR平臺: 表格、海外發票、財務單據、機構文件一鍵結構化

人工智慧在當下已經不再是新潮的概念,在下一代技術躍進出現之前,業務場景的落地比讓人眼花繚亂的技術名詞更具備現實價值。對於大部分企業客戶,業務部和技術部之間的相互依賴關係共同促進了技術在內部的使用,業務需求和技術能力相輔相成。OCR技術能夠把光學文字轉變為計算機字元,但對於文字和資料處理工作,將紙質文件上的資料透過人工智慧技術變成計算機結構化資料,則能更有效地搭建知識橋樑,將人力從重複的人工錄入轉移到非重複的資料分析,產生更深層次的業務價值。

lQLPDhsNxehYVbXNAczNBDiwFsDgv-m8o7AB5z0vXsDJAA_1080_460
達觀OCR平臺基於機器學習和深度學習技術研發,在易用的前提下實現了高準確率的 資料抽取,助力企業各類單據的 高效錄入
lQLPDhsNxkvigwDNAwvNBDiwvbC5KnalnLEB5z3SYMBTAA_1080_779

達觀OCR平臺基於領先的視覺技術、跨模態語義理解技術開發,利用海量的影像、文件訓練出底層模型。進一步擴充套件業務定製能力,為企業提供強大的視覺基礎模型以及一整套視覺任務定製與應用能力。包括基礎模型訓練、結構化識別訓練、場景分類識別訓練、版面分割識別訓練等演算法單元。

抽取模組

整合多種達觀自研演算法,以極低的學習成本,讓非技術業務員快速上手,快速應用抽取功能,將單據錄入工作簡化為結果校對工作,數倍提高原有工作效率。

lQLPDhsNxl0rj9bNASXNA62wKIbyqtlxip4B5z3u7UBTAA_941_293

  1. 內建模型抽取;整合自研的標準化識別產品,包括多種 小語種識別和數十種常見卡證抽取。

  2. 模版抽取-簡單易用的模版標註;採用 多種標註方式,支援錨點和無錨點標註,快速準確抓取目標資訊。

  3. 模型抽取;應用最新多模態和整合演算法,表現出高魯棒性和良好的泛化性。

  4. 分類器識別;分類器作為一個平臺功能的技術定義,在實際使用中對應我們的業務流場景,實現的功能是對打包或批次上傳的單據資料完成自動分類抽取,並進一步定義稽核校驗等業務屬性。透過定義分類規則或訓練專研的分類器模型,關聯對應抽取文件,構成一個分類器識別單元。常見的業務流諸如銀行開 戶業務流、企業資質審查業務流等。

抽取結果展示

lQLPDhsNxmFXrKTNAibNA-iw2r6bcKMdYCAB5z31owBrAA_1000_550

lQLPDhsNxmTrNTrNAgLNA-iwqvLqdsb1gzAB5z379kBTAA_1000_514

lQLPDhsNxmkXUiHNAerNA-iwYGw3elhzZfcB5z4CtMBTAA_1000_490

基礎模型模組

基礎模型模組包括功能豐富的標註模組和底層OCR模型訓練評估模組,滿足底層模型的標註和訓練需求。

lQLPDhsNxmyq2BTNAYTNAmuwcdU22_nWfQ4B5z4IJMBrAA_619_388

  • 資料標註模組:支援文字標註和版面標籤標註,透過機器預標註-人工修改的方式極大提高了標註效率,滿足定製化場景的真實資料快速迭代。

  • 資料生成模組:能夠透過靈活定義版式、字元、內容等來實現生成資料擴充套件,以滿足模型訓練的資料需求。

  • OCR基礎模型訓練:支援檢測、識別、版面分析等型別的模型訓練功能,能夠從標註或生成資料靈活切分,自由編排訓練策略。底層基於達觀自研演算法調優,透過流程化配置完成底層模型的訓練。

許可權模組

許可權模組設計了一套角色、使用者、組結構的許可權系統,滿足靈活的許可權配置和資料管理需求。

目前達觀OCR平臺已經賦能銀行、券商、報關、製造業、電商等多個行業的頭部客戶,為其降低大規模抽取任務的定製門檻和抽取成本,節約企業人力資源,提高工作流效率,提升使用者體驗。

市場上的人工智慧產品琳琅滿目,我們希望產品的使用價值高於技術噱頭,達觀OCR平臺從積累的無數客戶場景和需求中孵化而出,以產生使用價值為驅動,助力企業搭建繁重紙質資料的數字化橋樑,走上降本增效的高速路。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69997703/viewspace-2852223/,如需轉載,請註明出處,否則將追究法律責任。

相關文章