可識別影象中100種人類語言文字的純Javascript OCR庫包:​​​​​​​Tesseract.js

banq發表於2019-12-21

Tesseract.js是流行的Tesseract OCR引擎的純Javascript引擎。

該庫支援100多種語言,自動文字定向和指令碼檢測,用於讀取段落,單詞和字元邊界框的簡單介面。Tesseract.js可以在任何瀏覽器中執行,並在伺服器上的NodeJS

在GitHub上檢視示例程式碼和API文件

支援影象中中文識別。點選標題見原文中文demo.

 

相關文章