開源自己編寫的半人工標註平臺PaddleOCRLabel(.NET Winform版本)

包建強發表於2021-09-14

大家好,

我是部落格園的老使用者了,許久不做.NET技術了,從2013年起,開始從事App技術,寫過書,在Linux上搭建區塊鏈,用GO寫智慧合約,使用nodejs搭建過微服務,用python寫過爬蟲,寫過微信聊天機器人。

人到中年,已經寫不出20多歲時意氣風發的激揚文字了。

最近開始從事歷史類工具的開發,以及人工智慧,尤其是OCR技術,又重拾C#和winform的老本行,做了一個半人工標註平臺PaddleOCRLabel,在gitee上開源,地址是:https://gitee.com/BaoJianQiang/paddle-ocrlabel

 

寫這個軟體只用了一週時間,很多遺忘的技術,上網搜一下,改一改程式碼,基本就能為我所用。寫了17年程式碼了,這是最直接的體會。

再比如說,要做一個操作回滾的功能,用命令模式或備忘錄模式,也是得心應手,這也是08年開始研究設計模式的成果。

比較感慨的是,.NET生態真的不是很繁榮。舉一個例子,我這個軟體裡面要做類似於PhotoShop的圈鎖和浮層,竟然找不到好用的第三方庫,只能直接使用最原始的GDI+繪製,效果不是很理想。我隱約記得有個.NET仿照PS做的Paint.NET開源專案,竟然官網已經不提供下載了。只能去一些網站付費下載,開啟才發現是很早的版本,現在的VisualStudio根本打不開。

再聊聊我步入ai這個大舞臺的初步感受,我至今也沒入門這個領域,只是機械性的知道tensorflow和pytorch搭建模型的那些程式碼,但是對於文字和影像轉變成數字矩陣然後大量訓練就能得到結果,還是摸不著頭腦。

 

看一下這個開源專案的介面吧,如下圖所示:

 

 

這個軟體哦,其實還沒全做完,因為要和百度paddleocr合作,所以只能使用百度的服務。

接下來,會在此基礎上,開發出更強大的一個專案,掃描一張圖片,同時從騰訊、百度、阿里、科大訊飛這幾家公司的ocr服務,返回標註結果,供使用者選擇,這就是商用軟體了。

 

此外,我上個月還寫了一個一鍵生成的工具,可以把pdf直接轉換為ocr識別後的文字,軟體介面如下圖所示,過段時間我也會開源出來:

 

 

 

我的一個長期願景是整理古籍,把古籍中的文字蒐集為一個很大的歷史資料庫,支援全文索引,如下圖所示(只擷取了兩晉十六國和民國的截圖,想看其他朝代的可以私聊),是我花了一年時間做的一個軟體,通過這個內容類收集軟體,可以快速把歷朝歷代的人物的傳記文章歸類,可以快速閱讀完一個朝代的歷史,這是我的初衷:

 

 

把這些工具結合在一起,就是一個非常牛逼的紙質書籍轉文字的一攬子解決方案。我主要針對古籍,因為這塊沒有版權的問題。

 

最後,因為我們們這個技術社群做.NET的人多一些,所以希望各位winform繪圖高手,以及python多執行緒高手,有興趣可以參與到我這個開源專案中來。

謝謝

 

相關文章