開源自己編寫的半人工標註平臺PaddleOCRLabel（.NET Winform版本）

包建強發表於2021-09-14

原文網址 : https://www.cnblogs.com/Jax/p/15268134.html

大家好，

我是部落格園的老使用者了，許久不做.NET技術了，從2013年起，開始從事App技術，寫過書，在Linux上搭建區塊鏈，用GO寫智慧合約，使用nodejs搭建過微服務，用python寫過爬蟲，寫過微信聊天機器人。

人到中年，已經寫不出20多歲時意氣風發的激揚文字了。

最近開始從事歷史類工具的開發，以及人工智慧，尤其是OCR技術，又重拾C#和winform的老本行，做了一個半人工標註平臺PaddleOCRLabel，在gitee上開源，地址是：https://gitee.com/BaoJianQiang/paddle-ocrlabel

寫這個軟體只用了一週時間，很多遺忘的技術，上網搜一下，改一改程式碼，基本就能為我所用。寫了17年程式碼了，這是最直接的體會。

再比如說，要做一個操作回滾的功能，用命令模式或備忘錄模式，也是得心應手，這也是08年開始研究設計模式的成果。

比較感慨的是，.NET生態真的不是很繁榮。舉一個例子，我這個軟體裡面要做類似於PhotoShop的圈鎖和浮層，竟然找不到好用的第三方庫，只能直接使用最原始的GDI+繪製，效果不是很理想。我隱約記得有個.NET仿照PS做的Paint.NET開源專案，竟然官網已經不提供下載了。只能去一些網站付費下載，開啟才發現是很早的版本，現在的VisualStudio根本打不開。

再聊聊我步入ai這個大舞臺的初步感受，我至今也沒入門這個領域，只是機械性的知道tensorflow和pytorch搭建模型的那些程式碼，但是對於文字和影像轉變成數字矩陣然後大量訓練就能得到結果，還是摸不著頭腦。

看一下這個開源專案的介面吧，如下圖所示：

這個軟體哦，其實還沒全做完，因為要和百度paddleocr合作，所以只能使用百度的服務。

接下來，會在此基礎上，開發出更強大的一個專案，掃描一張圖片，同時從騰訊、百度、阿里、科大訊飛這幾家公司的ocr服務，返回標註結果，供使用者選擇，這就是商用軟體了。

此外，我上個月還寫了一個一鍵生成的工具，可以把pdf直接轉換為ocr識別後的文字，軟體介面如下圖所示，過段時間我也會開源出來：

我的一個長期願景是整理古籍，把古籍中的文字蒐集為一個很大的歷史資料庫，支援全文索引，如下圖所示(只擷取了兩晉十六國和民國的截圖，想看其他朝代的可以私聊)，是我花了一年時間做的一個軟體，通過這個內容類收集軟體，可以快速把歷朝歷代的人物的傳記文章歸類，可以快速閱讀完一個朝代的歷史，這是我的初衷：

把這些工具結合在一起，就是一個非常牛逼的紙質書籍轉文字的一攬子解決方案。我主要針對古籍，因為這塊沒有版權的問題。

最後，因為我們們這個技術社群做.NET的人多一些，所以希望各位winform繪圖高手，以及python多執行緒高手，有興趣可以參與到我這個開源專案中來。

謝謝

推薦一款 .NET 編寫的嵌入式平臺的開源模擬器--Renode
2022-11-26
.NET6 平臺系列4 .NET開源之路
2021-04-27
C/S框架網介紹|.NET快速開發平臺|Winform開發框架
2019-01-05
框架ORM
詳解成熟的資料標註工具—智慧標註平臺
2023-01-09
C#Winform快速開發平臺與軟體配置平臺
2019-01-05
C#ORM
IoTSharp：基於 .NET 8.0 的開源物聯網平臺
2024-08-22
4個.Net跨平臺圖形開源庫
2024-05-08
.NET平臺系列8 .NET Core 各版本新功能
2021-05-25
java和.net 雙語言開發框架，開源的PaaS平臺
2020-09-29
Java框架
.NET 開源免費圖表元件庫，Winform,WPF 通用
2021-11-26
元件ORM
.NET探索平臺條件編譯
2021-01-17
編譯
開源GTKSystem.Windows.Forms框架讓C# winform支援跨平臺執行
2024-07-08
WindowsORM框架C#
方舟編譯器開源，華為自家開源平臺面世！（附編譯過程）
2020-04-06
編譯
專業資料標註公司和智慧資料標註平臺
2023-01-16
ASP.NET Core 修改開源協議為MIT，.NET全平臺 MIT協議開源了
2021-08-25
ASP.NET協議MIT
Uber 宣佈開源 Plato 人工智慧對話平臺
2019-07-19
人工智慧
開始編寫自己的技術部落格...
2018-05-07
編寫自己的 TypeScript CLI
2022-02-09
TypeScript
基於 Github 平臺的 .NET 開源專案模板. 嘎嘎實用!
2023-04-26
Github
WinForm 開源元件 Realtiizor
2024-12-08
ORM元件
ffmpeg iOS平臺編譯指令碼註釋
2018-07-07
iOS編譯指令碼
.NET平臺系列30：.NET Core/.NET 學習資源彙總
2021-06-18
.NET開源、功能強大、跨平臺的圖表庫 - LiveCharts2
2024-05-07
Echarts
基於.NET 5實現的開源通用許可權管理平臺
2021-03-30
locutus：用Rust編寫的去中心化平臺
2022-04-19
Rust中心化
從0開始搭建自己的直播平臺
2024-11-05
Swift編寫的EOS開源框架SwiftyEOS
2018-11-28
Swift框架
寫給小白的開源編譯器
2022-05-18
編譯
基於Asp.Net Core 5.0依賴Quartz.Net框架編寫的任務排程web管理平臺
2021-01-20
ASP.NETquartz框架Web
開源工具、平臺列表
2018-11-16
開源工具
一個基於.NET Core開源、跨平臺的倉儲管理系統
2023-11-26
Share Creators人工智慧資源管理探索平臺
2021-10-13
人工智慧
Share Creators 人工智慧資源管理探索平臺
2021-10-09
人工智慧
三個月寫了個簡訊平臺，開源出來！
2023-11-26
.NET平臺系列31：.NET團隊送給.NET開發人員的雲原生學習資源彙總
2021-06-19
情景智慧平臺：多模態一體化人工智慧開源框架
2020-10-19
人工智慧框架
編寫註冊介面
2020-11-02
編寫自己的Babel外掛（一）
2018-12-04
Babel

開源自己編寫的半人工標註平臺PaddleOCRLabel（.NET Winform版本）

相關文章