PyMuPDF框架學習(pdf文字處理)

凯子敏感吗?發表於2024-05-09

與其他框架的比較(優勢)

This documentation covers PyMuPDF v1.24.2 features as of 2024-04-17 00:00:01.

一、可以支援多種格式

二、這裡不知道是幹什麼的。

三、支援CJK、OCR

四、相容多種文件型別與之合併或寫入,以及提取和寫入PDF上的諸多種元素

二、實踐

一、在PDF的頁尾的文字會識別成亂碼。

二、提取文字的文字分隔符

三、提取圖片的程式碼含義

可以以圖片的形式儲存每一頁,也可以將圖片轉化為GUI物件引用的圖片型別

相關文章