LateXML改善LaTeX生成的PDF檔案可讀性

Isakovsky發表於2024-12-10

原文網址 : https://www.cnblogs.com/isakovsky/p/18597153

PDF,作為一款由Adobe公司開發的文件格式,其優點是,能保證佈局在不同的作業系統和裝置上保持一致,所見即所得

它的缺點是,餘下全部(癱

PDF檔案只儲存了格式資訊,完全丟失了原始檔的結構化資訊,編碼不統一,二進位制和字串混放,匯出為PDF的效果基本和PSD檔案全圖層合併的效果差不多,導致所有試圖對PDF進行自動化處理的嘗試都極為困難.(當然,在視覺大模型得到發展的今天,這個問題已經大大緩解)

以下是一個經典的例子:

LateXML改善LaTeX生成的PDF檔案可讀性

幸運的是,arxiv上釋出的文章一般提供其Tex原始檔,我們可以使用LateXML(顧名思義,就是將Latex輸出為標記語言的形式)編譯改善其可讀性.

下載地址:https://math.nist.gov/~BMiller/LaTeXML/get.html#windows.chocolatey

專案提供了Windows版的Releases,但需要透過包管理工具Chocolatey或Strawberry進行安裝,我不太會,所以以Ubuntu為例

sudo apt-get install latexml

在arxiv上下載tar.gz格式的原始碼

LateXML改善LaTeX生成的PDF檔案可讀性

解壓檔案

tar -zxvf arXiv-xxxx.xxxxx.tar.gz

進入解壓資料夾後使用命令編譯:

 latexmlc --dest=out.html main.tex

效果其實還行

LateXML改善LaTeX生成的PDF檔案可讀性

LaTeX 生成黑底白字的 PDF
2024-05-24
DocTemplateTool - 可根據模板生成word或pdf檔案的工具
2023-11-07
Latex 生成的PDF增加行號左右兩邊
2020-10-18
LWN 372384: 改善檔案預讀（readahead）
2019-01-25
Java 根據模板生成 PDF 檔案以及 excel 檔案
2024-09-02
JavaExcel
「pdf檔案閱讀器」PDF Reader Pro 2.8.19.1
2022-11-20
sql生成可讀性邏輯圖
2021-05-28
SQL
Spring原始碼：使用Thymeleaf生成PDF檔案
2020-05-24
Spring原始碼
使用dompdf/dompdf實現生成pdf檔案
2022-12-20
【Vue 實踐】頁面生成 pdf 檔案-01
2019-03-26
Vue
spring boot itextPdf根據模板生成pdf檔案
2019-01-19
Spring Boot
Java 渲染 docx 檔案，並生成 pdf 加水印
2018-08-15
Java
Latex公式匯出word，Latex轉換MathML使用POI匯出公式可編輯的Word檔案
2022-02-21
公式
讀取本地Excel檔案生成echarts
2020-12-07
ExcelEcharts
Python如何生成windows可執行的exe檔案
2019-02-16
PythonWindows
免費的PDF檔案閱讀器推薦：PDF Reader mac中文版
2021-01-18
Mac
Python生成器讀取大檔案
2018-10-29
Python
Java 讀取txt檔案生成Word文件
2021-12-03
Java
C語言判斷檔案是否存在，判斷檔案可讀可寫可執行
2018-09-15
C語言
【odoo】【知識點】生成pdf檔案時缺少樣式的問題
2021-08-13
Odoo
word檔案怎樣取消只讀模式把只讀檔案轉化為可編輯檔案
2022-03-07
模式
讀資料保護：工作負載的可恢復性04備份與檔案
2024-12-05
負載
Qt使用綠色pdf閱讀器開啟檔案
2024-09-10
QT
C# 讀取txt檔案生成Word文件
2022-01-28
C#
光流.flo檔案生成.png圖片(可批量)
2018-04-15
怎麼把pdf檔案縮小？如何使用PDF Expert壓縮pdf檔案大小？
2021-11-09
PDF檔案轉換為DWF檔案
2022-02-11
pdf檔案太大如何變小減小pdf檔案大小最簡單的方法
2022-04-26
Linux檔案讀、寫、執行許可權
2022-06-14
Linux
PDF Squeezer - PDF Toolbox for Mac(PDF檔案工具箱)
2022-05-06
Mac
一款免費使用的PDF檔案批次合併工具，可操作pdf檔案順序，按順序合併pdf檔案。
2022-01-27
一款免費使用的PDF檔案批量合併工具，可操作pdf檔案順序，按順序合併pdf檔案。
2022-01-27
PDF檔案批次列印工具：BatchOutput PDF for Mac
2023-12-29
BATMac
pdf檔案搜尋工具：PDF Search Mac
2022-03-27
Mac
BatchOutput PDF ——批量自動列印PDF檔案
2021-10-18
BAT
PDF檔案搜尋工具PDF Search for Mac
2022-07-22
Mac
PDF Search for Mac(pdf檔案搜尋工具)
2022-07-18
Mac
強大的PDF檔案壓縮工具：PDF Squeezer for Mac
2024-01-29
Mac

LateXML改善LaTeX生成的PDF檔案可讀性

相關文章