在linux中使用 Pandoc 轉換檔案技巧
Pandoc 可以將 .docx、.odt、.html、.epub、LaTeX、DocBook 等格式互相轉換,或者轉換為其他格式,例如 JATS、TEI Simple、AsciiDoc 等。
是的,這意味著 Pandoc 可以將 .docx 檔案轉換為 .pdf 和 .html 檔案,但你可能會想:“Word 也可以將檔案匯出為 .pdf 和 .html。為什麼我需要 Pandoc 呢?”
嗯,本來呢,你這個說法也沒錯,但考慮到 Pandoc 可以轉換這麼多格式,它很可能成為你所有轉換任務的首選工具。例如,我們中的許多人都知道 Markdown 編輯器 可以將其 Markdown 檔案匯出為 .html。而使用 Pandoc 檔案也可以轉換為許多其他格式。
我很少將 Markdown 匯出為 HTML。我通常讓 Pandoc 來做這件事。
本文中,我會將 Markdown 檔案轉換成幾種不同的格式。我幾乎所有的寫作都使用 Markdown 語法,但我經常需要轉換為另一種格式:學校作業通常需要的 .docx 格式;我建立的網頁通常需要的 .html 格式;工作需要的 .epub 格式;傳單和講義需要的 .pdf 格式;甚至包括一個大學數字人文專案偶爾需要的 TEI Simple 格式。Pandoc 可以輕鬆處理所有這些格式,甚至更多。
首先,你需要 安裝 pandoc。此外,要建立 .pdf 檔案,還需要 LaTeX。我最喜歡的套件是 TeX Live。
注意:如果你想在安裝前試用 pandoc,這裡有一個線上試用頁面:。
Ubuntu 和其他 Debian 發行版的使用者可以在終端中輸入以下 :
sudo apt-get update sudo apt-get install pandoc texlive
請注意第二行,你將一次性安裝 pandoc 和 texlive。apt-get 支援你這樣做。不過,我建議你先去喝杯咖啡,因為這可能需要幾分鐘的時間。
安裝完成 pandoc 和 texlive 後,你就可以嘗試用它們來完成一些工作了!
該專案的示例文件將是一篇文章,該文章於 1894 年 12 月首次發表在《北美評論》上,標題為“如何擊退火車劫匪”。我將使用的 Markdown 檔案是前一段時間建立的,該文章的一個恢復專案的一部分(LCTT 譯註:這是篇一百多年前發表的文章,這是一個數字化“恢復”專案)。
我把這篇文章儲存為 how_to_repel_train_robbers.md,它位於我的 Documents 目錄下,名為 samples 的子目錄中。它在 Ghostwriter 中看起來是這樣的:
在 Ghostwriter 中檢視原始的 Markdown 檔案
我想建立此檔案的 .docx、.pdf 和 .html 版本。
首先,我將製作一個 .pdf 副本,因為我在安裝 LaTeX 包時遇到了些麻煩。
在 ~/Documents/samples/ 目錄中,我輸入以下,以建立一個 .pdf 檔案:
pandoc -o htrtr.pdf how_to_repel_train_robbers.md
上述命令將基於 how_to_repel_train_robbers.md 檔案,建立一個名為 htrtr.pdf 的檔案。我使用 htrtr 作為名稱的原因是:嗯,它比 how_to_repel_train_robbers 短。htrtr 其實是長標題中的單詞首字母排列。
這是 .pdf 檔案製作完成後的一個截圖:
在 Ocular 中檢視的轉換後的 PDF 檔案
接下來,我想建立一個 .docx 檔案。該命令與我用來建立 .pdf 的命令幾乎相同,它是:
pandoc -o htrtr.docx how_to_repel_train_robbers.md
很快,一個 .docx 檔案就建立好了。這是它在 Libre Writer 中的樣子:
在 Libre Writer 中檢視轉換後的 DOCX 檔案
我可能會想在網上釋出這個,所以再多一個支援網頁的格式也不錯。我將使用以下命令建立一個 .html 檔案:
pandoc -o htrtr.html how_to_repel_train_robbers.md
同樣,建立它的命令與前兩次轉換非常相似。這是該 .html 檔案在瀏覽器中的樣子:
在 Firefox 中檢視的轉換後的 HTML 檔案
讓我們再看看之前的命令。它們是:
pandoc -o htrtr.pdf how_to_repel_train_robbers.md pandoc -o htrtr.docx how_to_repel_train_robbers.md pandoc -o htrtr.html how_to_repel_train_robbers.md
這三個命令唯一不同的是 htrtr 後的副檔名。這提示你 pandoc 會依賴於你提供的輸出副檔名(來決定目標轉換格式)。
Pandoc 可以做的遠不止這裡完成的三個小轉換。如果你選擇使用一個首選格式編寫檔案,但時不時又需要將檔案轉換為另一種格式,pandoc 很大機率都能為你完成。
現在,既然你已經學會了,你會用它做什麼呢?你會把它自動化嗎?如果你有一個網站,想供讀者下載文章怎麼辦?你可以修改這些小命令,把它們編寫成一個 ,你的讀者可以決定他們想要哪種格式。你可以提供 .docx、.pdf、.odt、.epub 或更多格式。你的讀者只需要選擇一種格式,然後對應的轉換 就會執行,最後,你的讀者下載他們想要的檔案。這是完全可以做到的。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69901823/viewspace-2906058/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 使用 pandoc 將 Markdown 轉換為格式化文件
- Windows轉到linux中,檔案亂碼,檔案編碼轉換WindowsLinux
- Linux轉換檔案格式Linux
- 在 Linux 命令列中使用 ls 列出檔案的技巧Linux命令列
- 在 Linux中find命令使用技巧Linux
- [翻譯]關於通用文件轉換器Pandoc
- 偶得新玩具——通用文件轉換器Pandoc
- 轉換Linux 檔案編碼方式Linux
- 在 Linux 中把一個網頁轉換成 PDF的技巧介紹Linux網頁
- 使用 Fstransform 轉換檔案系統ORM
- 使用sratoolkit轉換SRA檔案格式
- Linux下批量將md檔案轉換為html檔案LinuxHTML
- 在 Linux 命令列中轉換大小寫Linux命令列
- 在ASP檔案中呼叫DLL (轉)
- 在VB中使用檔案物件 (轉)物件
- CR2檔案怎麼轉換成jpg格式?快速轉換cr2檔案成jpg格式的操作技巧
- ubuntu下使用sratoolkit將sra檔案轉換成fastq檔案UbuntuAST
- 在 Linux 中如何移動檔案Linux
- 在Linux 用SHLL 來替換在相同目錄下的檔案字尾名(轉)Linux
- 使用dbms_file_transfer轉換ASM檔案ASM
- 在Linux中,如何使用grep命令查詢檔案中的內容?Linux
- 在Linux中,如何使用logrotate命令管理日誌檔案?Linuxlogrotate
- PDF檔案轉換為DWF檔案
- WOR檔案轉換成GST檔案
- 如何使用python把json檔案轉換為csv檔案PythonJSON
- 在 Linux 中如何歸檔檔案和目錄Linux
- [工具]Pandoc 使用筆記筆記
- DOS/Windows和Linux/Unix間檔案格式轉換WindowsLinux
- 使用ISO檔案安裝Linux(轉)Linux
- Linux下/etc/fstab檔案使用(轉)Linux
- DLL檔案中Form的使用 (轉)ORM
- tkprof 轉換trc檔案
- 在 Linux 中如何刪除檔案中的空行Linux
- 將Schema檔案轉換為Java檔案Java
- ASM 檔案與本地檔案的轉換ASM
- 把 .xyz 檔案轉換成 .ply 檔案
- 在ORACLE中移動資料庫檔案在(轉)Oracle資料庫
- 使用vim修改linux中的檔案Linux