[翻譯]關於通用文件轉換器Pandoc

高翌翔發表於2011-12-01

Pandoc——通用文件轉換器。線上試用Pandoc
(提示:從HTML原始碼轉換為Markdown格式應設定為,from HTML to Markdown (strict)

如果你需要將檔案從一種標記格式轉換成另一種的話,那麼Pandoc就是你的瑞士軍刀。你需要從一個markdown格式檔案生成一個man格式頁面麼?沒問題。從LaTeX格式轉換到Docbook格式?當然可以。從HTML格式轉換到MediaWiki格式?是的,那也可以。Pandoc可以讀取markdown格式及其reStructuredText(的子集)、textile格式HTML格式、以及LaTeX格式,而且它可以寫純文字(plain text)、markdownreStructuredTextHTMLLaTeXConTeXtPDFRTFDocBook XMLOpenDocument XMLODTGNU TexinfoMediaWiki markuptextilegroff man等格式頁面,還有Emacs org-modeEPUB等格式電子書,以及S5Slidy格式的HTML幻燈片顯示。使用markdown2pdf包裝器指令碼還支援PDF輸出(以LaTeX格式為媒介)。

Pandoc知道許多有用的markdown語法擴充套件,包括文件後設資料(document metadata,例如:title、author、date);腳註(footnotes);表格(tables);定義列表(definition lists);上標(superscript)和下表(subscript);刪除線(strikeout);增強的排序列表(ordered lists,起始編號和編號樣式都很重要);分隔的程式碼塊(delimited code blocks);HTML塊內部的markdown標記;以及TeX 數學(TeX math)。其他可選項包括“智慧”標點、語法突出顯示、自動生成目錄、以及自動生成引文(使用citeproc-hs)。如果希望使用嚴格的markdown相容性,那麼可使用命令列標識來關閉所有這些擴充套件。

Pandoc包括一個Haskell庫和一個獨立的可執行檔案。該庫包括適用於每種輸入和輸出格式的獨立模組,因此新增一種新的輸入或輸出格式,只需新增一個新模組。

Pandoc是自由軟體,以GPL發放。 © 2006–2011 John MacFarlane.

相關文章