1109 – PDF 標註匯出,從入門到棄坑

atJason發表於2019-03-01

這兩天,研究瞭如果匯出 PDF 標註。沒搞定,大致列一些關鍵的點,供大家參考:

  • PDF 標準是 Adobe 牽頭搞了,標準又老又長,一般還是別看了
  • Apple 提供了 PDFKit;不過,十幾年沒更新了,功能比較弱
    • 核心的,在解析標註文字時,會出現 Cmap 錯誤,但卻沒有任何可設定的地方
    • 另外,WWDC 2017 新出了 PDFKit for iOS,沒去研究,估計重點在於展示,不在於編輯
  • 對於第三方 PDF SDK:
    • 有少量免費、或開源的,最知名的是 Skim;可惜的是,Skim 也無法解析標註文字,尤其是英文之外的文字、字型
    • 而更大部分,則是商業 SDK;效果我不好說,因為動不動 $1000 一年的授權,試不起
  • PDF Expert 果然還是厲害,在試過的這些產品中,最強悍;當然,價格也最彪悍

總的來看,PDF 還是一小撮玩家在玩的小遊戲。既得利益者,牢牢把握著市場;後來者,不太可能進入並有所作為。標準本身,也缺乏與時俱進的動力。我並不看好。

不過,我還是基於 Apple 的 PDFKit 做了個簡單的小工具,可以將 PDF 中的標註匯出為 csv 文字。需要的朋友,可以單獨聯絡我。


部落格原文:1109 – PDF 標註匯出,從入門到棄坑

相關文章