百度文庫、道客巴巴等文件的又一獲取方法

weixin_34321977發表於2018-09-06

之前介紹過一款工具,可以免費快速下載百度文庫、豆丁、道客巴巴等網站資料,

傳送門在這裡


當然這個工具也不是百分之百的有效,根據文件的具體情況和網站程式的變動可能會有不能下載或者下載下來的文件不如人意。

今天再介紹兩個獲取文件的方法。

1、線上百度文庫下載 - 思維趣(http://so.jutuit.com/#21)

這是個工具聚合類的網站,其中有一項應用就是下載百度文庫。(進入網站後選擇應用19)

10358591-e42e88febfdffdbd

方法簡單,只要把百度文庫的連結,直接貼上進去獲取即可。目前只能是獲取需要點券的文件,付費的文件暫時還不支援。

10358591-a81b63bf8e99899c

2、手動OCR識別

這個方法基本上適用所有的文庫網站,只要能夠線上預覽,都可以比較快速的獲得文件。

基本原理就是:將文件閱覽圖截圖生產圖片-通過OCR識別網站或者工具進行識別 - 編輯排版。

舉個例子

1)需要獲取圖片中道客巴巴某個文章裡面的一段文字,先用截圖軟體截圖,儲存。

10358591-24d8cf00d0dfda3d

2)進入OCR識別網站,永恆君隨手網上搜了一個。

10358591-a3724e48b73f1c48

3)上傳剛剛截的圖片,選擇txt格式,開始識別。

10358591-a9ab60faacd5afbd
10358591-10b62a0d5d63a1dc

4)複製識別的文字,稍許編輯排版即可。

這種方法和掃描文件後識別文件文字道理差不多,識別的效率和準確度還是可以接受的。永恆君之前也推薦過網站和微信小程式,都還不錯。

需要識別圖片文字,這三個網站可以幫到你

準確識別圖片上文字的小程式

當然,這種方法缺點也是比較明顯,需要手工將所有需要的頁面截圖下來。
但是藉助FS Capture按鍵精靈等工具,相信也不難。

如果你有其他更好的方法,希望能一起交流分享!

相關文章