百度文庫、道客巴巴等文件的又一獲取方法
之前介紹過一款工具,可以免費快速下載百度文庫、豆丁、道客巴巴等網站資料,
傳送門在這裡
當然這個工具也不是百分之百的有效
,根據文件的具體情況和網站程式的變動可能會有不能下載或者下載下來的文件不如人意。
今天再介紹兩個獲取文件
的方法。
1、線上百度文庫下載 - 思維趣(http://so.jutuit.com/#21)
這是個工具聚合類的網站,其中有一項應用就是下載百度文庫
。(進入網站後選擇應用19)
方法簡單,只要把百度文庫的連結,直接貼上進去獲取即可。目前只能是獲取需要點券的文件,付費的文件暫時還不支援。
2、手動OCR識別
這個方法基本上適用所有的文庫網站,只要能夠線上預覽,都可以比較快速的獲得文件。
基本原理就是:將文件閱覽圖截圖生產圖片-通過OCR識別網站或者工具進行識別 - 編輯排版。
舉個例子
1)需要獲取圖片中道客巴巴某個文章裡面的一段文字,先用截圖軟體截圖,儲存。
2)進入OCR識別網站,永恆君隨手網上搜了一個。
3)上傳剛剛截的圖片,選擇txt格式,開始識別。
4)複製識別的文字,稍許編輯排版即可。
這種方法和掃描文件後識別文件文字道理差不多,識別的效率和準確度還是可以接受的。永恆君之前也推薦過網站和微信小程式,都還不錯。
需要識別圖片文字,這三個網站可以幫到你
準確識別圖片上文字的小程式
當然,這種方法缺點
也是比較明顯,需要手工將所有需要的頁面截圖下來。
但是藉助FS Capture
和按鍵精靈
等工具,相信也不難。
如果你有其他更好的方法,希望能一起交流分享!
相關文章
- CRM系統來獲取更精準的客戶的方法
- JS 獲取文件元素JS
- js獲取元素的方法(獲取html元素的方法)JSHTML
- 實現一個具有百度文庫文件轉換功能的工具類
- Jive(J道)升級通知(又一資料庫批次查詢方法應用)資料庫
- dom元素操作獲取等
- 獲取方法
- 獲取Word文件的作者和主題
- 獲取Oracle資料庫awr報告方法Oracle資料庫
- 09 獲取需求的方法
- 獲取客戶端Mac地址客戶端Mac
- jQuery獲取客戶區高度jQuery
- pomelo獲取客戶端IP客戶端
- 乾貨:不同場景容器內獲取客戶端源IP的方法客戶端
- 獲取表的結構、欄位描述等
- 獲取本地IP和mac等資訊Mac
- 獲取sql server資料庫中所有庫、表、欄位名的方法SQLServer資料庫
- PHP --反射 --獲取類的方法PHP反射
- 獲取jdbctemplate的一種方法JDBC
- bash獲取程式ID的方法
- c# 獲取客戶端IPC#客戶端
- 獲取客戶端真實IP客戶端
- oracle資料庫獲取繫結變數的各種方法Oracle資料庫變數
- 如獲取獲取關聯資料的文件跟模型的關聯資料集呢模型
- PHP獲取客戶端、PHP獲取伺服器相關資訊PHP客戶端伺服器
- php一句話獲取獲取檔案目錄的方法PHP
- 獲取IP地址方法
- js獲取表格方法JS
- 【百度知道總結】獲取一個圖片地址中圖片名稱的方法
- JavaScript獲取元素在文件中座標JavaScript
- JavaScript獲取滑鼠在文件中座標JavaScript
- Android獲取本機各種型別檔案列表(音樂、影片、圖片、文件等)Android型別
- Javascript獲取原型的四種方法JavaScript原型
- Activiti獲取ProcessEngine的三種方法
- HttpServletRequest常用獲取URL的方法HTTPServlet
- 獲取執行計劃的方法
- 獲取物件DDL語句的方法物件
- 使用PHP獲取根域名的方法!PHP