百度文庫、道客巴巴等文件的又一獲取方法
之前介紹過一款工具,可以免費快速下載百度文庫、豆丁、道客巴巴等網站資料,
傳送門在這裡
當然這個工具也不是百分之百的有效
,根據文件的具體情況和網站程式的變動可能會有不能下載或者下載下來的文件不如人意。
今天再介紹兩個獲取文件
的方法。
1、線上百度文庫下載 - 思維趣(http://so.jutuit.com/#21)
這是個工具聚合類的網站,其中有一項應用就是下載百度文庫
。(進入網站後選擇應用19)
![10358591-e42e88febfdffdbd](https://i.iter01.com/images/65dbb642867fc9ce44ea5b707d6949ffee57d70ef5b1f556c1df5175941c6eb8.jpg)
方法簡單,只要把百度文庫的連結,直接貼上進去獲取即可。目前只能是獲取需要點券的文件,付費的文件暫時還不支援。
![10358591-a81b63bf8e99899c](https://i.iter01.com/images/42f8a5df6f808df8ab761b8a4133fcea4a62d811c5129de469efafd9ef48d468.jpg)
2、手動OCR識別
這個方法基本上適用所有的文庫網站,只要能夠線上預覽,都可以比較快速的獲得文件。
基本原理就是:將文件閱覽圖截圖生產圖片-通過OCR識別網站或者工具進行識別 - 編輯排版。
舉個例子
1)需要獲取圖片中道客巴巴某個文章裡面的一段文字,先用截圖軟體截圖,儲存。
![10358591-24d8cf00d0dfda3d](https://i.iter01.com/images/62ac62943a8e1598a01963e7dc4bf749b1d2bcd225b2d1fbe578638b89497dac.jpg)
2)進入OCR識別網站,永恆君隨手網上搜了一個。
![10358591-a3724e48b73f1c48](https://i.iter01.com/images/208de91b93a17aa6ec770cc6777e227a88ef05dcc1960710e89e3520d4cdf83f.jpg)
3)上傳剛剛截的圖片,選擇txt格式,開始識別。
![10358591-a9ab60faacd5afbd](https://i.iter01.com/images/37e024e7eef1675cac112d3caa494fd4fba287efd619ae31a567e97fd39eab4e.jpg)
![10358591-10b62a0d5d63a1dc](https://i.iter01.com/images/927ad5046ea8d1ae3969aa9c53f29306b0c9094cdb72dd321d61b63da58eac31.jpg)
4)複製識別的文字,稍許編輯排版即可。
這種方法和掃描文件後識別文件文字道理差不多,識別的效率和準確度還是可以接受的。永恆君之前也推薦過網站和微信小程式,都還不錯。
需要識別圖片文字,這三個網站可以幫到你
準確識別圖片上文字的小程式
當然,這種方法缺點
也是比較明顯,需要手工將所有需要的頁面截圖下來。
但是藉助FS Capture
和按鍵精靈
等工具,相信也不難。
如果你有其他更好的方法,希望能一起交流分享!
相關文章
- CRM系統來獲取更精準的客戶的方法
- JS 獲取文件元素JS
- dom元素操作獲取等
- 獲取方法
- 09 獲取需求的方法
- 乾貨:不同場景容器內獲取客戶端源IP的方法客戶端
- 獲取客戶端Mac地址客戶端Mac
- PHP --反射 --獲取類的方法PHP反射
- 獲取類名稱的方法
- 如獲取獲取關聯資料的文件跟模型的關聯資料集呢模型
- 使用阿里巴巴API獲取商品詳情的實踐指南阿里API
- Android獲取本機各種型別檔案列表(音樂、影片、圖片、文件等)Android型別
- php一句話獲取獲取檔案目錄的方法PHP
- 外貿獲客方法整理
- JavaScript獲取元素在文件中座標JavaScript
- JavaScript獲取滑鼠在文件中座標JavaScript
- python 獲取時間的datetime庫Python
- c# 獲取客戶端IPC#客戶端
- 獲取客戶端真實IP客戶端
- Javascript獲取原型的四種方法JavaScript原型
- Appium Android 獲取WebView元素的方法APPAndroidWebView
- 獲取 Class 物件的 3 種方法物件
- C獲取程式名稱的方法
- Java獲取Object中Value的方法JavaObject
- 搜尋欄獲取百度suggestion
- JavaScript獲取元素距離文件頂部的距離JavaScript
- 怎樣獲取jstree的節點資料_大資料獲客是怎樣獲取精準客源的JS大資料
- Oracle database 19c中獲取當前資料庫版本的方法OracleDatabase資料庫
- .net 獲取客戶端真實ip客戶端
- Nacos - 客戶端例項列表獲取客戶端
- 開源 - Ideal庫 -獲取特殊時間擴充套件方法(四)Idea套件
- PHP獲取HTTP body內容的方法PHPHTTP
- python request 獲取cookies value值的方法PythonCookie
- Spring LocalVariableTableParameterNameDiscoverer獲取方法的引數名Spring
- 關於如何獲取資料的方法
- python爬蟲獲取百度熱搜Python爬蟲
- 簡單的IPHelper.cs 訪客IP獲取類
- Thinkphp5框架實現獲取資料庫資料到檢視的方法PHP框架資料庫