VSCrawler爬蟲專案介紹
VSCrawler是virjar大神寫的一個java爬蟲專案,VSCrawler接入了dungproxy作為網路層API,本身自帶代理服務。比起其他流行的webmagic,Scrapy等爬蟲框架,VSCrawler在處理諸如如多使用者登陸,IP代理,複雜流程抽取等爬蟲常見的棘手問題上,具有不小的優勢。VSCrawler的一個重要特性就是他把下載和解析放在了同一個元件裡面。
VSCrawler在部分實現上參考了webmagic,同時程式碼為了相容webmagic和方便使用者基於webmagic專案的遷移,VSCrawler提供了一個橋接模組,可以將webMagic的部分功能直接遷移到VSCrawler。
VSCrawler有三個基本元件,分別是 Processor、Pipeline和SessionPool,用來擴充套件解析頁面,儲存抓取結果和定製網路下載工具。
相關文章
- Java爬蟲入門(一)——專案介紹Java爬蟲
- Python爬蟲教程-32-Scrapy 爬蟲框架專案 Settings.py 介紹Python爬蟲框架
- 通用新聞爬蟲開發系列(專案介紹)爬蟲
- 爬蟲介紹爬蟲
- Java 爬蟲專案實戰之爬蟲簡介Java爬蟲
- Python爬蟲教程-01-爬蟲介紹Python爬蟲
- 想成為Python高手,必須看這篇爬蟲原理介紹!(附29個爬蟲專案)Python爬蟲
- 基於大型語言模型爬蟲專案Crawl4AI介紹模型爬蟲AI
- Python爬蟲教程-34-分散式爬蟲介紹Python爬蟲分散式
- Python爬蟲教程-30-Scrapy 爬蟲框架介紹Python爬蟲框架
- 爬蟲專案爬蟲
- 【爬蟲】爬蟲專案推薦 / 思路爬蟲
- puppeteer介紹(一)爬蟲,效能,注入爬蟲
- 爬蟲小專案爬蟲
- 爬蟲專案部署爬蟲
- 第一章 爬蟲介紹爬蟲
- 奇伢爬蟲專案爬蟲
- 爬蟲專案總結爬蟲
- scrapyd 部署爬蟲專案爬蟲
- 網路爬蟲專案爬蟲
- python爬蟲初探--第一個python爬蟲專案Python爬蟲
- 爬蟲代理 Scrapy 框架詳細介紹 2爬蟲框架
- Python網路爬蟲實戰專案大全 32個Python爬蟲專案demoPython爬蟲
- 爬蟲實戰專案集合爬蟲
- 網路爬蟲(python專案)爬蟲Python
- 100爬蟲專案遷移爬蟲
- gerapy框架爬蟲專案部署框架爬蟲
- 爬蟲專案實戰(一)爬蟲
- 專案--python網路爬蟲Python爬蟲
- 爬蟲的例項專案爬蟲
- 爬蟲實戰專案合集爬蟲
- Python爬蟲教程-31-建立 Scrapy 爬蟲框架專案Python爬蟲框架
- python爬蟲例項專案大全-GitHub 上有哪些優秀的 Python 爬蟲專案?Python爬蟲Github
- Web專案開發介紹及實戰專案介紹Web
- python爬蟲:爬蟲的簡單介紹及requests模組的簡單使用Python爬蟲
- 6.1 專案介紹
- 《沿途》專案介紹
- 介紹ServiceSelf專案
- 爬蟲開發python工具包介紹 (2)爬蟲Python