Python中爬蟲模組有哪些?優缺點介紹!
Python是一門高階的程式語言,它語法簡單、清晰,容易入門,可用的包、庫、模組有很多,即便是初學者也能夠快速實現簡單的網路爬蟲,那麼你知道Python中爬蟲模組有哪些嗎?我們一起來看看吧。
Python自帶爬蟲模組:urllib、urllib2;
第三方爬蟲模組:requests、aiohttp;
爬蟲框架:Scrapy、pyspider。
Python爬蟲模組優缺點介紹:
Urllib和urllib2模組都用於請求url相關的操作,但他們提供了不同的功能。Urllib2模組中urllib2.urlopen可以接受一個Request物件或者url,且只接收一個url;urllib中有urlencode,而urllib2中沒有。因此,開發人員在實際開發中經常會將urllib和urllib2一起使用。
Requests是一個http庫,僅僅用於傳送請求。對於http請求而言,Requests是一個強大的庫,可以自己處理下載、解析,靈活性很高,高併發與分散式部署也非常靈活,對於功能可以更好實現。
Aiohttp是一個基於Python3的asyncio攜程機制實現的一個http庫,對比Requests,aiohttp自身就具備了非同步功能,但只能在Python3環境中使用。
Scrapy是封裝起來的框架,包含下載器、解析器、日誌及日常處理,是基於多執行緒的,採用twisted的方式處理。對於固定單個網站的爬取開發,Scrapy具有優勢;對於多網站爬取,併發及分散式處理方面,Scrapy不夠靈活,不便調整與擴充套件。
Pyspider是一個重量級的爬蟲框架,我們知道scrapy沒有資料庫整合、分散式、斷點續爬的支援、UI控制介面等;若Scrapy想要實現這些功能,需要自行開發。Pyspider整合了前面這些功能,正因如此,pyspider擴充套件性太差,學習難度較大。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2769136/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- iframe有哪些優點和缺點?
- 開源JAVA單機爬蟲框架簡介,優缺點分析Java爬蟲框架
- Python爬蟲教程-01-爬蟲介紹Python爬蟲
- python爬蟲:爬蟲的簡單介紹及requests模組的簡單使用Python爬蟲
- Python有哪些優缺點,你瞭解嗎?Python
- python解決反爬蟲方法的優缺點對比Python爬蟲
- Redis和MongoDB優缺點介紹!Python學習RedisMongoDBPython
- 爬蟲介紹爬蟲
- Python爬蟲教程-34-分散式爬蟲介紹Python爬蟲分散式
- Python爬蟲教程-30-Scrapy 爬蟲框架介紹Python爬蟲框架
- 靜態IP的優缺點介紹
- MySQL MHA工具的優缺點介紹MySql
- ERP系統有哪些優點和缺點?
- 爬蟲工作使用代理IP有哪些優勢?爬蟲
- 那麼多人選擇Python,它的優缺點有哪些?Python
- Python垃圾回收機制是什麼?有哪些優缺點?Python
- NUMA架構介紹及優缺點分析架構
- MySQL MERGE表的優缺點介紹MySql
- XtraBackup備份原理和優缺點介紹
- RPA 技術的優缺點有哪些
- HTTPS協議的優缺點有哪些?HTTP協議
- 大資料的優缺點有哪些?_光點科技大資料
- Linux中靜態路由指什麼?優缺點有哪些?Linux路由
- JavaScript 模組化優缺點JavaScript
- Python的優缺點和應用領域有哪些? 【詳細】Python
- 分享6個Java框架及優缺點介紹Java框架
- MySQL GTID複製的優缺點介紹MySql
- 爬蟲的用途有哪些爬蟲
- python爬蟲requests模組Python爬蟲
- 虛擬伺服器的優缺點有哪些?伺服器
- python在爬蟲方面有哪些優勢呢?Python爬蟲
- Python語言的特點有哪些?九大特點介紹!Python
- Python爬蟲工作對代理IP有哪些需求?Python爬蟲
- Python爬蟲學習線路圖丨Python爬蟲需要掌握哪些知識點Python爬蟲
- Native App及Hybrid App優缺點介紹!APP
- 【Redis】四種部署模式的介紹及其優缺點Redis模式
- MongoDB Sharding ChunkSize大小選擇優缺點介紹MongoDB
- MySQL的binlog的格式及優缺點介紹MySql