盤點!最全的Python網路爬蟲第三方庫合集!
Python語言的應用場景可謂是十分全面,比如後端開發、網路爬蟲、人工智慧、資料分析,之所以應用場景這麼廣泛,其原因在於豐富的第三方庫,那麼適用於網路爬蟲的第三方庫有哪些呢?以下是詳細的內容:
網路:
通用:
urllib:網路庫(stdlib)
requests:網路庫
grab:網路庫(基於pycurl)
pycurl:網路庫(繫結libcurl)
urllib3:Python HTTP庫,安全連線池、支援檔案post、可用性高
httplib2:網路庫
RoboBrowser:一個簡單的、極具Python風格的Python庫,無需獨立的瀏覽器即可瀏覽網頁
MechanicalSoup:一個與網站自動互動Python庫
mechanize:有狀態、可程式設計的Web瀏覽庫
socket:底層網路介面(stdlib)
非同步:
treq:類似於requests的API(基於twisted)
aiohttp:asyncio的HTTP客戶端/伺服器(PEP-3156)
網路爬蟲框架:
功能齊全的爬蟲:
grab:網路爬蟲框架(基於pycurl/multicur)
scrapy:網路爬蟲框架(基於twisted),不支援Python3
pyspider:一個強大的爬蟲系統
其他:
portia:基於Scrapy的視覺化爬蟲
restkit:Python的HTTP資源工具包,可以讓你輕鬆地訪問HTTP資源,並圍繞它建立的物件
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2928734/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【分享篇】Python爬蟲方向的第三方庫合集!Python爬蟲
- Python爬蟲入門,8個常用爬蟲技巧盤點Python爬蟲
- python網路爬蟲_Python爬蟲:30個小時搞定Python網路爬蟲視訊教程Python爬蟲
- python網路爬蟲實戰--重點整理Python爬蟲
- python網路爬蟲應用_python網路爬蟲應用實戰Python爬蟲
- python DHT網路爬蟲Python爬蟲
- 什麼是Python網路爬蟲?常見的網路爬蟲有哪些?Python爬蟲
- 帶你入門Python爬蟲,8個常用爬蟲技巧盤點Python爬蟲
- [Python] 網路爬蟲與資訊提取(1) 網路爬蟲之規則Python爬蟲
- 《用Python寫網路爬蟲》--編寫第一個網路爬蟲Python爬蟲
- 【Python爬蟲9】Python網路爬蟲例項實戰Python爬蟲
- python網路爬蟲(14)使用Scrapy搭建爬蟲框架Python爬蟲框架
- 專案--python網路爬蟲Python爬蟲
- python網路爬蟲合法嗎Python爬蟲
- 網路爬蟲(python專案)爬蟲Python
- Python網路爬蟲實戰Python爬蟲
- Python網路爬蟲二三事Python爬蟲
- Python 網路爬蟲的常用庫彙總及應用Python爬蟲
- Python爬蟲開源專案合集Python爬蟲
- 面前最全《崔慶才python3網路爬蟲開發實戰》Python爬蟲
- Python的Scrapy定製網路爬蟲Python爬蟲
- python網路爬蟲(9)構建基礎爬蟲思路Python爬蟲
- python網路爬蟲--爬取淘寶聯盟Python爬蟲
- 網路爬蟲爬蟲
- python3網路爬蟲開發實戰_Python 3開發網路爬蟲(一)Python爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- python網路爬蟲筆記(一)Python爬蟲筆記
- Python網路爬蟲(六) Scrapy框架Python爬蟲框架
- Python 非同步網路爬蟲(2)Python非同步爬蟲
- Python 非同步網路爬蟲 IPython非同步爬蟲
- Python 非同步網路爬蟲(1)Python非同步爬蟲
- Python初學者之網路爬蟲Python爬蟲
- 網路爬蟲——爬蟲實戰(一)爬蟲
- 網路爬蟲的原理爬蟲
- 傻傻的網路爬蟲爬蟲
- 這可能是你見過的最全的網路爬蟲總結爬蟲
- python例項,python網路爬蟲爬取大學排名!Python爬蟲
- 用PYTHON爬蟲簡單爬取網路小說Python爬蟲