Python3網路爬蟲開發實踐——第4章—解析庫的使用—4.3使用pyquery
1.準備工作
請先確保已經安裝了pyquery庫,使用import語句匯入模組,如果匯入失敗,請先安裝:
pip install pyquery -i https://pypi.tuna.tsinghua.edu.cn/simple
匯入模組:
import pyquery
2.初始化
2.1 字串初始化
html = """
<div>
<ul>
<li class="item-O">first item</li>
<li class="item-1"><a href="link2.html">second item</a></li>
<li class="item-0 active"><a href="link3.html"><span class="bold">third item</span></a></li>
<li class="item-1 active"><a href="link4.html">fourth item</a></li>
<li class="item-0"><a href="link5.html">fifth item</a></li>
</ul>
</div>
"""
doc = pyquery.PyQuery(html)
print(doc("li"))
輸出結果:
<li class="item-O">first item</li>
<li class="item-1"><a href="link2.html">second item</a></li>
<li class="item-0 active"><a href="link3.html"><span class="bold">third item</span></a></li>
<li class="item-1 active"><a href="link4.html">fourth item</a></li>
<li class="item-0"><a href="link5.html">fifth item</a></li>
如上結果所示:輸出了html中的所有li節點。
2.2 URL初始化
初始化的引數可以是字串,也可以傳入網頁的URL
doc = pyquery.PyQuery(url="https://cuiqingcai.com")
print(doc("title"))
輸出結果:
<title>靜覓丨崔慶才的個人部落格</title>
2.3 檔案初始化
doc = pyquery.PyQuery(filename="demo.html")
print(doc("li"))
這裡需要一個本地檔案:demo.html。上述程式碼首先會讀取本地的檔案內容,然後將檔案內容以字串的形式傳遞給Pyquery類進行初始化。
3.基本CSS選擇器
相關文章
- 【Python3網路爬蟲開發實戰】4-解析庫的使用-3 使用pyqueryPython爬蟲
- Python3網路爬蟲開發實戰——第3章 基本庫的使用Python爬蟲
- 【Python3網路爬蟲開發實戰】4-解析庫的使用-1 使用XPathPython爬蟲
- 【Python3網路爬蟲開發實戰】4-解析庫的使用-2 使用Beautiful SoupPython爬蟲
- 《Python3網路爬蟲開發實戰程式碼》基本庫使用Python爬蟲
- [Python3網路爬蟲開發實戰] Charles 的使用Python爬蟲
- [Python3網路爬蟲開發實戰] --Splash的使用Python爬蟲
- python3網路爬蟲開發實戰_Python3 爬蟲實戰Python爬蟲
- python3網路爬蟲開發實戰_Python 3開發網路爬蟲(一)Python爬蟲
- 《Python3網路爬蟲開發實戰》教程||爬蟲教程Python爬蟲
- Python3網路爬蟲開發實戰Python爬蟲
- Python3網路爬蟲開發實戰——第1章 開發環境Python爬蟲開發環境
- 【Python3網路爬蟲開發實戰】3-基本庫的使用-3正規表示式Python爬蟲
- [Python3網路爬蟲開發實戰] 分散式爬蟲原理Python爬蟲分散式
- 【Python3網路爬蟲開發實戰】3-基本庫的使用 2-使用requests 1-基本用法Python爬蟲
- 《python3網路爬蟲開發實戰》--pyspiderPython爬蟲IDE
- python3網路爬蟲開發實戰pdfPython爬蟲
- 讀書筆記:《Python3網路爬蟲開發實戰》——第2章:爬蟲基礎筆記Python爬蟲
- 【Python3網路爬蟲開發實戰】3-基本庫的使用 1.1-傳送請求Python爬蟲
- 【Python3網路爬蟲開發實戰】3-基本庫的使用 2-使用requests 2-高階用法Python爬蟲
- 《Python3網路爬蟲開發實戰》開源啦!Python爬蟲
- 【Python3網路爬蟲開發實戰】3-基本庫的使用-4抓取貓眼電影排行Python爬蟲
- Python3網路爬蟲快速入門實戰解析Python爬蟲
- [Python3網路爬蟲開發實戰] 7-動態渲染頁面爬取-1-Selenium的使用Python爬蟲
- 《Python3 網路爬蟲開發實戰》—學習筆記Python爬蟲筆記
- Python3網路爬蟲開發實戰(第二版)Python爬蟲
- 我的爬蟲入門書 —— 《Python3網路爬蟲開發實戰(第二版)》爬蟲Python
- .NET使用分散式網路爬蟲框架DotnetSpider快速開發爬蟲功能分散式爬蟲框架IDE
- Python3 網路爬蟲開發實戰 第2版 (崔慶才) PDF 高畫質Python爬蟲
- [Python3網路爬蟲開發實戰] 2-爬蟲基礎 2-網頁基礎Python爬蟲網頁
- 面前最全《崔慶才python3網路爬蟲開發實戰》Python爬蟲
- python3 網路爬蟲開發實戰 貓眼top100Python爬蟲
- 《Python3網路爬蟲開發實戰》抽獎贈書活動Python爬蟲
- python3網路爬蟲開發實戰【高清掃描帶目錄】Python爬蟲
- 【閱讀筆記】《Python3網路爬蟲開發實戰》PDF文件筆記Python爬蟲
- [Python3網路爬蟲開發實戰] 7-動態渲染頁面爬取-4-使用Selenium爬取淘寶商品Python爬蟲
- [Python3網路爬蟲開發實戰] 2-爬蟲基礎 5-代理的基本原理Python爬蟲
- 【0基礎學爬蟲】爬蟲基礎之網路請求庫的使用爬蟲