Python爬蟲教程-25-資料提取-BeautifulSoup4(三)
本篇介紹 BeautifulSoup 中的 css 選擇器
css 選擇器
- 使用 soup.select 返回一個列表
- 通過標籤名稱:soup.select("title")
- 通過類名:soup.select(".centent")
- id 查詢:soup.select("#name_id")
- 組合查詢:soup.select("div #input_content")
- 屬性查詢:soup.select("img[class='photo']")
- 獲取tag內容:tag.get_text
案例
# BeautifulSoup 的使用案例
# css 選擇器
from urllib import request
from bs4 import BeautifulSoup
url = 'http://www.baidu.com/'
rsp = request.urlopen(url)
content = rsp.read()
soup = BeautifulSoup(content, 'lxml')
# bs 自動解碼
content = soup.prettify()
print("=="*12)
titles = soup.select("title")
print(titles[0])
print("=="*12)
meta = soup.select("meta[content='always']")
print(meta[0])
執行結果
更多文章連結:Python 爬蟲隨筆
- 本筆記不允許任何個人和組織轉載