淺談Python中的bs4基礎

回憶不說話發表於2018-07-30

安裝

在命令提示符框中直接輸入pip install beautifulsoup4

介紹

beautifulsoup是python的一個第三方庫，和xpath一樣，都是用來解析html資料的。

引入

from bs4 import BeautifulSoup

使用

將一段文件傳入BeautifulSoup的構造方法，就能得到一個文件的物件。

bs = BeautifulSoup(open('index.html',encoding='utf-8'),'lxml')
print(bs)

注意：這樣上傳文件的話，BeautifulSoup裡面需要兩個引數。一個為open方法，一個是固定寫法，也就是解析器。

open方法裡面也同樣需要兩個引數，一個是想要解析的資料，另一個為設定編碼的格式。

（1）獲取網頁中的title標籤

print(bs.title)

（2）獲取head標籤及標籤內部的所有其他標籤

print(bs.head)

（3）獲取當中的第一個a標籤

print(bs.a)

注意：獲取文件當中所有的xx當中第一個xx或者第一個xx裡面的內容。都可以用bs.xx來獲取

（4）獲取指定標籤的所有屬性
print(bs.a.attrs)

（5）獲取標籤的屬性

print(bs.a['href'])

（6）獲取標籤的文字內容。

print(bs.a.string)

注意：string獲取的文字指的是本標籤的文字，不包含子標籤的文字

（7）contents能夠獲取指定標籤下面的所有內容。

print(bs.body.contents)

（8）獲取所有內容當中指定索引的內容

print(bs.div.contents[3])

（9）通過id和類名來找標籤

print(bs.find(id='kw'))

print(bs.find(class_='shopping'))

注意：id是唯一的，通過id來找，只能找到一個，所以用find，而class不是唯一的，通過class來找，就有可能找到多個。

（10）select選擇指定的標籤

print(bs.select('title'))

print(bs.select('a'))

在bs4中，小數點“.”表示類名，#表示id

print(bs.select('.first'))

print(bs.select('#kw'))

print(bs.select('div.now'))

from bs4 import BeautifulSoup
content = '<a href="提示我這個連結地址">sflkj</a>'
result = BeautifulSoup(content,'lxml').find('a').attrs['href']
print(result)

本文介紹了bs4的一些基本常識，希望對各位有用。

淺談Python基礎
2018-04-22
Python
淺談python中的xpath用法
2018-07-28
Python
[基礎] 淺談 JS Event Loop
2019-03-09
JSOOP
Java基礎之淺談介面
2022-04-04
Java
Java基礎之淺談集合
2022-04-07
Java
python基礎中的基礎
2024-03-18
Python
Java基礎之淺談泛型
2022-04-06
Java泛型
淺談我對python中的monkey patch
2020-09-25
Python
淺談python零基礎教程總結30天--day8
2018-07-27
Python
淺談RASP技術攻防之基礎篇
2019-03-11
Java基礎之淺談繼承、多型
2022-04-03
Java繼承多型
Service Cloud 零基礎（二）Knowledge淺談
2020-12-15
Cloud
java基礎（四）：談談java中的IO流
2019-02-26
Java
Python基礎之:Python中的類
2021-04-02
Python
Python基礎之:Python中的IO
2021-03-26
Python
Python集合淺談
2021-04-15
Python
淺談對python pandas中 inplace 引數的理解
2020-07-07
Python
手擼ORM淺談ORM框架之基礎篇
2020-10-14
ORM框架
淺談JavaScript中的this
2018-03-07
JavaScript
淺談Python中的scrapy的安裝和建立工程。
2018-08-01
Python
java基礎（五）：談談java中的多執行緒
2019-02-26
Java執行緒
salesforce零基礎學習（九十八）Type淺談
2020-06-16
Salesforce
淺談Kotlin語法篇之基礎語法(一)
2018-04-01
Kotlin
淺談react 中的 this 指向
2019-01-09
React
淺談Java中的Hashmap
2019-01-19
JavaHashMap
淺談java中的反射
2019-11-11
Java反射
淺談React中的diff
2018-04-03
React
python基礎學習9—-深淺拷貝
2018-09-07
Python
Python基礎之:Python中的內部物件
2021-04-06
Python物件
Python基礎之:Python中的流程控制
2021-03-03
Python
Python中基礎的時間操作
2020-12-12
Python
salesforce零基礎學習（九十六）Platform Event淺談
2020-05-02
SalesforcePlatform
Java基礎之淺談異常與瞭解斷言
2022-04-05
Java
Salesforce Consumer Goods Cloud 淺談篇一之基礎介紹
2021-11-14
SalesforceGoCloud
談談JVM（基礎模型）
2020-07-12
JVM模型
淺談Golang中select的用法
2019-02-16
Golang
淺談JavaScript中的繼承
2018-05-29
JavaScript繼承
淺談jQuery中的工具方法
2018-09-11
jQuery

淺談Python中的bs4基礎

相關文章