python爬蟲用bs4獲取標籤中間的文字內容以及標籤裡的屬性
在爬取網頁的時候,用bs4庫爬取網頁上想要的一塊標籤,但是卻不知道怎麼提取裡面的內容,或者不知道怎麼得到標籤裡面的各種屬性值,比如a標籤的href屬性的值,這裡有幾種方法:
- 使用get_text()或者是.text同時取出了div標籤下的文字及子標籤文字。
例項如圖:
detials=dl.select('p')[0].text
print(detials)
執行結果如圖:
可以看到後面的【詳細】是在p標籤下的子標籤裡面的內容
- 如果已經拿到了最裡層的標籤的話,可以直接用.string的方法獲取標籤內的文字
details = dl.select('p a')[0].string
執行結果:
- 如果拿到的並不是最裡層的標籤,但是要獲取的文字在標籤裡面,那麼可以用find+contents的方法,該方法返回的是一個陣列,可以根據我們的需求得到特定的文字
details = dl.find('p').contents[0]
執行結果:
相關文章
- 獲取標籤全部文字的方式
- Android之去掉文字內容的HTML標籤AndroidHTML
- PbootCMS可使用的列表標籤內容tags標籤呼叫boot
- HTML標籤屬性HTML
- C#裡面標籤的屬性和事件C#事件
- Vue 標籤中的ref屬性和refsVue
- HTML 常用的標籤和屬性HTML
- input標籤單行文字域type="text"的可以新增屬性以及其描述
- input標籤autocomplete 屬性
- <checkBox>標籤的value屬性的作用
- 內嵌標籤frameset框架屬性及用法框架
- xss標籤和屬性爆破
- python中pyquery無法獲取標籤名的dom節點Python
- html標籤中的lang屬性有什麼作用?HTML
- python爬蟲練習之爬取豆瓣讀書所有標籤下的書籍資訊Python爬蟲
- vue 標籤和屬性中 字串拼接方法Vue字串
- 去html標籤,只取純文字HTML
- HTML 標籤與屬性大小寫HTML
- PHP 實現自動新增或者替換 內容的IMG標籤的 alt title 屬性PHP
- a標籤的使用,以及一些全域性屬性和連結型別。型別
- 可視區、標籤寬高的獲取
- html中在span標籤裡面可以放那些標籤?HTML
- 內容分類擴充套件性標籤設計套件
- 標籤上title與alt屬性的區別
- script標籤的defer和async屬性詳解
- 正值表示式匹配html標籤的屬性值HTML
- 跳轉個人主頁的指定標籤內容
- HTML標籤(基本標籤的使用)HTML
- 文字框和標籤
- TextMeshPro - 富文字標籤
- quotes屬性與<q>標籤關係
- 關於qq音樂audio標籤裡src的獲取問題
- html中p標籤內為何不能巢狀div標籤?HTML巢狀
- 帝國CMS靈動標籤顯示標題屬性、擷取標題字數
- HTML簡介,結構,標籤以及標籤語義HTML
- python 爬蟲之獲取標題和連結Python爬蟲
- HTML中你不得不知道的標籤及屬性HTML
- NOFOLLOW 標籤的運用