獲取標籤全部文字的方式

瘋子～發表於2018-08-06

原文網址 : https://blog.csdn.net/weixin_42660771/article/details/81460143

1.獲取最外層標籤，遍歷內部所有的子標籤，獲取標籤文字

選擇貼吧小說吧中的一個為例連結為 https://tieba.baidu.com/p/5815118868?pn=1

#找到指定類名的div標籤 該標籤內為貼吧內容和作者的集合體
div_list = response.xpath('//div[@class="l_post l_post_bright j_l_post clearfix  "]')

#遍歷內部所有子標籤
for div in div_list:
    author = div.xpath('.//div[@class="louzhubiaoshi_wrap"]').extract()
    print(author)

2.正則去掉標籤，re.compile.sub()

remove = re.compile('\s')
douhao = re.compile(',')
content = ''
for string in content_list:
    string = re.sub(remove,'',string)
    string = re.sub(douhao,'',string)
    print(string)

3./text()獲取標籤的文字 //text() 獲取標籤以及子標籤的文字

content_list = div.xpath('.//div[@class="d_post_content j_d_post_content "]//text()').extract()

4.使用xpath('string(.)') ,這種方式來獲取所有文字

content = div.xpath('.//div[@class="d_post_content j_d_post_content "]').xpath('string(.)').extract()[0]+'\n'

去html標籤，只取純文字
2018-09-04
HTML
python爬蟲用bs4獲取標籤中間的文字內容以及標籤裡的屬性
2020-10-05
Python爬蟲
可視區、標籤寬高的獲取
2020-12-19
JavaScript 獲取指定標籤一級子元素
2019-08-09
JavaScript
文字框和標籤
2018-09-07
TextMeshPro - 富文字標籤
2024-05-08
獲取文字的第a~b行文字
2018-11-07
html文字相關標籤
2020-11-22
HTML
html文字修飾標籤
2018-03-18
HTML
python中pyquery無法獲取標籤名的dom節點
2019-02-16
Python
Flutter文字標籤TextTagWidget，搜尋記錄流式佈局顯示文字標籤
2020-06-26
Flutter
selenium模組，web自動化，獲取標籤頁
2024-11-23
Web
使用selenium定位獲取標籤物件並提取資料
2020-12-19
物件
Java 獲取Word批註所標記的文字和圖片
2021-07-22
Java
關於qq音樂audio標籤裡src的獲取問題
2018-12-16
易優field獲取channelartlist標籤的欄位值-EyouCms手冊
2024-08-18
易優Channel獲取欄目列表-Eyoucms標籤手冊
2024-08-15
【Javascript】獲取選中的文字
2019-02-16
JavaScript
[前臺]---js獲取input標籤中name相同的各個value值
2018-05-17
JS
Android之去掉文字內容的HTML標籤
2018-09-30
AndroidHTML
php去掉欄位文字的所有html標籤
2024-04-11
PHPHTML
html5文字標籤
2024-03-20
HTML
PHP獲取目錄中的全部內容RecursiveDirectoryIterator
2024-07-09
PHP
VC MFC SDI/MDI框架各部分指標獲取方式
2020-04-05
框架指標
.NET Core 反射獲取所有控制器及方法上特定標籤
2020-05-28
反射
javascript實現文字框標籤驗證
2018-10-13
JavaScript
Vue入門指南-08 Vue中的標籤/如何獲取DOM元素(快速上手vue)
2019-04-01
Vue
Spring - 獲取ApplicationContext的幾種方式
2018-08-08
SpringAPPContext
vue裡a標籤從後臺獲取連結並實現跳轉
2020-12-06
Vue
前端與移動開發----webAPI----文字框事件，滑鼠事件，標籤屬性操作方式
2020-11-24
前端移動開發WebAPI事件
HTML標籤(基本標籤的使用)
2018-08-30
HTML
gitlab cicd中獲取tag值的方式
2024-03-20
Gitlab
織夢標籤標題關鍵詞描述的調取方法
2021-04-07
a標籤與Blob下載檔案的區別和獲取檔案下載進度
2024-12-06
Java獲取Class物件的方式和例項化物件的方式
2019-03-28
Java物件
HTML字元實體與文字格式化標籤
2020-04-01
HTML字元
A01-0020、修飾標籤 - 文字斜體i
2020-12-30
Espresso 如何獲取控制元件的實時文字？
2020-07-17
Espresso控制元件

獲取標籤全部文字的方式

相關文章