Beautiful Soup學習
使用pyquey時碰到多值屬性沒辦法處理的情況,想起了BS4可以處理這種情況,於是大概回顧了一下BS4的文件,把溫習的知識點寫到部落格,以便以後查閱。
bs4官方文件地址點選開啟連結
一、bs4物件種類:
1、Tage 相當於htm文件中的標籤,和標籤一樣,它有name和attribute屬性,通過標籤名.name和標籤名.attribute訪問。
2、 NavigableString物件,可遍歷的字串,通過tag.string訪問,該物件是標籤中的字串物件,支援BS4中遍歷和搜尋文件樹種的一些方法(不支援find)
3、BeautifulSoup 物件表示的是一個文件的全部內容.大部分時候,可以把它當作 Tag 物件,它支援 遍歷文件樹 和 搜尋文件樹 中描述的大部分的方法,沒有name和attribute屬性。
4、註釋及特殊字串
二、過濾器型別:過濾器其實就是傳入選擇方法中的引數的型別,可以使字串、正規表示式、列表、Ture和方法
1、字串,一般是標籤名
2、正規表示式,使用re模組的match()方法匹配符合模式的文件
3、列表,返回與列表中元素一致的文件內容
4、Ture,可以匹配任何值
5、方法,定義一個方法,官方文件例子解釋的很清楚
三、搜尋文件樹 find_all()和find()
find_all( name , attrs , recursive , text , **kwargs )
1、name 引數可以查詢所有名字為 name 的tag,字串物件會被自動忽略掉.
2、kewords引數,用來通過制定屬性名來搜尋文件
3、attrs引數,通過賦值一個字典給該引數可以查詢一些不能通過keywords引數搜尋的屬性
find_all() 幾乎是Beautiful Soup中最常用的搜尋方法,所以我們定義了它的簡寫方法.
BeautifulSoup 物件和
tag 物件可以被當作一個方法來使用
soup.find_all("a")
soup("a")
以上兩種搜尋結果是一樣的。相關文章
- Beautiful Soup 學習手冊
- Beautiful Soup庫的使用(學習筆記)筆記
- Python爬蟲學習(11):Beautiful Soup的使用Python爬蟲
- Python Beautiful Soup簡介Python
- 淺析Beautiful Soup庫和Lxml庫XML
- 一起學爬蟲——使用Beautiful Soup爬取網頁爬蟲網頁
- 使用 Beautiful Soup 在 Python 中抓取網頁Python網頁
- Python Beautiful Soup+requests實現爬蟲Python爬蟲
- Python網頁抓取工具Beautiful Soup面面觀!Python網頁
- Beautiful Soup在爬蟲中的基本使用語法爬蟲
- python爬蟲之Beautiful Soup基礎知識+例項Python爬蟲
- JB的Python之旅-爬蟲篇--urllib和Beautiful SoupPython爬蟲
- 【Python3網路爬蟲開發實戰】4-解析庫的使用-2 使用Beautiful SoupPython爬蟲
- Python 從底層結構聊 Beautiful Soup 4(內建豆瓣最新電影排行榜爬取案例)Python
- BUUCTF:Beautiful_SideIDE
- xpath beautiful pyquery三種解析庫
- [題解]CF55D Beautiful Numbers
- CF Div. 3 C Beautiful Triple PairsAI
- You are beautiful voted the 'Most Irritating Song Ever'.
- 學習學習再學習
- 【數位dp】Beautiful numbers CodeForces - 55D
- codeforces 651B Beautiful Paintings (想法)AI
- 題解:CF1264D Beautiful Bracket SequenceRacket
- 深度學習——學習目錄——學習中……深度學習
- 深度學習(一)深度學習學習資料深度學習
- 深度學習學習框架深度學習框架
- 強化學習-學習筆記3 | 策略學習強化學習筆記
- 學習產品快報09 | “CSDN學習”:增加學習提醒,提示學習不忘記
- 【強化學習】強化學習/增強學習/再勵學習介紹強化學習
- 學習ThinkPHP,學習OneThinkPHP
- 前端學習之Bootstrap學習前端boot
- 學而習之,成就學習
- 前端週刊第62期:學習學習再學習前端
- 深度學習+深度強化學習+遷移學習【研修】深度學習強化學習遷移學習
- 強化學習-學習筆記2 | 價值學習強化學習筆記
- [LeetCode] 2070. Most Beautiful Item for Each QueryLeetCode
- Golang 學習——interface 介面學習(一)Golang
- Golang 學習——interface 介面學習(二)Golang