筆記bs,資訊

發表於2019-03-25

Beautiful Soup

  • 標籤樹的下行遍歷
屬性 說明
.contents 子節點的列表,將<tag>所有的子節點存入列表
.children 子節點的迭代型別,與.contents類似,用於迴圈遍歷兒子節點
.descendants 子孫節點的迭代型別,包含所有子節點,用於迴圈遍歷兒子節點
  • 標籤樹的上行遍歷
屬性 說明
.parent 節點的父親標籤
.parents 節點先輩標籤的迭代型別,用於迴圈遍歷先輩節點
  • 標籤樹的平行遍歷
屬性 說明
.next_sibling 返回按照HTML文字順序的下一個平行節點標籤
.previous_sibling 返回按照HTML文字順序的上一個平行節點標籤
.next_siblings 迭代型別,返回按照HTML文字順序的後續所有的平行節點標籤
.previous_siblings 迭代型別,返回按照HTML文字順序的前序所有的平行節點標籤

prettify() #美化

資訊

  • 資訊標記的三種形式
  1. XML:eXtensible Markup Language
  2. JSON:Javascript Object Notation
  3. YAML:YAML Ain't Markup Language
  • .find_all(name, attrs, recursive, string,**kwargs) #返回一個列表型別,儲存查詢的結果

name: 對標籤名稱的檢索字串
attrs: 對標籤屬性值得檢索字串,可標註屬性檢索
recursive: 是否對子孫全部檢索,預設為True string: <>...</>中的字串區域檢索字串

  • 擴充套件
方法 說明
<>.find() 搜尋且返回一個結果,字串型別,同.find_all()引數
<>.find_parents() 在先輩節點中搜尋,返回列表型別,同.find_all()引數
<>.find_parent() 在先輩節點中返回一個結果,字串型別,同.find_all()引數
<>.find_next_siblings() 在後續的平行節點中搜尋,返回列表型別,同.find_all()引數
<>.find_next_sibling() 在後續平行節點中返回一個結果,字串型別,同.find_all()引數
<>.find_previous_siblings() 在前序的平行節點中搜尋,返回列表型別,同.find_all()引數
<>.find_previous_sibling() 在前序平行節點中返回一個結果,字串型別,同.find_all()引數

相關文章