Python爬蟲開發與專案實戰 4: HTML解析大法

CopperDong發表於2018-05-15

Firebug工具的使用、正規表示式和Beautiful soup

4.1 初識Firebug

   XPath和CSS查詢路徑表示式

4.2 正規表示式

   多練習

4.3 強大的BeautifulSoup

    從HTML或XML檔案中提取資料的Python庫

    sudo apt-get install Python-bs4

    BS支援Python標準庫中的HTML解析器,還支援一些第三方的解析器,其中一個是lxml,效率高。

    sudo apt-get install Python-lxml



相關文章