day11 Xpath

YuFu259發表於2024-06-07

原文網址 : https://www.cnblogs.com/FGOO/p/18237276

網頁分析有優勢，全稱XML Path Language一種小型的查詢語言
優點：可在XML中查詢資訊
支援HTML的查詢
透過元素和屬性進行導航
PY使用需要安裝庫：安裝lxml
selector = etree.HTML（html_doc）//例項化物件，實際上就是一個Element類，透過

邏輯運算：
//div[@id and @class]查詢同時擁有的元素
//title | //price # 選取文件中的所有title和price元素，'|'兩邊必須是完整xpath路徑
屬性查詢：
單引號和雙引號//
練習
讀，存，提取

檔案控制代碼：目錄檔案獲取//在html檔案裡面查詢豆瓣top250.html，模式為mode=r 讀
file = open("html檔案/豆瓣top250.html",mode="r")
游標移動：讀檔案個數或者數字的時候，第一個讀取和第二個讀取是連線上的
迴圈高效獲取資料
for line in file:\每次迴圈file的資料都會賦值給line，在列印出來記憶體的垃圾回收
print(line)\缺點是分次列印，資料是分段的，雖然可以達到效果
寫檔案的完整操作：儲存爬蟲資料到檔案上面
file = open("豆瓣優秀電影.json，mode=''w") //模式寫，建立一個json的檔案 a追加
import json //引入
infosStr = json.dumps(infos,ensure_ascii=False)//ascii=False 不轉碼，直接輸出格式
file.write(infosStr)//寫入檔案，先清空後但是會覆蓋
file.close()//經常需要關閉檔案

day11
2024-10-18
Xpath
2024-06-16
Day11:request庫
2019-04-01
Day11 go unnoticed
2018-10-01
Go
xpath解析
2024-04-27
初始xpath
2024-03-28
day11打卡
2024-08-30
python xpath用法
2018-07-30
Python
Xpath,XQuery,DTD
2018-05-21
day11(python)裝飾器
2018-10-22
Python
『網賽總結』Day11
2024-08-21
day11 棧與佇列
2024-07-27
佇列
cgb2007-京淘day11
2020-11-14
爬蟲 – xpath 匹配
2018-12-20
爬蟲
Python爬蟲-xpath
2018-06-08
Python爬蟲
Python爬蟲——XPath
2018-07-28
Python爬蟲
如何手寫xpath
2020-08-10
Xpath helper外掛
2019-05-20
XPath 語法概述
2022-08-14
2-44鍾靜雯_day11
2020-12-29
xPath 用法總結整理
2019-01-21
Xpath語法格式整理
2018-08-10
selenium中的xpath定位
2018-04-09
Selenium：xPath 定位實踐
2020-08-22
測試工具-XPath使用
2020-09-26
xpath中常用的方法
2020-10-16
XPath學習筆記
2019-01-05
筆記
Xpath解析及其語法
2024-12-04
Linux學習 day11之docker續集
2020-12-06
LinuxDocker
Python爬蟲——Xpath和lxml
2019-01-20
Python爬蟲XML
爬蟲之xpath的使用
2024-04-02
爬蟲
python使用xpath（超詳細）
2020-10-07
Python
Go語言處理—Day11—反射機制
2020-12-24
Go反射
淺談python中的xpath用法
2018-07-28
Python
xpath beautiful pyquery三種解析庫
2019-08-05
selenium之xpath語法總結
2020-10-09
【推薦】好用的 XPath 外掛
2020-11-22
Python爬蟲之XPath語法
2019-05-20
Python爬蟲

day11 Xpath

相關文章