selenium爬蟲學習1

积分别忘C發表於2024-08-29

原文網址 : https://www.cnblogs.com/hackzz/p/18386310

簡介

Selenium是廣泛使用的模擬瀏覽器執行的庫，它是一個用於Web應用程式測試的工具。 Selenium測試直接執行在瀏覽器中，就像真正的使用者在操作一樣，並且支援大多數現代 Web 瀏覽器。

函式介紹


重點方法
1.find_element方法是 Selenium WebDriver 提供的一種用於查詢頁面上某個符合條件的元素的方法。
2.find_elements 方法是 Selenium WebDriver 提供的一種用於查詢頁面上所有符合條件的元素的方法。與 find_element 不同，find_elements 返回的是一個列表，其中包含所有匹配的元素。如果沒有找到任何元素，則返回一個空列表。
以下是 find_element(s) 方法的一些常見用法：
By.ID：透過元素的 ID 查詢。
By.NAME：透過元素的 name 屬性查詢。
By.CLASS_NAME：透過元素的類名查詢。
By.TAG_NAME：透過元素的標籤名查詢。
By.LINK_TEXT：透過連結文字查詢。
By.PARTIAL_LINK_TEXT：透過部分連結文字查詢。
By.CSS_SELECTOR：透過 CSS 選擇器查詢。
By.XPATH：透過 XPath 表示式查詢。
driver.find_element物件具有.click()方法，就是點選這個元素
3.driver.window_handles獲取當前所有視窗控制代碼
4.driver.switch_to.window()跳轉到某個視窗

練習程式碼

from selenium import webdriver
from selenium.webdriver.common.by import By
import time
# 初始化瀏覽器驅動
driver = webdriver.Chrome()

# 開啟百度首頁
driver.get("https://avd.aliyun.com/")
time.sleep(2)

# 定位輸入框並輸入關鍵字
search_box = driver.find_element(By.XPATH, "/html/body/header/nav/div/form/input")
search_box.send_keys("MySQL")

# 點選搜尋按鈕
search_button = driver.find_element(By.XPATH, '/html/body/header/nav/div/form/button')
search_button.click()
# 等待2秒
time.sleep(2)
res_header=driver.find_element(By.ID,'itl-header')
print(res_header.text)
tr_elements = driver.find_elements(By.XPATH,"/html/body/main/div[2]/div/div[2]/table/tbody")
for tr in tr_elements:
    # 在這裡對每個tr元素進行操作，例如提取文字內容
    print(tr.text)
link = driver.find_element(By.PARTIAL_LINK_TEXT, "AVD-2024-21177")
link.click()
all_windows = driver.window_handles
driver.switch_to.window(all_windows[-1])
searchclass=driver.find_elements(By.CSS_SELECTOR, '.border-bottom.border-gray.pb-2.mb-0')
for search in searchclass:
    print(search.text)
input("Press Enter to close the browser...")
# 關閉瀏覽器

driver.quit()

執行效果

執行過程

執行後先是開啟瀏覽器進入阿里雲漏洞庫，緊接著搜尋MYSQL相關漏洞，結果如下

透過html的id屬性找到“搜尋結果關於[mysql]的搜尋資料”這幾個字列印出來

tr_elements = driver.find_elements(By.XPATH,"/html/body/main/div[2]/div/div[2]/table/tbody")
res_header=driver.find_element(By.ID,'itl-header')
print(res_header.text)

透過xpath找到tbody裡面所有行，遍歷並列印內容

tr_elements = driver.find_elements(By.XPATH,"/html/body/main/div[2]/div/div[2]/table/tbody")
for tr in tr_elements:
    # 在這裡對每個tr元素進行操作，例如提取文字內容
    print(tr.text)

隨便定位一個漏洞介紹的連結點進去：

link = driver.find_element(By.PARTIAL_LINK_TEXT, "AVD-2024-21177")
link.click()
all_windows = driver.window_handles  # 獲取所有視窗的控制代碼
driver.switch_to.window(all_windows[-1])#有的瀏覽器並不會自動跳轉到點開的標籤頁，所以可以獲取當前所有標籤頁再利用函式跳轉

列印所有class="border-bottom border-gray pb-2 mb-0"的元素

searchclass=driver.find_elements(By.CSS_SELECTOR, '.border-bottom.border-gray.pb-2.mb-0')
for search in searchclass:
    print(search.text)

因為class的值包含空格所以不能直接By.CLASS尋找，用By.CSS_SELECTOR，每個值用點號分隔

關閉瀏覽器

python爬蟲學習1
2020-11-29
Python爬蟲
Datawhale-爬蟲-Task5（selenium學習）
2019-03-05
爬蟲
【Python學習】爬蟲爬蟲爬蟲爬蟲~
2018-05-03
Python爬蟲
爬蟲學習日記（十）selenium frame的切換
2019-03-12
爬蟲
爬蟲學習日記（十一）selenium 頁面元素更新
2019-03-14
爬蟲
爬蟲-selenium的使用
2021-02-04
爬蟲
Python爬蟲之路-selenium在爬蟲中的使用
2021-01-04
Python爬蟲
【0基礎學爬蟲】爬蟲基礎之自動化工具 Selenium 的使用
2023-04-21
爬蟲
Python爬蟲基礎之selenium
2022-07-13
Python爬蟲
爬蟲學習-初次上路
2020-11-21
爬蟲
爬蟲學習日記（九）Selenium點選事件超時改用執行JS
2019-03-04
爬蟲事件JS
什麼是爬蟲?學習Python爬蟲難不難?
2019-11-05
爬蟲Python
python爬蟲是什麼?學習python爬蟲難嗎
2021-03-31
Python爬蟲
Python爬蟲教程-26-Selenium + PhantomJS
2018-09-06
Python爬蟲JS
呼叫瀏覽器的爬蟲——selenium
2020-03-27
瀏覽器爬蟲
python實現selenium網路爬蟲
2021-03-11
Python爬蟲
爬蟲學習日記（六）
2019-01-14
爬蟲
Android 淘寶爬蟲學習
2019-03-18
Android爬蟲
爬蟲學習日記（八）
2019-01-18
爬蟲
爬蟲學習日記（七）
2019-01-15
爬蟲
爬蟲學習日記（五）
2018-12-14
爬蟲
爬蟲學習日記（三）
2018-12-07
爬蟲
爬蟲學習日記（二）
2018-11-28
爬蟲
爬蟲學習日記（一）
2018-11-28
爬蟲
11.18爬蟲學習（BeautifulSoup類）
2024-11-18
爬蟲
逆向爬蟲知識學習
2022-03-21
爬蟲
Python爬蟲之Selenium庫的基本使用
2018-11-30
Python爬蟲
Python網路爬蟲 - Phantomjs, selenium/Chromedirver使用
2019-01-22
Python爬蟲JSChrome
Python爬蟲之selenium庫使用詳解
2018-05-16
Python爬蟲
JAVA爬蟲使用Selenium自動翻頁
2024-05-15
Java爬蟲
04selenium爬蟲輕鬆入門
2024-12-08
爬蟲
【Python學習筆記1】Python網路爬蟲初體驗
2018-10-28
Python筆記爬蟲
Datawhale-爬蟲-Task1（學習get與post請求）
2019-03-01
爬蟲
【1】爬蟲概述
2018-12-01
爬蟲
python爬蟲—學習筆記-4
2024-04-23
Python爬蟲筆記
python爬蟲—學習筆記-2
2024-04-10
Python爬蟲筆記
python爬蟲js逆向學習（二）
2020-07-03
Python爬蟲JS
爬蟲之CSS語法學習
2024-10-23
爬蟲CSS

selenium爬蟲學習1

簡介

函式介紹

練習程式碼

執行效果

執行過程

相關文章