python 包之 selenium 自動化使用教程

autofelix發表於2022-03-23

一、安裝

pip install Selenium

 

二、初始化瀏覽器

  • Chrome 是初始化谷歌瀏覽器

  • Firefox 是初始化火狐瀏覽器

  • Edge 是初始化IE瀏覽器

  • PhantomJS 是一個無介面瀏覽器。

from selenium import webdriver
 
driver = webdriver.Chrome()

 

三、設定瀏覽器大小

  • maximize_window 最大化視窗

  • set_window_size 自定義視窗大小

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()

 

四、訪問頁面

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')

 

五、定位元素

  1. 通過元素id定位

  • 定位一個元素:find_element_by_id

  • 定位多個元素:find_elements_by_id

  1. 通過元素name定位

  • 定位一個元素:find_element_by_id

  • 定位多個元素:find_elements_by_id

  1. 通過xpath表示式定位

  • 定位一個元素:find_element_by_id

  • 定位多個元素:find_elements_by_id

  1. 通過完整超連結定位

  • 定位一個元素:find_element_by_id

  • 定位多個元素:find_elements_by_id

  1. 通過部分連結定位

  • 定位一個元素:find_element_by_id

  • 定位多個元素:find_elements_by_id

  1. 通過標籤定位

  • 定位一個元素:find_element_by_id

  • 定位多個元素:find_elements_by_id

  1. 通過類名進行定位

  • 定位一個元素:find_element_by_id

  • 定位多個元素:find_elements_by_id

  1. 通過css選擇器進行定位

  • 定位一個元素:find_element_by_id

  • 定位多個元素:find_elements_by_id

# 找到百度首頁的輸入框
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw')

 

六、定位元素另一種寫法

  • 需引入By模組

from selenium import webdriver
from selenium.webdriver.common.by import By
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element(By.ID, 'kw')

 

七、元素的互動

  • 點選某個元素:click()

  • 模擬輸入:send_keys()

  • 清除操作:clear()

  • 提交表單:submit()

  • 獲取元素的屬性值:get_attribute(name)

  • 獲取元素的位置:location

  • 獲取元素的文字值:text

  • 獲取元素的大小:size

  • 獲取元素的id值:id

  • 獲取元素的標籤名:tag_name

#  在百度輸入框中輸入我是autofelix,並點選搜尋按鈕
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw').send_keys('我是autofelix')
driver.find_element_by_id('su').click()

 

八、執行JS

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
js_sql = '''
    document.getElementById('kw').value = '我是autofelix'
'''
driver.execute_script(js_sql)

 

九、操作Frame

  • 網頁中frame的話,需要執行切入切出操作

  • switch_to.from(子iframe的id名稱) 切入

  • switch_to.parent_frame(父iframe的id名稱) 切出

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
//這個網址並沒有iframe,我臆測有,你們看看就行
driver.switch_to.frame('我臆測出來的iframe')

 

十、cookie操作

  • 刪除當前頁面所有cookies:delete_all_cookies()

  • 獲取指定cookie值:get_cookie(name)

  • 獲取當前頁面所有cookies值:get_cookies()

  • 設定cookie值:add_cookie()

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
driver.delete_all_cookies()
driver.add_cookie({'name': 'name', 'domain': '.baidu.com', 'value': 'autofelix'})

 

十一、選項卡管理

  • 儲存所有選項卡的元組:window_handles

  • 切換選項卡:switch_to.window()

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
driver.get('https://www.taobao.com')
 
driver.switch_to.window(driver.window_handles[0])
driver.switch_to.window(driver.window_handles[1])

 

十二、滑鼠事件

  • 滑鼠事件需要引入ActionChains模組

  • 滑鼠右擊:move_to_element(above)

  • 滑鼠雙擊:double_click()

  • 左鍵按住拖動:drag_and_drop()

  • 動作儲存:perform()

# 滑動滑塊驗證碼
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
# 初始化谷歌瀏覽器
driver = webdriver.Chrome()
 
# 最大化視窗
driver.maximize_window()
 
# 開啟頭條登陸網址
driver.get('https://sso.toutiao.com')
 
# 等待某個元素是否出現
WebDriverWait(self.driver, 10).until(
    EC.text_to_be_present_in_element((By.XPATH, '//*[@id="mobile-code-get"]/span'), u'傳送')
)
 
# 例項化滑鼠操作
action = ActionChains(self.driver)
 
# 按住滑塊
action.click_and_hold(self.driver.find_element_by_xpath('//*[@id="captcha_container"]')).perform()
 
# 將滑塊移動x的距離
action.move_by_offset(xoffset=x, yoffset=0).perform()
 
# 釋放滑塊
action.release().perform()

 

十三、等待

  • 隱氏等待:如果到一定時間,指定的元素還沒有出現,程式不會阻塞,但是到指定時間還沒有找到,就會丟擲異常

  • 顯示等待:如果在一定時間內,指定的元素沒有出現,程式會阻塞在這裡,如果到指定時間還沒有找到,就會丟擲異常

# 隱氏等待
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.implicitly_wait(10)
 
driver.get('https://www.baidu.com')
# 顯示等待
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
driver = webdriver.Chrome()
driver.implicitly_wait(10)
 
driver.get('https://www.baidu.com')
WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, 'kw'))
)

 

十四、前進後退重新整理

  • 後退:back()

  • 前進:forward()

  • 重新整理:refresh()

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.get('https://www.taobao.com')
driver.get('https://www.jd.com')
 
driver.back()
driver.forward()
driver.refresh()

 

十五、關閉瀏覽器

  • 關閉當前標籤頁:close()

  • 關閉整個瀏覽器:quit()

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
//開啟百度頁面後,關閉整個瀏覽器
driver.quit()

 

相關文章