全網最全python庫selenium自動化使用教程

pythonlaodi發表於2020-10-30

一、安裝selenium

pip install Selenium

二、初始化瀏覽器

  • Chrome 是初始化谷歌瀏覽器
  • Firefox 是初始化火狐瀏覽器
  • Edge 是初始化IE瀏覽器
  • PhantomJS 是一個無介面瀏覽器。
 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

三、設定瀏覽器大小

  •  maximize_window 最大化視窗
  • set_window_size 自定義視窗大小
 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.maximize_window()

四、訪問頁面

 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4.  
  5. driver.get('https://www.baidu.com')

五、定位元素

  • 定位元素的基本方法如下
定位一個元素定位多個元素解釋
find_element_by_idfind_elements_by_id通過元素id定位
find_element_by_namefind_elements_by_name通過元素name定位
find_element_by_xpathfind_elements_by_xpath通過xpath表示式定位
find_element_by_link_textfind_elements_by_link_tex通過完整超連結定位
find_element_by_partial_link_textfind_elements_by_partial_link_text通過部分連結定位
find_element_by_tag_namefind_elements_by_tag_name通過標籤定位
find_element_by_class_namefind_elements_by_class_name通過類名進行定位
find_elements_by_css_selectorfind_elements_by_css_selector通過css選擇器進行定位
  • 例項演示:  找到百度首頁的輸入框
 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.get('https://www.baidu.com')

  5. driver.find_element_by_id('kw')

六、定位元素的另一種寫法

  • 需引入By模組
 
  1. from selenium import webdriver

  2. from selenium.webdriver.common.by import By

  3.  
  4. driver = webdriver.Chrome()

  5. driver.get('https://www.baidu.com')

  6. driver.find_element(By.ID, 'kw')

七、元素互動

方法

解釋

click()點選某個元素
send_keys(輸入的值)模擬輸入
clear()清除操作
submit()提交表單
get_attribute(name)獲取元素的屬性值
location獲取元素的位置
text獲取元素的文字值
size獲取元素的大小
id獲取元素的id值
tag_name獲取元素的標籤名
  • 例項演示: 在百度輸入框中輸入我是autofelix並點選搜尋按鈕
 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.get('https://www.baidu.com')

  5. driver.find_element_by_id('kw').send_keys('我是autofelix')

  6. driver.find_element_by_id('su').click()

八、執行js

 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.maximize_window()

  5.  
  6. driver.get('https://www.baidu.com')

  7.  
  8. js_sql = '''

  9. document.getElementById('kw').value = '我是autofelix'

  10. '''

  11. driver.execute_script(js_sql)

九、Frame操作

  • 網頁中frame的話,需要執行切入切出操作

  • switch_to.from(子iframe的id名稱) 切入

  • switch_to.parent_frame(父iframe的id名稱) 切出

 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.maximize_window()

  5.  
  6. driver.get('https://www.baidu.com')

  7.  
  8. //這個網址並沒有iframe,我臆測有,你們看看就行

  9. driver.switch_to.frame('我臆測出來的iframe')

十、cookie的操作

方法說明
delete_all_cookies()刪除當前頁面所有cookies
get_cookie(name)獲取指定cookie值
get_cookies()獲取當前頁面所有cookies值
add_cookie()設定cookie值
 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.maximize_window()

  5.  
  6. driver.get('https://www.baidu.com')

  7.  
  8. driver.delete_all_cookies()

  9. driver.add_cookie({'name': 'name', 'domain': '.baidu.com', 'value': 'autofelix'})

十一、選項卡管理

方法解釋
window_handles儲存所有選項卡的元組
switch_to.window()切換選項卡
 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.maximize_window()

  5.  
  6. driver.get('https://www.baidu.com')

  7. driver.get('https://www.taobao.com')

  8.  
  9. driver.switch_to.window(driver.window_handles[0])

  10. driver.switch_to.window(driver.window_handles[1])

十二、滑鼠事件

  • 滑鼠事件需要引入ActionChains模組
方法說明
move_to_element(above)滑鼠右擊
double_click()滑鼠雙擊
drag_and_drop()左鍵按住拖動
perform()動作儲存
  • 例項演示: 滑動滑塊驗證碼
 
  1. from selenium import webdriver

  2. from selenium.webdriver import ActionChains

  3. from selenium.webdriver.common.by import By

  4. from selenium.webdriver.support.wait import WebDriverWait

  5. from selenium.webdriver.support import expected_conditions as EC

  6.  
  7. # 初始化谷歌瀏覽器

  8. driver = webdriver.Chrome()

  9.  
  10. # 最大化視窗

  11. driver.maximize_window()

  12.  
  13. # 開啟頭條登陸網址

  14. driver.get('https://sso.toutiao.com')

  15.  
  16. # 等待某個元素是否出現

  17. WebDriverWait(self.driver, 10).until(

  18. EC.text_to_be_present_in_element((By.XPATH, '//*[@id="mobile-code-get"]/span'), u'傳送')

  19. )

  20.  
  21. # 例項化滑鼠操作

  22. action = ActionChains(self.driver)

  23.  
  24. # 按住滑塊

  25. action.click_and_hold(self.driver.find_element_by_xpath('//*[@id="captcha_container"]')).perform()

  26.  
  27. # 將滑塊移動x的距離

  28. action.move_by_offset(xoffset=x, yoffset=0).perform()

  29.  
  30. # 釋放滑塊

  31. action.release().perform()

十三、等待

  • 隱氏等待
  • 如果到一定時間,指定的元素還沒有出現,程式不會阻塞,但是到指定時間還沒有找到,就會丟擲異常
 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.implicitly_wait(10)

  5.  
  6. driver.get('https://www.baidu.com')

  • 顯示等待
  • 如果在一定時間內,指定的元素沒有出現,程式會阻塞在這裡,如果到指定時間還沒有找到,就會丟擲異常
 
  1. from selenium import webdriver

  2. from selenium.webdriver.common.by import By

  3. from selenium.webdriver.support.ui import WebDriverWait

  4. from selenium.webdriver.support import expected_conditions as EC

  5.  
  6. driver = webdriver.Chrome()

  7. driver.implicitly_wait(10)

  8.  
  9. driver.get('https://www.baidu.com')

  10. WebDriverWait(driver, 10).until(

  11. EC.presence_of_element_located((By.ID, 'kw'))

  12. )

十四、前進、後退和重新整理

  • back 後退

  • forward 前進

  • refresh 重新整理瀏覽器

 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.get('https://www.baidu.com')

  5. driver.get('https://www.taobao.com')

  6. driver.get('https://www.jd.com')

  7.  
  8. driver.back()

  9. driver.forward()

  10. driver.refresh()

十五、關閉瀏覽器

  • close 關閉當前標籤頁

  • quit 關閉整個瀏覽器

 
  1. from selenium import webdriver

  2.  
  3. driver = webdriver.Chrome()

  4. driver.get('https://www.baidu.com')

  5. //開啟百度頁面後,關閉整個瀏覽器

  6. driver.quit()

猜你喜歡:

相關文章