根據業務摸索出的一個selenium程式碼模版（python）

Eri發表於2021-01-16

原文網址 : https://www.cnblogs.com/jsoneri/p/14287930.html

Python

前言

總算入行上班幾個月了，不得不說業務是真的不消停啊。。
本人工作上經常遇到一種場景：為甲方做自動化介面處理工具，登入需要簡訊驗證碼，，
嘛算是摸索出了一套selenium程式碼模板，主要解決如下痛點

會話超時/斷開時，又要找甲方問簡訊等驗證碼登入
除錯途中增減修改功能，算是除錯中熱更新

分享一下

模板程式碼

app.py

#!/usr/bin/python
# -*- coding: utf-8 -*-
import os
import importlib
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import backend

basepath = os.path.abspath(os.path.dirname(__file__))
driver_path = os.path.join(basepath, 'chromedriver.exe')
logger = backend.logger


def init_browser(driver_path=None):
    options = webdriver.ChromeOptions()
    options.add_argument('--no-sandbox')
    options.add_argument('--disable-gpu')
    prefs = {
        'profile.default_content_setting_values': {
            'notifications': 2
        }}
    options.add_experimental_option('prefs', prefs)
    options.add_experimental_option('excludeSwitches', ['enable-automation'])
    options.add_experimental_option("useAutomationExtension", False)
    browser = webdriver.Chrome(options=options, executable_path=driver_path)
    browser.maximize_window()
    browser.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
        "source": """
        Object.defineProperty(navigator, 'webdriver', {
          get: () => undefined
        })
      """
    })
    return browser


def jump_security(wait, mouse):
    wait.until(EC.presence_of_element_located((By.ID, 'details-button'))).click()
    ele = wait.until(EC.presence_of_element_located((By.ID, 'proceed-link')))
    mouse.move_to_element(ele).click().perform()


def init_login(driver, wait, mouse):
    username_inp = wait.until(EC.presence_of_element_located((By.ID, "username")))
    username_inp.send_keys("user")
    password_inp = driver.find_element_by_id("password")
    password_inp.send_keys("password")


class App(object):
    def __new__(cls, *args, **kwargs):
        if not hasattr(cls, '_instance'):
            cls.error_num = 0
            cls.driver = init_browser(driver_path)
            cls.wait = WebDriverWait(cls.driver, 20)
            cls.mouse = ActionChains(cls.driver)
            cls.driver.get('https://www.target.com/login')
            # jump_security(cls.wait, cls.mouse)
            init_login(cls.driver, cls.wait, cls.mouse)
            cls._instance = object.__new__(cls)
        return cls._instance


# 模式1：client無限迴圈
def run_unlimited():
    while True:
        try:
            obj = App()
            input('等待登入並進入目標頁面後，回此處按回車 >>> ')
            back = backend.Backend(obj)
            results = back.main()
        except Exception as e:
            pass
        finally:
            mode = input('供backend修改的阻塞暫停')
            importlib.reload(backend)


# 模式2：構建本地api服務
from flask import Flask
app = Flask(__name__)


@app.route("/", methods=["GET"])
def main():
    importlib.reload(backend)
    back = backend.Backend(App())
    results = back.main()


if __name__ == '__main__':
    os.system('taskkill /im chromedriver.exe /F')	# win專用，清殘留程式
    os.system('taskkill /im chrome.exe /F')
    run_unlimited()
    # app.run()

前端有兩部分，一是單例的selenium，二是此自動化處理工具的形式：client迴圈形式 / api服務形式

單例的 _new_ 裡init一些屬性，處理登入那部分也可以放後臺
兩種形式其實就是看形式是要主動觸發還是被動觸發，至於具體做什麼就放後臺

backend.py

#!/usr/bin/python
# -*- coding: utf-8 -*-
import json
import os
import re
from concurrent.futures import ThreadPoolExecutor, as_completed
import requests
import simplejson
from loguru import logger
from retry import retry
from tqdm import tqdm, trange
import urllib3

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

basepath = os.path.abspath('./')
logger.add(f'{basepath}/logs/{os.path.basename(__file__)[:-3]}.log',
           format="{level} | {time:YYYY-MM-DD HH:mm:ss} | {function}:{line} - {message}",
           level="INFO", retention='5 days')


class Backend(object):
    def __init__(self, obj):
        self.sess = requests.session()
        self.driver = obj.driver
        self.sess.headers = {'Accept': 'application/json, text/javascript, */*; q=0.01',
                             'Accept-Encoding': 'gzip, deflate',
                             'Accept-Language': 'zh-Hans-CN, zh-Hans; q=0.5',
                             'Cache-Control': 'no-cache',
                             'Connection': 'Keep-Alive',
                             'Content-Length': '561',
                             'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
                             'Cookie': 'SESSION=abcdefg',
                             'Host': 'www.target.com',
                             'Referer': 'https://www.target.com/path',
                             'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko',
                             'X-Requested-With': 'XMLHttpRequest'
                             }

    def get_cookie(self):
        self.driver.find_element_by_xpath('//input[@class="e.g:trigger btn"]').click()
        cookies = {_["name"]: _["value"] for _ in self.driver.get_cookies()}
        return cookies

    def get_headers(self):
        cookies = self.get_cookie()
        token = self.driver.execute_script('return window.sessionStorage.getItem("token")')
        self.sess.headers.update({
            'Authorization': token,
            'Cookie': f'SESSION={cookies["SESSION"]}; acw_tc={cookies["acw_tc"]}'
        })

    @retry((json.decoder.JSONDecodeError, simplejson.errors.JSONDecodeError, KeyError, ValueError), tries=3, delay=1)
    def do_api(self):
        url = 'https://www.target.com/api/path'
        payload = {
            'params': '31b1xu0',
        }
        self.get_headers()
        resp = self.sess.post(url, json=payload, verify=False, timeout=10)
        if resp.status_code == 200:
            self.pre_api_task(resp.json())  # do what you need todo
        else:
            raise ValueError(f'do_api failed:: {resp.text}')

    def do_selenium_command(self):
        self.driver.execute_script("$('p[class=imgShow]').click()")
        self.driver.execute_script("document.getElementsByClassName('supportRadioOptional1 checked')[0].click();")
        pagenum = int(re.search(r'共 (\d+) 頁', self.driver.page_source).group(1))
        for _ in trange(pagenum, ncols=40):
            self.pre_page_task()			# do what you need todo
            self.driver.execute_script(f"PaginationpageTable.gotoPage('next', '{_+2}', '50');")

    def main(self):
        self.do_selenium_command()
        self.do_api()


if __name__ == '__main__':
    requests.get('127.0.0.1:5000')

基於前面說的簡訊驗證碼，讓甲方登入後selenium一頓操作就把api的headers補完了，可以愉快地請求介面了

需要js取引數的話可以這樣寫token = self.driver.execute_script('return window.sessionStorage.getItem("token")')

目前遇到的一些注意點：

渲染的頁面帶frame，需要switch_to再xpath等處理，可把driver.page_source寫進檔案判斷是否該目標頁順帶測定位
有時driver.find_element_by_*無法定位，試試用js；有些JS/Jquery功能在老版IE上用不了，回用mouse處理（套娃呢喂）；連續使用js時要注意響應等待時間

basepath處用'./'取巧了一下(與pyinstaller打包有關)，可以基於此變數做一些本地檔案處理

Last

畢竟最終是為甲方做的，程式要以甲方裝置為準即使它是win7,用pywin32定位控制程式碼出現相容問題即使業務網站只相容IE核心，js部分功能無法用頭髮掉光了啊

畢竟是個人摸索出的，可能有更優解，如大佬路過還請不要吝嗇交~~(p)~~流~~(y)~~一下心得

Python 根據id生成唯一碼
2022-01-19
Python
根據api檔案生成程式碼
2021-10-21
API
[程式碼結構設計]根據不同條件使用不同實現類的業務程式碼設計
2018-10-21
如何根據業務封裝自己的功能元件
2019-04-18
封裝元件
Python 萬能程式碼模版：爬蟲程式碼篇
2022-08-25
Python爬蟲
OpenAPI Generator，根據Swagger/OpenAPI生成程式碼的工具
2024-07-08
APISwagger
根據業務能力實現DDD建模 - trond
2020-06-22
機器學習根據文字生成圖片教程（附python程式碼）
2018-09-05
機器學習Python
記錄一個簡陋的根據statspack查詢哪段時間事務量最大的指令碼
2019-03-03
指令碼
【python012】Python根據頁碼處理PDF檔案的內容
2024-06-25
Python
mybatis根據表逆向自動化生成程式碼
2021-08-28
MyBatis
EF3.1 根據資料庫生成程式碼
2020-11-29
資料庫
一個改進後的根據STATSPACK來查詢哪段時間內的事務量最大的指令碼
2019-03-05
指令碼
前後端分離-根據程式碼講解思路
2018-10-21
後端
python根據字典內的值實現排序
2020-11-01
Python排序
linux 下根據埠kill 程式
2021-09-22
Linux
七個不一樣的Python程式碼寫法，讓你寫出一手漂亮的程式碼
2018-09-05
Python
[golang]-根據json中的某個key的值輸出對應的id
2020-12-11
GolangJSON
物件陣列根據key 把一樣的push到一個陣列
2019-05-31
物件陣列
根據verilog畫出對應的電路圖
2020-02-17
Linux 怎麼根據程式號，找對應的程式
2019-02-20
Linux
根據URL地址生成二維碼
2019-04-05
天天寫業務程式碼，我給擼了一個業務處理框架
2022-05-16
框架
js根據字尾判斷檔案檔案型別的程式碼
2020-05-18
JS型別
PHP 如何根據鍵值刪除一個陣列中的元素
2019-12-23
PHP陣列
分享一個session過期後根據guard跳轉的實現
2021-10-09
Session
前端利器！讓AI根據手繪原型生成HTML | 教程+程式碼
2018-04-08
前端AI原型HTML
前端慌不慌？AI根據手繪原型生成HTML【附程式碼】
2018-04-11
前端AI原型HTML
根據除錯工具看原始碼之虛擬dom（一）
2019-04-01
除錯原始碼
JWT 還是 session 根據實際業務使用不是更好嗎
2019-03-26
JWTSession
將一個Python指令碼做成一個Windows服務
2024-12-10
Python指令碼Windows
Python Selenium的簡單演示程式
2018-12-26
Python
根據題庫設定刷題程式
2024-06-04
python 根據時間戳建立目錄操作
2024-10-06
Python時間戳
一個根據資料庫自動生成model類的擴充套件
2020-11-10
資料庫套件
Flutter 使用GridView寫一個根據child數量自動增加的GridList
2021-03-04
FlutterView
大資料時代，如何根據業務選擇合適的分散式框架
2019-03-03
大資料分散式框架
excel將一個工作表根據條件拆分成多個工作簿
2018-12-03
Excel

根據業務摸索出的一個selenium程式碼模版（python）

前言

模板程式碼

app.py

backend.py

Last

相關文章