【python介面自動化】- 正則用例引數化

miki_peng發表於2021-02-21

原文網址 : https://www.cnblogs.com/miki-peng/p/14402225.html

我們在做介面自動化的時候，處理介面依賴的相關資料時，通常會使用正規表示式來進行提取相關的資料。

正規表示式，又稱正規表示式、正規表示法、正規表示式、規則表示式、常規表示法(Regular Expression，在程式碼中常簡寫為regex、regexp或RE) 。它是一個特殊的字元序列，它能幫助你方便的檢查一個字串是否與某種模式匹配。在很多文字編輯器裡，正規表示式通常被用來檢索、替換那些匹配某個模式的文字。而Python 自1.5版本起增加了re 模組，它提供 Perl 風格的正規表示式模式。

正規表示式語法

表示單字元

單字元：即表示一個單獨的字元，比如匹配數字用\d，匹配非數字用\D。

除以下語法，也可以匹配指定的具體字元，可以是1個也可以是多個。

字元	功能說明
.	匹配任意1個字元（除了\n）
[2a]	匹配[]中括號中列舉的字元，如這裡就是匹配2或者a這兩個字元其中的一個
\d	匹配數字，即0-9
\D	匹配非數字
\s	匹配空白，即空格、tab鍵（tab鍵為兩個空格）
\S	匹配非空白
\w	匹配單詞字元，即a-z、A-Z、0-9、_（數字、字母、下劃線）
\W	匹配非單詞字元

例項如下，這裡先說明一下findall(匹配規則，要匹配的字串)這個方法是查詢所有匹配的資料，以列表的形式返回，後面會在re模組進行詳解：

import re


# .：匹配任意1個字元
re1 = r'.'
res1 = re.findall(re1, '\nj8?0\nbth\nihb')
print(res1)	# 執行結果：['j', '8', '?', '0', 'b', 't', 'h', 'i', 'h', 'b']

# []：匹配列舉中的其中一個
re2 = r"[abc]"
res2 = re.findall(re2, '1iugfiSHOIFUOFGIDHFGFD2345a6a78b99cc')
print(res2)	# 執行結果：['a', 'a', 'b', 'c', 'c']

# \d:匹配一個數字
re3 = r"\d"
res3 = re.findall(re3, "dfghjkl32212dfghjk")
print(res3)	# 執行結果：['3', '2', '2', '1', '2']

# \D:匹配一個非數字
re4 = r"\D"
res4 = re.findall(re4, "d212dk？\n$%3;]a")
print(res4)	# 執行結果：['d', 'd', 'k', '？', '\n', '$', '%', ';', ']', 'a']

# \s：匹配一個空白鍵或tab鍵（tab鍵實際就是兩個空白鍵）
re5 = r"\s"
res5 = re.findall(re5,"a s d a  9999")
print(res5)	# 執行結果：[' ', ' ', ' ', ' ', ' ']

# \S: 匹配非空白鍵
re6 = r"\S"
res6 = re.findall(re6, "a s d a  9999")
print(res6)	# 執行結果：['a', 's', 'd', 'a', '9', '9', '9', '9']

# \w：匹配一個單詞字元(數字、字母、下劃線)
re7 = r"\w"
res7 = re.findall(re7, "ce12sd@#a as_#$")
print(res7)	# 執行結果：['c', 'e', '1', '2', 's', 'd', 'a', 'a', 's', '_']

# \W：匹配一個非單詞字元(不是數字、字母、下劃線)
re8 = r"\W"
res8 = re.findall(re8, "ce12sd@#a as_#$")
print(res8)	# 執行結果：['@', '#', ' ', '#', '$']

# 匹配指定字元
re9 = r"python"
res9 = re.findall(re9, "cepy1thon12spython123@@python")
print(res9)	# 執行結果：['python', 'python']

表示數量

如果要匹配某個字元多次，就可以在字元後面加上數量進行表示，具體規則如下：

字元	功能說明
*	匹配前一個字元出現0次或者無限次，即可有可無
+	匹配前一個字元出現1次或無限次，即至少1次
?	匹配前一個字元出現0次或1次，即要麼沒有，要麼只有1次
{m}	匹配前一個字元出現m次
{m,}	匹配前一個字元至少出現m次
{m,n}	匹配前一個字元出現從m到n次

例項如下：

import re


# *：表示前一個字元出現0次以上(包括0次)
re21 = r"\d*"   # 這裡匹配的規則，前一個字元是數字
res21 = re.findall(re21, "343aa1112df345g1h6699")  # 如匹配到a時，屬於符合0次，但因為沒有值所以會為空
print(res21)	# 執行結果：['343', '', '', '1112', '', '', '345', '', '1', '', '6699', '']

# ? : 表示0次或者一次
re22 = r"\d?"
res22 = re.findall(re22, "3@43*a111")
print(res22)	# 執行結果：['3', '', '4', '3', '', '', '1', '1', '1', '']

# {m}:表示匹配一個字元m次
re23 = r"1[3456789]\d{9}" # 手機號：第1位為1，第2位匹配列舉的其中1個數字，第3位開始是數字，且匹配9次
res23 = re.findall(re23,"sas13566778899fgh256912345678jkghj12788990000aaa113588889999")
print(res23)	# 執行結果：['13566778899', '13588889999']

# {m,}:表示匹配一個字元至少m次
re24 = r"\d{7,}"
res24 = re.findall(re24, "sas12356fgh1234567jkghj12788990000aaa113588889999")
print(res24)	# 執行結果：['1234567', '12788990000', '113588889999']

# {m,n}：表示匹配一個字元出現m次到n次
re25 = r"\d{3,5}"
res25 = re.findall(re25, "aaaaa123456ghj333yyy77iii88jj909768876")
print(res25)	# 執行結果：['12345', '333', '90976', '8876']

匹配分組

字元	功能說明
\|	匹配左右任意一個表示式
(ab)	將括號中字元作為一個分組

例項如下：

import re


# 同時定義多個規則，只要滿足其中一個
re31 = r"13566778899|13534563456|14788990000"
res31 = re.findall(re31, "sas13566778899fgh13534563456jkghj14788990000")
print(res31)	# 執行結果：['13566778899', '13534563456', '14788990000']

# ()：匹配分組:在匹配規則的資料中提取括號裡的資料
re32 = r"aa(\d{3})bb"	# 如何資料符合規則，結果只會取括號中的資料，即\d{3}
res32 = re.findall(re32, "ggghjkaa123bbhhaa672bbjhjjaa@45bb")
print(res32)	# 執行結果：['123', '672']

表示邊界

字元	功能說明
^	匹配字串開頭，只能匹配開頭
$	匹配字串結尾，只能匹配結尾
\b	匹配一個單詞的邊界（單詞：字母、數字、下劃線）
\B	匹配非單詞的邊界

例項如下：

import re


# ^:匹配字串的開頭
re41 = r"^python"   # 字串開頭為python
res41 = re.findall(re41, "python999python")  # 只會匹配這個字串的開頭
res411 = re.findall(re41, "1python999python")  # 因為開頭是1,第1位就不符合了
print(res41)	# 執行結果：['python']
print(res411)	# 執行結果：[]

# $:匹配字串的結尾
re42=r"python$"	# 字串以python結尾
res42 = re.findall(re42, "python999python")
print(res42)	# 執行結果：['python']

# \b:匹配單詞的邊界，單詞即:字母、數字、下劃線
re43 = r"\bpython"  # 即匹配python，且python的前一位是不是單詞
res43 = re.findall(re43, "1python 999 python")  # 這裡第1個python的前1位是單詞，因此第1個是不符合的
print(res43)	# 執行結果：['python']

# \B:匹配非單詞的邊界
re44 = r"\Bpython"  # 即匹配python，且python的前一位是單詞
res44 = re.findall(re44, "1python999python")
print(res44)	# 執行結果：['python', 'python']

貪婪模式

python裡數量詞預設是貪婪的，總是嘗試匹配儘可能多的字元，而非貪婪模式則是嘗試匹配儘可能少的字元，在表示數量的表示式後加上問號(?)就可以關閉貪婪模式。

如下例子，匹配2個以上的數字，如果符合條件它會一直匹配到不符合才停止，如其中的34656fya，34656符合2個數字以上，那麼它會一直匹配到6為止，如果關閉貪婪模式，那麼在滿足2個數字時就會停止，最後可以匹配到34、65。

import re


# 預設的貪婪模式下
test = 'aa123aaaa34656fyaa12a123d'
res = re.findall(r'\d{2,}', test)
print(res)	# 執行結果：['123', '34656', '12', '123']

# 關閉貪婪模式
res2 = re.findall(r'\d{2,}?', test)
print(res2)	# 執行結果：['12', '34', '65', '12', '12']

re模組

在python中使用正規表示式，就會用到re模組來進行操作，提供的方法一般需要傳入兩個引數：

?引數1：匹配的規則
?引數2：要進行匹配的字串

re.findall()

查詢所有符合規範的字串，以列表的形式返回。

import re


test = 'aa123aaaa34656fyaa12a123d'
res = re.findall(r'\d{2,}', test)
print(res)	# 執行結果：['123', '34656', '12', '123']

re.search()

查詢第一個符合規範的字串，返回的是一個匹配物件，可以通過group()將匹配到的資料直接提取出來。

import re


s = "123abc123aaa123bbb888ccc"
res2 = re.search(r'123', s)
print(res2)  # 執行結果：<re.Match object; span=(0, 3), match='123'>

# 通過group將匹配到的資料提取出來，返回型別為str
print(res2.group())   # 執行結果：123

返回的匹配物件中，span為匹配到的資料的下標範圍，match則是匹配到的值。

group()引數說明：

?不傳引數：獲取的是匹配到的所有內容
?傳入數值：可以通過引數來指定，獲取第幾個分組中的內容（獲取第1個分組，傳入引數1，獲取第2個分組，傳入引數2，依次類推。）

import re


s = "123abc123aaa123bbb888ccc"
re4 = r"aaa(\d{3})bbb(\d{3})ccc"	# 這裡分組就是前面說到的匹配語法：()
res4 = re.search(re4, s)
print(res4)
# group不傳引數：獲取的是匹配到的所有內容
# group通過引數指定，獲取第幾個分組中的內容（獲取第1個分組，傳入引數1，獲取第2個分組，傳入引數2，依次類推..
print(res4.group())
print(res4.group(1))
print(res4.group(2))

re.match()

從字串的起始位置進行匹配，匹配成功則返回匹配到的物件，如果開頭的位置不符合匹配的規則，不會繼續往後面去匹配，直接返回None。re.match()與re.search()都是隻匹配一個，不一樣的是，前者只匹配字串的開頭，後者則是會匹配整個字串，但只獲取第一個符合的資料。

import re


s = "a123abc123aaa1234bbb888ccc"
# match：只匹配字串的開頭，開頭不符合就返回None
res1 = re.match(r"a123", s)
res2 = re.match(r"a1234", s)
print(res1)  # 執行結果：<re.Match object; span=(0, 4), match='a123'>
print(res2)  # 執行結果：None

re.sub()

檢索和替換：用於替換字串中的匹配項

re.sub()引數說明：

?引數1：待替換的字串
?引數2：目標字串
?引數3：要進行替換操作的字串
?引數4：可以指定最多替換的次數，非必填（預設替換所有符合規範的字串）

import re


s = "a123abc123aaa123bbb888ccc"
# <font color="#FF0000">引數1：</font>待替換的字串
# <font color="#FF0000">引數2：</font>目標字串
# <font color="#FF0000">引數3：</font>要進行替換操作的字串
# <font color="#FF0000">引數4：</font>可以指定最多替換的次數，非必填（預設替換所有符合規範的字串）
res5 = re.sub(r'123', "666", s, 4)
print(res5)  # 執行結果：a666abc666aaa666bbb888ccc

用例引數化

在介面自動化測試中，我們的測試資料都是儲存在excel中的，有些引數如果寫死一個資料，可能換個場景或者換個環境就不能用了，那麼切換環境時就需要先把新環境的測試資料準備好，並且能支援去跑我們的指令碼，或者把excel的資料修改為適合新環境的測試資料，維護的成本較高。因此就需要把我們的自動化指令碼測試資料儘量地引數化，降低維護成本。

我們先看簡單版的引數化，以登入為例，登入時用到的賬號、密碼等資訊都可以提取出來放到配置檔案，修改資料或更換環境時直接在配置檔案中統一修改就可以了。

但如果有多個不同的資料需要引數化呢，每個引數都加個判斷去替換資料嗎？這樣的程式碼既囉嗦又不好維護，這時re模組就可以用上了，直接看一個例項：

import re
from common.myconfig import conf


class TestData:
    """用於臨時儲存一些要替換的資料"""
    pass


def replace_data(data):
    r = r"#(.+?)#"	# 注意這個分組()內的內容
    # 判斷是否有需要替換的資料
    while re.search(r, data):
        res = re.search(r, data)	# 匹配出第一個要替換的資料
        item = res.group()	# 提取要替換的資料內容
        key = res.group(1)	# 獲取要替換內容中的資料項
        try:
            # 根據替換內容中的資料項去配置檔案中找到對應的內容，進行替換
            data = data.replace(item, conf.get_str("test_data", key))
        except:
            # 如果在配置檔案中找不到就在臨時儲存的資料中找，然後替換
            data = data.replace(item, getattr(TestData, key))
    return data

注意這裡的正規表示式是有使用?關閉貪婪模式的，因為測試資料中可能會需要引數化2個或以上的資料，如果不關閉貪婪模式，它就只能匹配搭配一個資料，舉例如下：

import re


data = '{"mobile_phone":"#phone#","pwd":"#pwd#","user":#user#}'
r1 = "#(.+)#"
res1 = re.findall(r1, data)
print(res1)  # 執行結果：['phone#","pwd":"#pwd#","user":#user']	注意這裡單引號只有一個資料
print(len(res1))      # 執行結果：1

r2 = "#(.+?)#"
res2 = re.findall(r2, data)
print(res2)  # 執行結果：['phone', 'pwd', 'user']
print(len(res2))      # 執行結果：3

另外提到的一個用於臨時儲存資料的類，這裡主要用於儲存介面返回的資料，因為有些測試資料是動態變化的，可能要依賴於某個介面，後面的測試用例又需要這些資料，那麼我們在介面返回時就可以儲存到這個類裡作為一個類屬性，接著在需要用這個資料的測試用例時，把這個類屬性提取出來替換到測試資料中即可。提示：設定屬性setattr（物件, 屬性名, 屬性值），獲取屬性值getattr(物件, 屬性名)。

python--介面自動化鑑權例項
2018-07-17
Python
python 介面自動化
2024-07-29
Python
介面自動化之引數動態生成替換
2020-07-04
url 帶引數的介面怎樣自動化
2020-10-28
7、超引數除錯、Batch正則化
2024-10-01
除錯BAT
python介面自動化（三十四）-封裝與呼叫--函式和引數化（詳解）
2019-05-13
Python封裝函式
python+pytest介面自動化(6)-請求引數格式的確定
2022-03-10
Python
python3+requests+unittest介面自動化例項講解
2019-03-04
Python
Python 介面自動化測試
2019-09-09
Python
介面自動化（四）：框架搭建（Python）
2021-03-30
框架Python
正則特殊引數
2024-07-01
python 介面自動化 -- 依賴資料
2020-07-07
Python
【python介面自動化】初識unittest框架
2021-05-31
Python框架
正則化
2023-04-06
Python 介面自動化如果介面的引數很多 (30-50 個左右) 大家都是怎麼來管理的？
2020-12-15
Python
python介面自動化（四十一）- 發xml格式引數的post請求（超詳解）
2019-05-29
PythonXML
介面自動化與ui自動化區別
2024-09-26
UI
Python介面自動化——檔案上傳/下載介面
2022-04-05
Python
js正則格式化日期時間自動補0
2021-10-13
JS
Httpclient 介面自動化
2020-05-25
HTTPclient
全自動化介面
2022-07-14
SOLIDWORK自動化引數在傳送帶上的應用
2022-12-02
Solid
【python介面自動化】- logging日誌模組
2020-08-02
Python
Python+Pytest+Allure+Jenkins 介面自動化框架
2020-08-14
PythonJenkins框架
Jmeter+Ant+Python 介面自動化測試
2020-05-12
JMeterPython
介面自動化-python+requests+pytest+csv+yaml
2021-09-03
PythonYAML
【python介面自動化】- PyMySQL資料連線
2021-02-12
PythonMySql
自動的自動化：EvoSuite 自動生成JUnit的測試用例
2018-11-22
UI
python+pytest介面自動化(16)-介面自動化專案中日誌的使用 (使用loguru模組)
2022-05-17
Python
Web自動化-Selenium自動化測試-4-編寫測試用例
2020-12-03
Web
基於LangChain手工測試用例轉介面自動化測試生成工具
2024-08-16
LangChain
python介面自動化測試之介面資料依賴
2019-04-25
Python
python+pytest介面自動化(1)-介面測試基礎
2022-03-02
Python
python介面自動化（三十三）-python自動發郵件總結及例項說明番外篇下（詳解）
2019-05-10
Python
機器學習之簡化正則化:L2 正則化
2020-06-20
機器學習
python 裝飾器在介面自動化測試中的應用
2020-05-20
Python
python裝飾器在介面自動化測試中的應用
2020-05-20
Python
介面自動化測試
2021-01-10

【python介面自動化】- 正則用例引數化

正規表示式語法

表示單字元

表示數量

匹配分組

表示邊界

貪婪模式

re模組

re.findall()

re.search()

re.match()

re.sub()

用例引數化

相關文章