1、XPath提取器介紹
有些WEB專案是前後端不分離的,介面返回的內容不是Json格式的資料,而返回的是一個HTML頁面。並且有些引數是隱藏在HTML頁面裡面的,需要從HTML頁面中提取出這些隱藏引數,這個時候就會用到XPath提取器元件。
XPath提取器元件常用於介面返回值為HTML或XML格式資料的時候,進行資料的提取。
XPath提取器元件在後置處理器元件中,後置處理器主要的作用,在請求結束或者返回響應結果時發揮作用。
2、XPath提取器介面詳解
新增XPath提取器元件操作:選中“取樣器”右鍵 —> 新增 —> 後置處理器 —> XPath提取器
。
介面如下圖所示:
下面是XPath提取器元件的詳細說明:
- 名稱:XPath提取器元件的自定義名稱,見名知意最好。
- 註釋:即新增一些備註資訊,對該XPath提取器元件的簡短說明,以便後期回顧時檢視。
(1)Apply to
:作用範圍(返回內容的取值範圍)
Main sample and sub-samples
:作用於父節點的取樣器及對應子節點的取樣器。Main sample only
:僅作用於父節點的取樣器。Sub-samples only
:僅作用於子節點的取樣器。JMeter Variable Name to use
:作用於JMeter變數(輸入框內可輸入JMeter的變數名稱),從指定變數中提取需要的值。
(2)XML Parsing Options
:要解析的XML引數
Use Tidy (tolerant parser)
:當需要處理的頁面是HTML格式時,必須選中該選項;如果是XML或XHTML格式,則取消選中。Quiet
:表示只顯示需要的HTML頁面。Report errors
:表示顯示響應報錯。Show warnings
:表示顯示警告。Use Namespaces
:如果啟用該選項,後續的XML解析器將使用名稱空間來分辨。Validate XML
:根據頁面元素模式進行檢查解析。Ignore Whitespace
:忽略空白內容。Fetch external DTDs
:如果選中該項,外部將使用DTD規則來獲取頁面內容。
(3)第三部分內容
Return entire XPath fragment of text content
:表示是否返回文字內容的整個XPath片段。Reference Name
:定義提取值的變數名稱。XPath Query
:用於提取值的XPath表示式。- 匹配數字(0代表隨機):表示取值是第幾個匹配結果,因為有可能XPath表示式會匹配到多個值。0表示隨機,-1表示全部,1代表第一個,2代表第二個,以此類推。
Default Value
:引數的預設值。也就是取不到值時的預設值。
總結XPath提取器元件:
對所有符合條件的取樣器按順序進行取樣。
例如,如果有一個主取樣器和三個子取樣器,每個取樣器都有一個符合條件的匹配結果(總共4個)。
當設定為
Sub-samples only
時,匹配數字為3,則第三個子取樣器的匹配結果返回;當匹配數字為0或者負數,所有的合格的取樣器都將被處理,而當匹配數字>0,一旦找到足夠的匹配,比對就停止下來。
3、XPath提取器的使用
需求:
- 訪問網易官網,獲取title值。
- 將title值放入百度搜尋框,進行搜尋。
(1)測試計劃內包含的元件
新增元件操作步驟:
- 建立測試計劃。
- 建立執行緒組:
選中“測試計劃”右鍵 —> 新增 —> 執行緒(使用者) —> 執行緒組
。 - 線上程組下,新增取樣器“HTTP請求”元件:
選中“執行緒組”右鍵 —> 新增 —> 取樣器 —> HTTP請求
。 - 在取樣器下,新增後置處理器“XPath提取器”元件:
選中“取樣器”右鍵 —> 新增 —> 後置處理器 —> XPath提取器
。 - 線上程組下,新增監聽器“察看結果樹”元件:
選中“執行緒組”右鍵 —> 新增 —> 監聽器 —> 察看結果樹
。
提示:需要重複新增的元件這裡不重複描述。
最終測試計劃中的元件如下:
點選執行按鈕,會提示你先儲存該指令碼,指令碼儲存完成後會直接自動執行該指令碼。
提示:提取器一定要新增在你指定的某個請求下面,作為他的子請求,否則提取不到指定的資料!
(2)網易首頁請求介面內容
非常簡單的Get請求,之前說了很多次了,這裡就不做解釋了。
介面內容如下圖所示:
(3)XPath提取器介面內容
我們在編輯XPath提取器元件之前,一般先請求一下需要提取返回資料的介面。
因為我們需要先檢視一下需要提取的資料在什麼位置,如下圖所示:
然後選擇XPath Tester
檢視模式,先手動編寫XPath表示式,看看是否能夠取到需要的資料。
如下圖所示:
注意兩點:
- 選擇
XPath Tester
模式進行XPath表示式的編寫驗證。 - 如果是在HTML頁面原始碼中提取資料,
Use Tidy (tolerant parser)
選擇一定要勾選,否則會報錯。
之後我們就可以編寫XPath提取器元件介面了,如下:
編寫引用名稱、XPath表示式、匹配資料選擇,還有Use Tidy
選項一定要勾選,否則不能取到資料。
XPath提取器元件提取出來的資料,會儲存線上程變數中,供其他後續介面使用。
關於XPath表示的寫法,可以看Selenium相關的文章,裡面有詳細的寫法。
(4)百度首頁請求介面內容
填寫介面的基本請求資訊,然後把XPath提取器提取出來的資料,作為引數化變數應用到請求中。
如下圖所示:
提示:如果此時直接執行該指令碼,請求百度搜尋網易的介面會執行,但是沒有返回資料的,因為百度拒絕你的訪問,我們需要設定請求頭
User-Agent
屬性,來模擬是一個瀏覽器訪問,如User-Agent=Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400
,這樣百度就不會拒絕訪問了。
(5)檢視結果
我們可以看到再第二個請求中,拿到了第一個請求提取出來的資料“網易”。
如下圖所示:
再來看看第二個請求響應的結果,可以看到有網易_百度搜尋
的title
屬性,說明在百度已經進行了網易搜尋。
如下圖所示:
提示:可以新增
Debug PostProcessor
(除錯後置處理器),或者Debug Sampler
(除錯取樣器),來檢視Xpath提取器中,提取出的內容是否正確。注意:正常跑用例時刪除或禁用它們。
4、總結
XPath提取器通常是從網頁原始檔中,提取資料時用的比較多。提取完引數後,相當於把引數以 key-value
的形式,存放到引數池中,以便後面的請求使用。
注意:不能超前引用。