AB test 中的AA test有什麼作用?

996是浮豹發表於2020-11-23

什麼是A / A測試?

A / A測試是A / B測試的衍生產品。但是不同的是,我們不是比較兩個不同的版本,而是比較兩個相同的版本。

A / A測試的主要目的很簡單:驗證A / B測試解決方案是否已正確配置且有效

我們在三種情況下使用A / A測試:

  • 檢查A / B測試工具是否正確
  • 設定轉換率作為以後測試的參考
  • 決定A / B測試的最佳樣本量

作用一:檢查A / B測試工具的準確性

在執行A / A測試時,我們會比較同一頁面的兩個完全相同的版本。

當然,A / A測試的目的是區分實驗在轉換結果方面顯示和實驗前的值很相近的問題,這裡的想法是證明測試解決方案是有效的。

從邏輯上講,當我們設定新的A / B測試解決方案或從一種解決方案轉到另一種解決方案時,我們將組織A / A測試。

但是,有時會在兩個相同的版本上宣告一個“優勝者”。

這就是A / A測試的好處,檢測A/B的準確性,A/B的不準確性可能有:

  • 測試可能未正確進行
  • 該工具可能未正確配置
  • A / B測試解決方案可能無效

作用二:設定參考轉換率

假設要在首頁上設定一系列A / B測試。設定瞭解決方案,但出現了一個問題:不知道將不同版本比較,應該達到哪個轉換率才是合理的

在這種情況下,A / A測試將幫助您找到將來的A / B測試的“參考”轉換率。

例如, 在主頁上開始A / A測試,目標是填寫聯絡表格。比較結果時,得到的結果幾乎相同(這是正常的):5.01%和5.05%的轉換。

現在,可以先確定使用該資料,它代表當前資料的轉換率波動,然後啟用A / B測試以嘗試超過該轉換率(超過AA驗證的轉換率)

如果A / B測試的結果是“更好”的變體只實現了5.05%的轉化(上述AA的轉化率結果),這實際上意味著並我們的A/B測試沒有進展。

作用三:尋找樣本量以備將來測試

比較兩個類似版本的問題包含“運氣”因素。

由於測試是在統計基礎上制定的,因此存在一定的誤差範圍,可能會影響A / B測試活動的結果。

如何減少這種誤差幅度:必須增加樣本量,以減少隨機因素(所謂的“運氣”)使結果偏斜的風險。

通過執行A / A測試,可以“檢視”測試解決方案在相同版本之間最接近“完美平等”的樣本大小。

簡而言之,通過A / A測試,可以找到使“運氣”因子最小化的樣本數量;然後,可以將該樣本量用於以後的A / B測試。也就是說,A / B測試通常想需要較小的樣本量。

A / A測試:浪費時間嗎?

這個問題在A / B測試領域引起了激烈的爭論:在進行A / B測試之前,我們是否應該花時間進行A / A測試?

實際上,執行A / A測試要花費時間,比A / B測試要花費更多的時間,因為證明這兩個“相同變體”導致相同轉換率所需的流量很大。

問題在於A / A測試非常耗時,並且會佔用可用於進行“真實測試”的流量。

如果執行的網站正在啟動或流量很少,那麼浪費的時間進行A / A測試是沒有用的:將重點放在優化購買渠道或客戶生命週期價值上:結果將是更令人信服,甚至更能落地。