All I know about A/B Test (1) : 均值型指標與比值（率）型指標的計算區別

鹹魚KOP發表於2021-03-17

原文網址 : https://www.cnblogs.com/lyh-kop/p/14550358.html

因為最近在找實習，所以打算把自己之前學過的關資料分析的知識總結（複習）一下。在總結A/B test時，我發現中文網際網路中關於A/B test的總結已經很多了，但是對於均值型指標和比值（率）型指標在設計實驗、計算統計量時的區別卻沒有一個很明確的總結。甚至有的文章給出的計算公式語焉不詳、前後矛盾，計算樣本數量給的是均值型指標的計算公式，計算Z值時又給出了比值（率）型指標的計算公式。

均值型指標和比值（率）型指標

在網際網路資料分析中，有許多指標是資料分析師所關心的，對於不同的資料分析任務需要選取合適的指標。對A/B test而言，這些指標可以分為兩類

比值（率）型，如點選率、轉化率等
均值型，如人觀看時長等

需要注意的是，在統計學中，這兩類指標的假設檢驗是不同的。這種不同主要體現在三個方面：效應量（Effect size）的計算、所需樣本量的計算以及Z檢驗統計量的計算。

所需樣本量

在給出計算樣本量之前，首先介紹一下樣本量的四個影響因素，分別是：

顯著性水平（α）：顯著性水平越低，對實驗結果的要求也就越高，越需要更大的樣本量來確保精度
統計功效（1 – β）：統計功效意味著避免犯二類錯誤的概率，這個值越大，需要的樣本量也越大
均值差異（\(\mu_1, \mu_2\)）：如果兩個版本的均值差別巨大，也不太需要多少樣本，就能達到統計顯著
標準差（σ）：標準差越小，代表兩組差異的趨勢越穩定。越容易觀測到顯著的統計結果

一個A/B test需要的樣本量就由四個指標進行計算：

比值（率）型指標

\[N = \frac{(z_{1-\alpha/2}\sqrt{2\frac{p_1 +p_2}{2}(1-\frac{p_1 +p_2}{2})} +z_{1-\beta}\sqrt{p_1(1-p_1)+ p_2(1-p_2)} )^2}{(p_1-p_2)^2} \]
其中\(p_1,p_2\)分別表示兩組樣本的比值型指標。上述方法為R和G*power中使用公式，其他工具略有不同，更多比值類樣本量計算方法，參考[2]。
均值型指標

\[N_1 = kN_2 \]

\[N_2 = (1+ \frac{1}{k})(\sigma\frac{z_{1-\alpha/2}+ z_{1-\beta}}{\mu_1 - \mu_2})^2 \]

其中\(N_1,N_2\) 分別表示兩組樣本數量；\(z_{1-\alpha/2},z_{1-\beta}\) 通過\(z\)分佈計算；\(\mu_1,\mu_2\) 分別為當前均值指標和預估改進後均值指標（或者期望檢測到的指標變化）。重點是標準差\(\sigma\) ,實驗前很難知道其大小，一般可以根據經驗值預估。

效應量（Effect size）

效應量又稱效應值，提供了對效應大小的具體測量，也就是說反映了具體效果的大小。

比值（率）型指標

\[es = 2(arcsin(\sqrt{p_1})- arcsin(\sqrt{p_2})) \]

均值型指標
\[es = \frac{\mu_1 - \mu_2}{\sigma_{pooled}} = \frac{\mu_1 - \mu_2}{\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}} \]
其中\(s_1, s_2\) 分別表示兩組樣本的標準差.

Z檢驗統計量

比值（率）型指標
- 商務與經濟統計[1]中給出的方法
  
  \[z = \frac{\overline{p}_1 - \overline{p}_2}{\sqrt{\overline{p}(1-\overline{p})(\frac{1}{n_1}+\frac{1}{n_2})}} \]
  \[\overline{p} = \frac{n_1\overline{p}_1 + n_1\overline{p}_1}{n_1 + n_2} \]
- 網路中給出的方法：
  
  \[z = \frac{(p_1 - p_2) - (\mu_1-\mu_2)}{\sqrt{\frac{p_1(1-p_1)}{n_1} + \frac{p_2(1-p_2)}{n_2}}} \]
  找了好久沒有找到推導，個人看法是把比值型指標看做伯努利分佈，則根據中心極限定理，\(B(1,p)\sim N(p,p(1-p))\)，然後從均值型指標公式推導過來。
均值型指標

\[z = \frac{(\overline{x}_1 - \overline{x}_2) - (\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \]

以上就是我總結的關於均值型指標和比值（率）型指標在A/B test中的區別，如有遺漏和錯誤，望大家多多指正。

參考文獻

[1]. 商務與經濟統計

[2]. A/B測試系列文章之怎麼計算實驗所需樣本量

[3]. A/B測試(A/B試驗)的概述、原理、公式推導、Python實現和應用

Go: 指標方法與值方法<->指標型別與值型別
2024-11-27
Go指標型別
go 方法接受者是指標型別和非指標型別的區別
2021-09-09
Go指標型別
sizeof和strlen計算陣列型別和指標型別字串
2020-10-24
陣列型別指標字串
golang中值型別，指標，引用的區別
2020-09-23
Golang型別指標
c指標型別的作用
2018-06-10
指標型別
第 10 節：複合型別-5. 指標 -- 指標與指標變數 -8. 多級指標
2019-12-09
型別指標變數
指標常量和常量指標的區別
2020-12-24
指標
golang 指標型別引起的神奇 bug
2019-05-26
Golang指標型別
常見指標型別入門
2019-05-10
指標型別
型別的本質：對變數、型別、指標的理解
2021-06-19
型別變數指標
第十五章：指標型別
2021-11-28
指標型別
【C++系列】指標物件和物件指標的區別
2024-06-05
C++指標物件
Golang研學：在用好Golang指標型別
2019-04-26
Golang指標型別
指標和引用的區別
2024-04-23
指標
【部落格1】c++測試this指標的傳入及型別
2019-04-08
C++指標型別
智慧指標和普通指標的區別
2024-11-29
指標
當char型變數遇上char*型的指標
2024-06-18
變數指標
know和know about的區別基於coca corpus
2024-12-07
Golang 學習——陣列指標和指標陣列的區別
2020-05-05
Golang陣列指標
Unreal 各種指標型別是怎麼回事
2023-02-19
Unreal指標型別
認真一點學 Go：14. 指標型別
2021-10-14
Go指標型別
BOOL,int,float,指標型別的變數a 與“零”的比較語句
2019-05-10
指標型別變數
指標陣列與陣列指標
2020-10-02
指標陣列
讀讀objc原始碼(二)：weak型別指標的實現
2019-03-04
OBJ原始碼型別指標
陣列地址與指標之間的區別與聯絡
2019-01-10
陣列指標
Go語言高階資料型別之指標篇
2024-07-06
Go資料型別指標
計算機效能評價指標
2018-08-28
計算機指標
詳解c++指標的指標和指標的引用
2018-05-25
C++指標
mybatis的 choose -- when test -- otherwise 標籤和 if test 標籤的區別
2018-05-05
MyBatis
深入解析Go非型別安全指標：技術全解與最佳實踐
2023-10-13
Go型別指標
指標與const
2018-07-23
指標
C與指標第六章指標
2020-12-07
指標
多型體驗，和探索爺爺類指標的多型性
2020-10-03
多型指標
JavaScript（1）之——this指標
2019-03-01
JavaScript指標
【原創】淺談指標（七）字串相關（詳細版本）與指標運算
2021-11-13
指標字串
C++編譯器認為的指標型別(靜態聯編)
2020-10-03
C++編譯指標型別
Rust 中的Box指標使遞迴型別成為可能 - Knoldus Blogs
2021-12-02
Rust指標遞迴型別
準確率評價指標
2020-10-05
指標