statistical_c03

TimeLimitExceeded發表於2024-06-10
- [1.1.1 引例](#111-引例)
- [1.1.2 假設檢驗過程](#112-假設檢驗過程)
- [1.1.3 假設檢驗的兩個錯誤](#113-假設檢驗的兩個錯誤)
  • 假設檢驗
    • 1.1 假設檢驗
      • 1.1.1 引例
      • 1.1.2 假設檢驗過程
      • 1.1.3 假設檢驗的兩個錯誤
    • 1.2 單個正態總體的均值和方差的假設檢驗
    • 1.3 兩個正態總體的均值和方差的假設檢驗
    • 參考資料

假設檢驗

假設檢驗是統計推斷的一個主要部分。其想法和前面的最大似然類似:如果實際觀測到得到資料在某假設下不太可能出現則認為該假設錯誤。

1.1 假設檢驗

1.1.1 引例

1. 提出宣告。 (比如 “食堂的飯菜很好吃”,“菠蘿應該放在披薩上”,等等)

  • 我們的例子是某培訓機構宣稱它們的課程可以提高學生的中考分數。(去年該考試的平均分為 \(1059\),標準差為 \(210\)

2. 提出原假設 \(H_0 \text{(null hypothesis)}\) 和備選假設 \(H_A \text{(alternative hypothesis)}\)

備選假設可以單側假設也可以是雙側假設

  • \(\mu\) 為該培訓機構的學生的平均分;

  • \(H_0: \mu = 1059\)。我們假設該培訓機構的學生的平均分與全國的平均分相同(為了產生矛盾);

  • 備選假設是我們想要表達的,即 \(H_A:\mu>1059\),或者說該培訓機構的課程可以提高學生們的分數;

  • 上面的備選假設是單側假設,另一種單側假設是 \(\mu<1059\)(該培訓機構的課程會降低學生們的分數);

  • 雙側假設為 \(\mu\neq 1059\),大於或小於平均分;

3. 選擇一個顯著性水平 \(\alpha \text{ (significance level)}\) (一般為 \(0.05\)\(0.01\)

  • \(\alpha = 0.05\),稍後會解釋它的作用;

4. 收集資料。

  • 我們得到了該培訓機構中的 \(100\) 學生的成績,\(x_1,\ldots,x_{100}\),樣本均值 \(\overline{x} = 1113\)

5. 計算 \(p\) 值,\(p = P(\text{observing data | } H_0 \text{ is true})\)

  • 假設 \(H_0\) 為真(該培訓機構沒有影響),\(\mu = 1059\)(我們做這些假設是想達到機率上的矛盾)。由中心極限定理,\(n=100\) 已經算比較大了,所以這 \(100\) 個樣本的樣本均值的分佈近似均值為 \(1059\),方差為 \(\frac{210^2}{100}\) 的正態分佈。

\[\overline{X}\sim N(\mu=1059, \sigma^2 = \frac{210^2}{100}) \]

  • 那麼 \(p\) 值就是我們任取一個樣本均值,它至少和我們計算得到的均值一樣的機率。然後我們對其標準化即可,由此可得到 \(p\) 值為 \(0.0162\)

    \[\begin{align} p &= P(X\geqslant \overline{x}) = P\left(\frac{\overline{X} - \mu}{\sigma/\sqrt{n}}\geqslant \frac{\overline{x} - \mu}{\sigma/\sqrt{n}}\right)\nonumber\\ & = P\left(Z\geqslant \frac{1113 - 1059}{210/\sqrt{100}}\right) = P(Z\geqslant2.14)\approx0.0162\nonumber\\ \end{align} \]

6. 說明你的結論,結合問題背景進行解釋。

  • 如果 \(p<\alpha\),“拒絕” 原假設 \(H_0\),選擇備選假設 \(H_A\)。(因為,在原假設為真的情況下,觀察到的樣本發生的機率 \(p\) 比所定的 \(\alpha\) 要小,由此,認為原假設發生的機率較小)

  • 否則,“無法拒絕” 原假設 \(H_0\)

    因為 \(p=0.0162<0.05=\alpha\),所以當顯著性水平 \(\alpha=0.05\) 我們拒絕原假設 \(H_0\)。我們可以說根據統計表明,該培訓機構可以讓學生在該考試中達到更高的分數。

    如果 \(\alpha=0.01\) 而不是 \(0.05\),則可得到另一個結論:因為 \(p=0.0162>0.01=\alpha\),所以當顯著性水平 \(\alpha=0.01\) 我們無法拒絕原假設 \(H_0\)。沒有足夠的證據表明,該培訓機構能夠提高學生們的成績。

    注意,我們永遠不會說 “接受” 原假設。

1.1.2 假設檢驗過程

  1. 提出宣告;
  2. 提出原假設 \(H_0\) 和備選假設 \(H_A\)
    • 備選假設可以是單側的也可以是雙側的

    • 原假設通常是 \(\text{"baseline", "no effect", or "benefit of the doubt"}\)

    • 備選假是你想要證明的論點,往往與原假設相反

  3. 選擇一個顯著性水平 \(\alpha\);(通常為 \(0.05\)\(0.01\)
  4. 收集資料;
  5. 計算 \(p\) 值,\(p = P(\text{observing data | } H_0 \text{ is true})\)
  6. 說明你的結論,結合問題背景進行解釋;
    • 如果 \(p<\alpha\),“拒絕” 原假設 \(H_0\),選擇備選假設 \(H_A\)。我們認為在該假設我們的結果具有統計學意義
    • 否則,“無法拒絕” 原假設 \(H_0\)

1.1.3 假設檢驗的兩個錯誤

在解決假設檢驗問題時,無論做出否定還是接受原假設 \(H_0\) 的決定都有可能犯錯誤。

  • 第一類錯誤:\(H_0\) 成立,但是被拒絕了。(棄真);
  • 第二類錯誤:\(H_0\) 不成立,但是被

1.2 單個正態總體的均值和方差的假設檢驗

1.3 兩個正態總體的均值和方差的假設檢驗

參考資料

  • https://web.stanford.edu/class/archive/cs/cs109/cs109.1218/files/student_drive/8.3.pdf