【Excel系列】Excel資料分析:方差分析

weixin_33912445發表於2017-07-16

單因素方差分析

12.1 單因素方差分析基本理論

(1)單因素方差分析的概念

單因素方差分析,是指對單因素試驗結果進行分析,檢驗因素對試驗結果有無顯著性影響的方法。單因素方差分析是兩個樣本平均數比較的引伸,它是用來檢驗多個平均數之間的差異,從而確定因素對試驗結果有無顯著性影響的一種統計方法。。

因素:影響研究物件的某一指標、變數。

水平:因素變化的各種狀態或因素變化所分的等級或組別。

單因素試驗:考慮的因素只有一個的試驗叫單因素試驗。

例如,將抗生素注入人體會產生抗生素與血漿蛋白質結合的現象,以致減少了藥效。下表列出了5種常用的抗生素注入到牛的體內時,抗生素與血漿蛋白質結合的百分比。現需要在顯著性水平α = 0.05下檢驗這些百分比的均值有無顯著的差異。設各總體服從正態分佈,且方差相同。

表 12-1 試驗資料

1193783-725d0c449ab0a84a.png

在這裡,試驗的指標是抗生素與血漿蛋白質結合的百分比,抗生素為因素,不同的5種抗生素就是這個因素的五個不同的水平。假定除抗生素這一因素外,其餘的一切條件都相同。這就是單因素試驗。試驗的目的是要考察這些抗生素與血漿蛋白質結合的百分比的均值有無顯著的差異。即考察抗生素這一因素對這些百分比有無顯著影響。這就是一個典型的單因素試驗的方差分析問題。

1193783-010c0c9eb95bc840.png!thumbnail

(2)單因素方差分析的基本思想

1193783-5fb206688bf920ec.png!thumbnail
1193783-916bcb0e1af5eb14.png!thumbnail

(3)檢驗所需的統計量

1193783-35f236f78653e89e.png!thumbnail

(4)假設檢驗的拒絕域

表 12-2 方差分析表

1193783-b1fcfb405d7db991.png!thumbnail

12.2 單因素方差分析工具使用

如果只有兩個樣本,則可使用工作表函式 TTEST。如果有兩個以上的樣本,則沒有使用方便的 TTEST 歸納,可改為呼叫“單因素方差分析”模型。

(1)建立一張工作表,輸入資料:

1193783-1f357e75906d4769.png!thumbnail

圖 12-1 輸入資料

(2)從“資料”選項卡選擇“資料分析”,從“資料分析”列表框中選擇“方差分析:單因素”,單擊“確定”彈出單因素方差分析對話方塊。

1193783-12b1fea529c5ebe9.png!thumbnail

圖 12-2 資料分析工具對話方塊

1193783-c61bfe7b32386022.png!thumbnail

圖 12-3 單因素方差分析對話方塊

1193783-1a8c167722fcd538.png!thumbnail

圖 12-4 方差分析輸出結果

無重複雙因素分析

13.1 無重複雙因素方差分析原理簡介

(1)無重複雙因素方差分析的概念

在許多實際問題中,往往要同時考慮兩個因素對試驗指標的影響. 例如,要同時考慮工人的技術和機器對產品質量是否有顯著影響. 這裡涉及到工人的技術和機器這樣兩個因素. 多因素方差分析與單因素方差分析的基本思想是一致的,不同之處就在於各因素不但對試驗指標起作用,而且各因素不同水平的搭配也對試驗指標起作用. 統計學上把多因素不同水平的搭配對試驗指標的影響稱為互動作用. 互動作用的效應只有在有重複的試驗中才能分析出來.

對於雙因素試驗的方差分析,我們分為無重複和可重複試驗兩種情況來討論. 對無重複試驗只需要檢驗兩個因素對試驗結果有無顯著影響;而對等重複試驗還要考察兩個因素的互動作用對試驗結果有無顯著影響。

設因素A,B作用於試驗指標。因素Ar個水平A1,A2,…,Ar,因素Bs個水平B1,B2,…,Bs. 對因素AB的每一個水平的一對組合(Ai,Bj),(i=1,2, ,r,j=1,2, ,s)只進行一次實驗,得到rs個試驗結果Xij。列於下表中。

表 13-1 試驗資料表

1193783-5a75aae92a1fb021.png

(2)無重複雙因素方差分析的假設前提

1193783-91beb87d83e90a7d.png!thumbnail
1193783-84065ac8b6359c89.png!thumbnail

(3)偏差平方和及其分解

類似於單因素方差分析,需要將總偏差平方和進行分解. 記

1193783-b027b53215d4e017.png!thumbnail

(4)檢驗方法

1193783-af9ccd2ee12ebb8e.png!thumbnail

表 13-2 方差無重複試驗雙因素方差分析表

1193783-23f5dcf4e01592a4.png!thumbnail

13.2 無重複雙因素方差分析工具使用

例:4名工人(B1,B2,B3,B4)操作機器(A1,A2,A3)各一天,其日產量如表,問不同工人和同機器對日產量是否有顯著影響(α=0.05)。

1193783-9eade66a1d94f748.png

Excel操作:

(1)在一張Excel表格中輸入如下資料

1193783-3dc1db7d042d57f1.png!thumbnail

圖 13-1 輸入實驗資料

(2)從“資料”選項卡選擇“資料分析”,從“資料分析”列表框中選擇“方差分析:無重複雙因素”。

1193783-d86b9ae55bccfa3e.png!thumbnail

圖 13-2 資料分析對話方塊

(3)單擊“確定”彈出“方差分析:無重複雙因素分析”對話方塊。

1193783-b4fda60b1dd15a6e.png!thumbnail

圖 13-3 無秤星雙因素方差分析對話方塊

(4)設定完對話方塊後,單擊“確定”,得方差分析表。

1193783-406e7d17c62d2e3c.png!thumbnail

圖 13-4 結果輸出

當P值大於顯著水平時,就將顯著,否則不顯著。可見,若顯著水平為0.05,行(A因素)效應顯著,而列效應不顯著。

可重複雙因素分析

14.1 可重複雙因素方差分析原理簡介

(1)可重複雙因素方差分析的概念

可重複雙因素方差分析與無重複雙因素方差分析的區別在於考慮互動作用。因素A與因素B每一對組合(Ai,Bj)(i=1,…,r,j=1…,s)要進行t(t≥2)次實驗(也稱為等重複雙因素試驗)。實驗結果為Xijk。

例:某問題因素A有4個水平,因素B有3個水平,每一組合下做3次試驗,試驗結果如下:

表 14-1 試驗資料表

1193783-67b6c707328803cc.png

試進行等重複雙因素方差分析

(2)雙因素方差分析的假設前提

可重複雙因素方差分析的假設前提與無重複雙因素方差分析相同。

(3)偏差平方和及其分解

1193783-4551358a525943b2.png!thumbnail
1193783-ea1e18d4abb21460.png!thumbnail

(4)檢驗方法

1193783-fdebb5989a847d1e.png!thumbnail
1193783-65147ceb6f5ae5b2.png!thumbnail

可得如下方差分析表:

表 14-2 有秤星試驗雙因素方差分析表

1193783-e7bb266bb9c99ab7.png!thumbnail

14.2 可重複雙因素方差分析工具的使用

承上例,Excel操作如下:

(1)開啟一張新的EXCEL表,輸入如下資料。

1193783-9d191dc83196f181.png!thumbnail

圖 14-1 試驗資料

(2)從“資料”選項卡選擇“資料分析”,選擇“方差分析:可重複雙因素分析”調出可重複雙因素方差分析

1193783-2caba5be8840838d.png!thumbnail

圖 14-2 可重複雙因素方差分析對話方塊

圖中“輸入區域”應包括因素名稱等全部單元格區域;每一樣本的行數為各因素每一水平搭配實驗的次數“k”

(3)單擊“確定”按鈕,得到方差分析表。

1193783-564b1f0389a1f8c6.png!thumbnail

圖 14-3 結果輸出

這裡的樣本為B因素效應,列為A樣本效應,互動為A×B效應,內部為誤差。我們關心的是P值(P-value),即截尾概率。當P值<α時,就可以說在顯著水平α下效應顯著。由表可見,B因素效應顯著,互動作用效應顯著,而A因素效應不顯著。也可以由F統計量和F臨界值進行判斷:當F>F crit時,效應顯著,否則不顯著。


1193783-1556476f7b8b3d19.png
大資料訂閱號(ID:BigData07)

相關文章