正態分佈的假設
正態分佈的假設,經常應用於很多統計分析方法中,例如控制圖(Control Chart)、 製程能力分析(Cp/Cpk)、t-檢驗、及變異數分析 (Analysis of variance, ANOVA)等等。
當資料不是正態分佈時,則此類資料非服從或接近正態分佈,我們必須進一步探討並採取補救措施,包括調查原因、或者進行資料轉換、或使用其他型別的分佈)。
實際上,不少製程與可靠度資料均非呈現正態分佈, 而大部分六西格瑪與製程能力分析工具,均假設資料為正態分佈 。所以,我們作為 資料分析者、 六西格瑪綠帶、黑帶、 質量工程師等都應該瞭解一下轉換資料的方法。
統計學家George Box and David Cox發展出一套方法公式用以鑑別出一個適當的指數(Lambda=l) ,轉換資料成為正態分佈樣態(形狀),這個Lambda值代表資料的次方數。 為了達到此目的,Box-Cox轉換方法自Lambda=-5到 Lambda=+5間找尋最佳的值 。
Box-Cox轉換方法
非正態的資料可以利用Box Cox Transformation 轉化為正態的資料,這一個頗常用的方法。
例子:原始資料:
第一步:進行正態性檢驗,看資料是否遵循正態分佈
從上圖中,P<0.005,因此資料不遵循正態分佈,從直方圖中可以明顯看出資料偏向一邊。
第2步:使用Box Cox變換對資料進行變換
變換後的資料:
第3步:再次測試正態性
從上圖中,P值>0.05,因此很明顯,資料遵循正態分佈,從直方圖中我們也可以看到資料也是均勻分佈的。
如果想對六西格瑪的統計分析有更系統性的瞭解,可以報讀六西格瑪黑帶課程,成為資料分析的專業人士。