優思學院|六西格瑪中的非正態的資料如何處理?教你這一招

優思學院發表於2022-07-06

正態分佈的假設

正態分佈的假設,經常應用於很多統計分析方法中,例如控制圖(Control Chart)、 製程能力分析(Cp/Cpk)、t-檢驗、及變異數分析 (Analysis of variance, ANOVA)等等。

當資料不是正態分佈時,則此類資料非服從或接近正態分佈,我們必須進一步探討並採取補救措施,包括調查原因、或者進行資料轉換、或使用其他型別的分佈)。

實際上,不少製程與可靠度資料均非呈現正態分佈, 而大部分六西格瑪與製程能力分析工具,均假設資料為正態分佈 。所以,我們作為 資料分析者六西格瑪綠帶、黑帶質量工程師等都應該瞭解一下轉換資料的方法。

統計學家George Box and David Cox發展出一套方法公式用以鑑別出一個適當的指數(Lambda=l) ,轉換資料成為正態分佈樣態(形狀),這個Lambda值代表資料的次方數。 為了達到此目的,Box-Cox轉換方法自Lambda=-5到 Lambda=+5間找尋最佳的值 。

Box-Cox轉換方法

非正態的資料可以利用Box Cox Transformation 轉化為正態的資料,這一個頗常用的方法。

例子:原始資料:


優思學院|六西格瑪中的非正態的資料如何處理?教你這一招


第一步:進行正態性檢驗,看資料是否遵循正態分佈

優思學院|六西格瑪中的非正態的資料如何處理?教你這一招

從上圖中,P<0.005,因此資料不遵循正態分佈,從直方圖中可以明顯看出資料偏向一邊。

第2步:使用Box Cox變換對資料進行變換

優思學院|六西格瑪中的非正態的資料如何處理?教你這一招


優思學院|六西格瑪中的非正態的資料如何處理?教你這一招


變換後的資料:


優思學院|六西格瑪中的非正態的資料如何處理?教你這一招


第3步:再次測試正態性

優思學院|六西格瑪中的非正態的資料如何處理?教你這一招

從上圖中,P值>0.05,因此很明顯,資料遵循正態分佈,從直方圖中我們也可以看到資料也是均勻分佈的。

如果想對六西格瑪的統計分析有更系統性的瞭解,可以報讀六西格瑪黑帶課程,成為資料分析的專業人士。

優思學院|六西格瑪中的非正態的資料如何處理?教你這一招


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70007154/viewspace-2904484/,如需轉載,請註明出處,否則將追究法律責任。

相關文章