統計知識:頻數表(百度名詞)

fudaliang1999發表於2013-12-04
統計描述是用統計指標、統計圖或統計表描述資料的分佈規律及其數量特徵。
頻數表是統計描述中經常使用的基本工具之一。

統計知識:頻數表(百度名詞)
1.頻數表(frequency table)的編制
在觀察值個數較多時,為了解一組同質觀察值的分佈規律和便於指標的計算,可編制頻數分佈表,簡稱頻數表。
(1)求全距(range):找出觀察值中的最大值與最小值,其差值即為全距(或極差),用R表示。
(2)確定組段和組距:根據樣本含量的大小確定“組段”數,一般設8-15個組段,觀察單位較少時組段數可相對少些,觀察單位較多時組段數可相對多些,常用全距的1/10取整做組距,以便於彙總和計算。第一組段應包括全部觀察值中的最小值,最末組段應包括全部觀察值中的最大值,並且同時寫出其下限與上限。各組段的起點和終點分別稱為下限和上限,某組段包含下限,但不包含上限,其組中值為該組段的(下限+上限)/2。相鄰兩組段的下限之差稱為組距。
(3)列表劃記:確定組段界限,列成表2.1的形式,採用計算機或用劃記法將原始資料彙總,得出各組段的觀察例數,即頻數,表中的第(1)、(3)欄即所需的頻數表。
頻數表  頻數表
2.頻數分佈的特徵
由頻數表可看出頻數分佈的兩個重要特徵:集中趨勢(central tendency)和離散程度(dispersion)。身高有高有矮,但多數人身高集中在中間部分組段,以中等身高居多,此為集中趨勢;由中等身高到較矮或較高的頻數分佈逐漸減少,反映了離散程度。對於數值變數資料,可從集中趨勢和離散程度兩個側面去分析其規律性。
3.頻數分佈的型別
頻數分佈有對稱分佈和偏態分佈之分。對稱分佈是指多數頻數集中在中央位置,兩端的頻數分佈大致對稱。偏態分佈是指頻數分佈不對稱,集中位置偏向一側,若集中位置偏向數值小的一側,稱為正偏態分佈;集中位置偏向數值大的一側,稱為負偏態分佈,如冠心病、大多數惡性腫瘤等慢性病患者的年齡分佈為負偏態分佈。臨床上正偏態分佈資料較多見。不同的分佈型別應選用不同的統計分析方法。
4.頻數表的用途
可以揭示資料分佈型別和分佈特徵,以便選取適當的統計方法;便於進一步計算指標和統計處理;便於發現某些特大或特小的可疑值。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15711267/viewspace-1062098/,如需轉載,請註明出處,否則將追究法律責任。

相關文章