統計知識:頻數表(百度名詞)
統計描述是用統計指標、統計圖或統計表描述資料的分佈規律及其數量特徵。
頻數表是統計描述中經常使用的基本工具之一。
![統計知識:頻數表(百度名詞)](https://i.iter01.com/images/ea599c9739f2caf7f27747c8d129b0e4a91deee7c534bffba72c2f67dffd3f7a.jpg)
1.頻數表(frequency table)的編制
在觀察值個數較多時,為了解一組同質觀察值的分佈規律和便於指標的計算,可編制頻數分佈表,簡稱頻數表。
(1)求全距(range):找出觀察值中的最大值與最小值,其差值即為全距(或極差),用R表示。
(2)確定組段和組距:根據樣本含量的大小確定“組段”數,一般設8-15個組段,觀察單位較少時組段數可相對少些,觀察單位較多時組段數可相對多些,常用全距的1/10取整做組距,以便於彙總和計算。第一組段應包括全部觀察值中的最小值,最末組段應包括全部觀察值中的最大值,並且同時寫出其下限與上限。各組段的起點和終點分別稱為下限和上限,某組段包含下限,但不包含上限,其組中值為該組段的(下限+上限)/2。相鄰兩組段的下限之差稱為組距。
(3)列表劃記:確定組段界限,列成表2.1的形式,採用計算機或用劃記法將原始資料彙總,得出各組段的觀察例數,即頻數,表中的第(1)、(3)欄即所需的頻數表。
頻數表 頻數表
2.頻數分佈的特徵
由頻數表可看出頻數分佈的兩個重要特徵:集中趨勢(central tendency)和離散程度(dispersion)。身高有高有矮,但多數人身高集中在中間部分組段,以中等身高居多,此為集中趨勢;由中等身高到較矮或較高的頻數分佈逐漸減少,反映了離散程度。對於數值變數資料,可從集中趨勢和離散程度兩個側面去分析其規律性。
3.頻數分佈的型別
頻數分佈有對稱分佈和偏態分佈之分。對稱分佈是指多數頻數集中在中央位置,兩端的頻數分佈大致對稱。偏態分佈是指頻數分佈不對稱,集中位置偏向一側,若集中位置偏向數值小的一側,稱為正偏態分佈;集中位置偏向數值大的一側,稱為負偏態分佈,如冠心病、大多數惡性腫瘤等慢性病患者的年齡分佈為負偏態分佈。臨床上正偏態分佈資料較多見。不同的分佈型別應選用不同的統計分析方法。
4.頻數表的用途
可以揭示資料分佈型別和分佈特徵,以便選取適當的統計方法;便於進一步計算指標和統計處理;便於發現某些特大或特小的可疑值。
頻數表是統計描述中經常使用的基本工具之一。
![統計知識:頻數表(百度名詞)](https://i.iter01.com/images/ea599c9739f2caf7f27747c8d129b0e4a91deee7c534bffba72c2f67dffd3f7a.jpg)
1.頻數表(frequency table)的編制
在觀察值個數較多時,為了解一組同質觀察值的分佈規律和便於指標的計算,可編制頻數分佈表,簡稱頻數表。
(1)求全距(range):找出觀察值中的最大值與最小值,其差值即為全距(或極差),用R表示。
(2)確定組段和組距:根據樣本含量的大小確定“組段”數,一般設8-15個組段,觀察單位較少時組段數可相對少些,觀察單位較多時組段數可相對多些,常用全距的1/10取整做組距,以便於彙總和計算。第一組段應包括全部觀察值中的最小值,最末組段應包括全部觀察值中的最大值,並且同時寫出其下限與上限。各組段的起點和終點分別稱為下限和上限,某組段包含下限,但不包含上限,其組中值為該組段的(下限+上限)/2。相鄰兩組段的下限之差稱為組距。
(3)列表劃記:確定組段界限,列成表2.1的形式,採用計算機或用劃記法將原始資料彙總,得出各組段的觀察例數,即頻數,表中的第(1)、(3)欄即所需的頻數表。
頻數表 頻數表
2.頻數分佈的特徵
由頻數表可看出頻數分佈的兩個重要特徵:集中趨勢(central tendency)和離散程度(dispersion)。身高有高有矮,但多數人身高集中在中間部分組段,以中等身高居多,此為集中趨勢;由中等身高到較矮或較高的頻數分佈逐漸減少,反映了離散程度。對於數值變數資料,可從集中趨勢和離散程度兩個側面去分析其規律性。
3.頻數分佈的型別
頻數分佈有對稱分佈和偏態分佈之分。對稱分佈是指多數頻數集中在中央位置,兩端的頻數分佈大致對稱。偏態分佈是指頻數分佈不對稱,集中位置偏向一側,若集中位置偏向數值小的一側,稱為正偏態分佈;集中位置偏向數值大的一側,稱為負偏態分佈,如冠心病、大多數惡性腫瘤等慢性病患者的年齡分佈為負偏態分佈。臨床上正偏態分佈資料較多見。不同的分佈型別應選用不同的統計分析方法。
4.頻數表的用途
可以揭示資料分佈型別和分佈特徵,以便選取適當的統計方法;便於進一步計算指標和統計處理;便於發現某些特大或特小的可疑值。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15711267/viewspace-1062098/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 詞語詞頻統計
- 詞頻統計
- 詞頻統計mapreduce
- python如何統計詞頻Python
- python實現詞頻統計Python
- PostgreSQL全文檢索-詞頻統計SQL
- 文字挖掘之語料庫、分詞、詞頻統計分詞
- 詞頻統計任務程式設計實踐程式設計
- 數學名詞
- INDEX JAVA 各類名詞理解 & 知識點理解 目錄IndexJava
- Python統計四六級考試的詞頻Python
- Java、Scala、Python ☞ 本地WordCount詞頻統計對比JavaPython
- 計算機視覺專業術語/名詞總結(一)構建知識體系計算機視覺
- Web 前置知識——初次接觸前端,我們要理解哪些名詞?Web前端
- python TK庫 統計word文件單詞詞頻程式 UI選擇文件PythonUI
- C++ 統計單詞數C++
- 物件導向與函數語言程式設計的區別: 動詞-名詞與名詞-動詞的區別 - simblob物件函數程式設計
- 機器學習數學知識積累之數理統計機器學習
- Javafx-【直方圖】文字頻次統計工具 中文/英文單詞統計Java直方圖
- 統計英文名著中單詞出現頻率
- 統計學知識闖關
- python 計算txt文字詞頻率Python
- 第1節:英語中的名詞,冠詞和數詞,代詞
- 【知識分享】 計算機網路>速率、頻寬、吞吐量計算機網路
- 用Python如何統計文字檔案中的詞頻?(Python練習)Python
- 02.統計學基礎知識
- 分清英語名詞的可數和不可數
- 計組常見名詞縮寫
- 遊戲名詞設計的平衡遊戲
- IT知識科普:雲端計算的四大熱門詞彙
- 【知識分享】 計算機網路中速率和頻寬的區別計算機網路
- 【知識分享】計算機網路中速率和頻寬的區別計算機網路
- 軟體設計師:計算機系統知識計算機
- 統計檔案中出現的單詞次數
- GreatSQL統計資訊相關知識點SQL
- 嵌入式系統專業名詞:
- Atitit. . 軟體名稱空間與類名命名單詞的統計程式設計v2程式設計
- 關於diffusion model一些統計和數學的基礎知識
- Java函數語言程式設計知識分享!Java函數程式設計