統計知識:頻數表(百度名詞)
統計描述是用統計指標、統計圖或統計表描述資料的分佈規律及其數量特徵。
頻數表是統計描述中經常使用的基本工具之一。
1.頻數表(frequency table)的編制
在觀察值個數較多時,為了解一組同質觀察值的分佈規律和便於指標的計算,可編制頻數分佈表,簡稱頻數表。
(1)求全距(range):找出觀察值中的最大值與最小值,其差值即為全距(或極差),用R表示。
(2)確定組段和組距:根據樣本含量的大小確定“組段”數,一般設8-15個組段,觀察單位較少時組段數可相對少些,觀察單位較多時組段數可相對多些,常用全距的1/10取整做組距,以便於彙總和計算。第一組段應包括全部觀察值中的最小值,最末組段應包括全部觀察值中的最大值,並且同時寫出其下限與上限。各組段的起點和終點分別稱為下限和上限,某組段包含下限,但不包含上限,其組中值為該組段的(下限+上限)/2。相鄰兩組段的下限之差稱為組距。
(3)列表劃記:確定組段界限,列成表2.1的形式,採用計算機或用劃記法將原始資料彙總,得出各組段的觀察例數,即頻數,表中的第(1)、(3)欄即所需的頻數表。
頻數表 頻數表
2.頻數分佈的特徵
由頻數表可看出頻數分佈的兩個重要特徵:集中趨勢(central tendency)和離散程度(dispersion)。身高有高有矮,但多數人身高集中在中間部分組段,以中等身高居多,此為集中趨勢;由中等身高到較矮或較高的頻數分佈逐漸減少,反映了離散程度。對於數值變數資料,可從集中趨勢和離散程度兩個側面去分析其規律性。
3.頻數分佈的型別
頻數分佈有對稱分佈和偏態分佈之分。對稱分佈是指多數頻數集中在中央位置,兩端的頻數分佈大致對稱。偏態分佈是指頻數分佈不對稱,集中位置偏向一側,若集中位置偏向數值小的一側,稱為正偏態分佈;集中位置偏向數值大的一側,稱為負偏態分佈,如冠心病、大多數惡性腫瘤等慢性病患者的年齡分佈為負偏態分佈。臨床上正偏態分佈資料較多見。不同的分佈型別應選用不同的統計分析方法。
4.頻數表的用途
可以揭示資料分佈型別和分佈特徵,以便選取適當的統計方法;便於進一步計算指標和統計處理;便於發現某些特大或特小的可疑值。
頻數表是統計描述中經常使用的基本工具之一。
1.頻數表(frequency table)的編制
在觀察值個數較多時,為了解一組同質觀察值的分佈規律和便於指標的計算,可編制頻數分佈表,簡稱頻數表。
(1)求全距(range):找出觀察值中的最大值與最小值,其差值即為全距(或極差),用R表示。
(2)確定組段和組距:根據樣本含量的大小確定“組段”數,一般設8-15個組段,觀察單位較少時組段數可相對少些,觀察單位較多時組段數可相對多些,常用全距的1/10取整做組距,以便於彙總和計算。第一組段應包括全部觀察值中的最小值,最末組段應包括全部觀察值中的最大值,並且同時寫出其下限與上限。各組段的起點和終點分別稱為下限和上限,某組段包含下限,但不包含上限,其組中值為該組段的(下限+上限)/2。相鄰兩組段的下限之差稱為組距。
(3)列表劃記:確定組段界限,列成表2.1的形式,採用計算機或用劃記法將原始資料彙總,得出各組段的觀察例數,即頻數,表中的第(1)、(3)欄即所需的頻數表。
頻數表 頻數表
2.頻數分佈的特徵
由頻數表可看出頻數分佈的兩個重要特徵:集中趨勢(central tendency)和離散程度(dispersion)。身高有高有矮,但多數人身高集中在中間部分組段,以中等身高居多,此為集中趨勢;由中等身高到較矮或較高的頻數分佈逐漸減少,反映了離散程度。對於數值變數資料,可從集中趨勢和離散程度兩個側面去分析其規律性。
3.頻數分佈的型別
頻數分佈有對稱分佈和偏態分佈之分。對稱分佈是指多數頻數集中在中央位置,兩端的頻數分佈大致對稱。偏態分佈是指頻數分佈不對稱,集中位置偏向一側,若集中位置偏向數值小的一側,稱為正偏態分佈;集中位置偏向數值大的一側,稱為負偏態分佈,如冠心病、大多數惡性腫瘤等慢性病患者的年齡分佈為負偏態分佈。臨床上正偏態分佈資料較多見。不同的分佈型別應選用不同的統計分析方法。
4.頻數表的用途
可以揭示資料分佈型別和分佈特徵,以便選取適當的統計方法;便於進一步計算指標和統計處理;便於發現某些特大或特小的可疑值。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15711267/viewspace-1062098/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 詞頻統計-------------web版本Web
- python如何統計詞頻Python
- 【python技能】詞頻統計Python
- python實現詞頻統計Python
- 分析“詞頻統計“專案程式
- PostgreSQL全文檢索-詞頻統計SQL
- spark下統計單詞頻次Spark
- 【week2】 詞頻統計效能分析
- Hadoop MapReduce之wordcount(詞頻統計)Hadoop
- 對文字檔案中的單詞統計出現的次數(即詞頻)並按詞頻的從高到低排序排序
- INDEX JAVA 各類名詞理解 & 知識點理解 目錄IndexJava
- 個人專案----詞頻統計WEB(部分功能)Web
- 個人專案----詞頻統計(補全功能)
- Ospaf專案-commits詞頻統計模組MIT
- 機器學習數學知識積累之數理統計機器學習
- Python統計四六級考試的詞頻Python
- 個人專案----詞頻統計----單元測試
- 在Java中使用Lambda表示式統計詞頻Java
- Java簡單實現漢語詞頻統計Java
- matlab統計 頻數、頻率和累積頻率Matlab
- Web 前置知識——初次接觸前端,我們要理解哪些名詞?Web前端
- 計算機視覺專業術語/名詞總結(一)構建知識體系計算機視覺
- Oracle 名詞術語 派生表Oracle
- Java、Scala、Python ☞ 本地WordCount詞頻統計對比JavaPython
- 雜項知識統計
- python TK庫 統計word文件單詞詞頻程式 UI選擇文件PythonUI
- 物件導向與函數語言程式設計的區別: 動詞-名詞與名詞-動詞的區別 - simblob物件函數程式設計
- Javafx-【直方圖】文字頻次統計工具 中文/英文單詞統計Java直方圖
- 統計學知識闖關
- 《Cracking the Coding Interview程式設計師面試金典》----詞頻統計View程式設計師面試
- python 統計文章單詞個數Python
- 統計檔案中單詞個數
- 遊戲名詞設計的平衡遊戲
- 【知識分享】 計算機網路>速率、頻寬、吞吐量計算機網路
- python 計算txt文字詞頻率Python
- python 統計文章單詞個數-1Python
- python 統計文章單詞個數 -2Python
- 02.統計學基礎知識