徹底理解樣本方差為何除以n-1
設樣本均值為,樣本方差為,總體均值為,總體方差為,那麼樣本方差有如下公式:
很多人可能都會有疑問,為什麼要除以n-1,而不是n,但是翻閱資料,發現很多都是交代到,如果除以n,對樣本方差的估計不是無偏估計,比總體方差要小,要想是無偏估計就要調小分母,所以除以n-1,那麼問題來了,為什麼不是除以n-2、n-3等等。所以在這裡徹底總結一下,首先交代一下無偏估計。
無偏估計
以例子來說明,假如你想知道一所大學裡學生的平均身高是多少,一個大學好幾萬人,全部統計有點不現實,但是你可以先隨機挑選100個人,統計他們的身高,然後計算出他們的平均值,記為。如果你只是把作為整體的身高平均值,誤差肯定很大,因為你再隨機挑選出100個人,身高平均值很可能就跟剛才計算的不同,為了使得統計結果更加精確,你需要多抽取幾次,然後分別計算出他們的平均值,分別記為:然後在把這些平均值,再做平均,記為:,這樣的結果肯定比只計算一次更加精確,隨著重複抽取的次數增多,這個期望值會越來越接近總體均值,如果滿足,這就是一個無偏估計,其中統計的樣本均值也是一個隨機變數,就是的一個取值。無偏估計的意義是:在多次重複下,它們的平均數接近所估計的引數真值。
介紹無偏估計的意義就是,我們計算的樣本方差,希望它是總體方差的一個無偏估計,那麼假如我們的樣本方差是如下形式:
那麼,我們根據無偏估計的定義可得:
由上式可以看出如果除以n,那麼樣本方差比總體方差的值偏小,那麼該怎麼修正,使得樣本方差式總體方差的無偏估計呢?我們接著上式繼續化簡:
到這裡得到如下式子,看到了什麼?該怎修正似乎有點眉目。
如果讓我們假設的樣本方差乘以,即修正成如下形式,是不是可以得到樣本方差是總體方差的無偏估計呢?
則:
因此修正之後的樣本方差的期望是總體方差的一個無偏估計,這就是為什麼分母為何要除以n-1。
相關文章
- 徹底理解synchronizedsynchronized
- 徹底理解Golang MapGolang
- 徹底理解正則
- 徹底理解ReentrantLockReentrantLock
- 徹底理解volatile
- 徹底理解遞迴,從遞迴的本質說起!遞迴
- 徹底理解cookie,session,tokenCookieSession
- 徹底理解JavaScript中的thisJavaScript
- 從紅黑樹的本質出發,徹底理解紅黑樹!
- 徹底理解 Dart mixin 機制Dart
- 徹底理解kubernetes CNI
- 徹底理解連結器:四
- 徹底理解Hive中的鎖Hive
- 小白(新手)如何徹底理解索引?索引
- 徹底理解 JS 中 this 的指向JS
- (文摘)徹底理解webservice SOAP WSDLWeb
- 讓你徹底理解 “==”與 Equals
- 徹底理解js中this的指向JS
- JavaScript之例題中徹底理解thisJavaScript
- 徹底理解閉包實現原理
- 一張圖徹底理解Javascript原型鏈JavaScript原型
- js 徹底理解回撥函式JS函式
- 徹底理解js中的閉包JS
- 徹徹底底教會你使用Redux-saga(包含樣例程式碼)Redux
- 樣本協方差矩陣的定義與計算矩陣
- 【面試】徹底理解 TCP 及面試常問面試TCP
- 徹底理解Node.js中的BufferNode.js
- 徹底理解瀏覽器的跨域瀏覽器跨域
- 徹底理解原碼、補碼、反碼
- 徹底理解 thunk 函式與 co 框架函式框架
- JavaScript中this指標指向的徹底理解JavaScript指標
- 5分鐘徹底理解Object.keysObject
- 一文徹底理解微服務架構微服務架構
- 圖解|這次,徹底理解MySQL的索引圖解MySql索引
- 【譯】徹底理解 Android 中的陰影Android
- 徹底理解 Android Binder 通訊架構Android架構
- 一個故事讓你徹底理解 HttpsHTTP
- SVG座標系統和transformation徹底理解SVGORM