協方差矩陣概念及計算

鴨脖發表於2016-07-31

理解協方差矩陣的關鍵就在於牢記它計算的是不同維度之間的協方差，而不是不同樣本之間，拿到一個樣本矩陣，我們最先要明確的就是一行是一個樣本還是一個維度，心中明確這個整個計算過程就會順流而下，這麼一來就不會迷茫了

淺談協方差矩陣

今天看論文的時候又看到了協方差矩陣這個破東西，以前看模式分類的時候就特困擾，沒想到現在還是搞不清楚，索性開始查協方差矩陣的資料，惡補之後決定馬上記錄下來，嘿嘿~本文我將用自認為循序漸進的方式談談協方差矩陣。

統計學的基本概念

學過概率統計的孩子都知道，統計裡最基本的概念就是樣本的均值，方差，或者再加個標準差。首先我們給你一個含有n個樣本的集合【轉】協方差矩陣概念及計算 - baolong_zhu - baolong_zhu的部落格，依次給出這些概念的公式描述，這些高中學過數學的孩子都應該知道吧，一帶而過。

均值： 【轉】協方差矩陣概念及計算 - baolong_zhu - baolong_zhu的部落格
標準差：
方差：

很顯然，均值描述的是樣本集合的中間點，它告訴我們的資訊是很有限的，而標準差給我們描述的則是樣本集合的各個樣本點到均值的距離之平均。以這兩個集合為例，[0，8，12，20]和[8，9，11，12]，兩個集合的均值都是10，但顯然兩個集合差別是很大的，計算兩者的標準差，前者是8.3，後者是 1.8，顯然後者較為集中，故其標準差小一些，標準差描述的就是這種“散佈度”。之所以除以n-1而不是除以n，是因為這樣能使我們以較小的樣本集更好的逼近總體的標準差，即統計上所謂的“無偏估計”。而方差則僅僅是標準差的平方。

為什麼需要協方差？

上面幾個統計量看似已經描述的差不多了，但我們應該注意到，標準差和方差一般是用來描述一維資料的，但現實生活我們常常遇到含有多維資料的資料集，最簡單的大家上學時免不了要統計多個學科的考試成績。面對這樣的資料集，我們當然可以按照每一維獨立的計算其方差，但是通常我們還想了解更多，比如，一個男孩子的猥瑣程度跟他受女孩子歡迎程度是否存在一些聯絡啊，嘿嘿~協方差就是這樣一種用來度量兩個隨機變數關係的統計量，我們可以仿照方差的定義：

【轉】協方差矩陣概念及計算 - baolong_zhu - baolong_zhu的部落格

來度量各個維度偏離其均值的程度，標準差可以這麼來定義：

【轉】協方差矩陣概念及計算 - baolong_zhu - baolong_zhu的部落格

協方差的結果有什麼意義呢？如果結果為正值，則說明兩者是正相關的(從協方差可以引出“相關係數”的定義)，也就是說一個人越猥瑣就越受女孩子歡迎，嘿嘿，那必須的~結果為負值就說明負相關的，越猥瑣女孩子越討厭，可能嗎？如果為0，也是就是統計上說的“相互獨立”。

從協方差的定義上我們也可以看出一些顯而易見的性質，如：

【轉】協方差矩陣概念及計算 - baolong_zhu - baolong_zhu的部落格

協方差多了就是協方差矩陣

上一節提到的猥瑣和受歡迎的問題是典型二維問題，而協方差也只能處理二維問題，那維數多了自然就需要計算多個協方差，比如n維的資料集就需要計算【轉】協方差矩陣概念及計算 - baolong_zhu - baolong_zhu的部落格個協方差，那自然而然的我們會想到使用矩陣來組織這些資料。給出協方差矩陣的定義：

【轉】協方差矩陣概念及計算 - baolong_zhu - baolong_zhu的部落格

這個定義還是很容易理解的，我們可以舉一個簡單的三維的例子，假設資料集有【轉】協方差矩陣概念及計算 - baolong_zhu - baolong_zhu的部落格三個維度，則協方差矩陣為

可見，協方差矩陣是一個對稱的矩陣，而且對角線是各個維度上的方差。

Matlab協方差實戰

上面涉及的內容都比較容易，協方差矩陣似乎也很簡單，但實戰起來就很容易讓人迷茫了。必須要明確一點，協方差矩陣計算的是不同維度之間的協方差，而不是不同樣本之間的。這個我將結合下面的例子說明，以下的演示將使用Matlab，為了說明計算原理，不直接呼叫Matlab的cov函式(藍色部分為Matlab程式碼)。

首先，隨機產生一個10*3維的整數矩陣作為樣本集，10為樣本的個數，3為樣本的維數。

1MySample = fix(rand(10,3)*50)

根據公式，計算協方差需要計算均值，那是按行計算均值還是按列呢，我一開始就老是困擾這個問題。前面我們也特別強調了，協方差矩陣是計算不同維度間的協方差，要時刻牢記這一點。樣本矩陣的每行是一個樣本，每列為一個維度，所以我們要按列計算均值。為了描述方便，我們先將三個維度的資料分別賦值：

1dim1 = MySample(:,1);2dim2 = MySample(:,2);3dim3 = MySample(:,3);

計算dim1與dim2，dim1與dim3，dim2與dim3的協方差：

1sum( (dim1-mean(dim1)) .* (dim2-mean(dim2)) ) / ( size(MySample,1)-1 ) % 得到 74.53332sum( (dim1-mean(dim1)) .* (dim3-mean(dim3)) ) / ( size(MySample,1)-1 ) % 得到 -10.08893sum( (dim2-mean(dim2)) .* (dim3-mean(dim3)) ) / ( size(MySample,1)-1 ) % 得到 -106.4000

搞清楚了這個後面就容易多了，協方差矩陣的對角線就是各個維度上的方差，下面我們依次計算：

1std(dim1)^2 % 得到 108.32222std(dim2)^2 % 得到 260.62223std(dim3)^2 % 得到 94.1778

這樣，我們就得到了計算協方差矩陣所需要的所有資料，呼叫Matlab自帶的cov函式進行驗證：

1cov(MySample)

把我們計算的資料對號入座，是不是一摸一樣？

Update：今天突然發現，原來協方差矩陣還可以這樣計算，先讓樣本矩陣中心化，即每一維度減去該維度的均值，使每一維度上的均值為0，然後直接用新的到的樣本矩陣乘上它的轉置，然後除以(N-1)即可。其實這種方法也是由前面的公式通道而來，只不過理解起來不是很直觀，但在抽象的公式推導時還是很常用的！同樣給出 Matlab程式碼實現：

1X = MySample - repmat(mean(MySample),10,1); % 中心化樣本矩陣，使各維度均值為02C = (X'*X)./(size(X,1)-1);

樣本協方差矩陣的定義與計算
2020-08-13
矩陣
演算法金 | 協方差、方差、標準差、協方差矩陣
2024-06-29
演算法矩陣
協方差矩陣推導1
2024-10-19
矩陣
矩陣計算
2024-06-15
矩陣
計算矩陣的秩
2024-10-16
矩陣
股票收益率的協方差矩陣算出來有什麼用
2024-10-12
矩陣
矩陣：如何使用矩陣操作進行 PageRank 計算？
2019-03-21
矩陣
基本概念(二）：方差、協方差、相關係數原點矩和中心矩
2024-04-13
CUDA與架構矩陣概覽
2024-06-06
架構矩陣
特徵向量/特徵值/協方差矩陣/相關/正交/獨立/主成分分析/PCA/
2018-08-14
特徵矩陣PCA
NYOJ 1409 快速計算【矩陣連乘】
2018-09-19
矩陣
matlab計算含有未知數的矩陣
2020-11-17
Matlab矩陣
怎樣用python計算矩陣乘法？
2021-09-11
Python矩陣
深度學習中需要的矩陣計算
2020-10-01
深度學習矩陣
python 計算list的方差
2024-08-21
Python
計算機圖形學之矩陣變換
2019-03-21
計算機矩陣
python 計算矩陣的相關演算法
2020-09-26
Python矩陣演算法
計算資料集均值方差
2020-12-08
Numpy中的矩陣運算
2019-02-16
矩陣
pytorch基礎七（矩陣運算）
2018-12-08
PyTorch矩陣
OpenGL光照計算中法線矩陣原理及推到過程
2021-03-17
矩陣
TiFlash 計算層概覽
2022-08-03
轉矩的計算?
2018-06-12
單像空間後方交會計算旋轉矩陣
2020-11-18
矩陣
巨大的矩陣（矩陣加速）
2024-08-16
矩陣
鄰接矩陣、度矩陣
2021-12-07
矩陣
VIVADO vhdl verilog 實現矩陣運算
2020-05-05
矩陣
verilog實現矩陣卷積運算
2019-05-24
矩陣卷積
矩陣運算與相抵標準型
2024-06-15
矩陣
互資訊-協方差
2024-10-11
奇異矩陣，非奇異矩陣，偽逆矩陣
2020-09-29
矩陣
【測繪程式設計試題集】試題02 矩陣卷積計算
2018-10-18
程式設計矩陣卷積
計算機網路概論
2019-05-08
計算機網路
資料結構：陣列，稀疏矩陣，矩陣的壓縮。應用：矩陣的轉置，矩陣相乘
2020-10-28
資料結構陣列矩陣
矩陣
2024-04-28
矩陣
求任意矩陣的伴隨矩陣
2024-06-18
矩陣
科學計算與Matlab筆記：第2章：Matlab矩陣處理
2018-05-08
Matlab筆記矩陣
騰訊雲首次公開計算力產品矩陣，加速自研戰略推動軟硬體協同
2020-09-11
矩陣
c語言中實現4行3列矩陣和3行4列矩陣的運算
2024-10-28
C語言矩陣

協方差矩陣概念及計算

淺談協方差矩陣

相關文章