統計學三大相關係數之Pearson相關係數、Spearman相關係數

爬蟲爬呀爬發表於2019-05-11

一、相關係數:

  • 相關係數:考察兩個變數之間的相關程度。相關係數的取值範圍是-1到1,絕對值越接近1,則說明兩個變數之間的相關程度越大;絕對值越接近0,則說明兩個變數之間的相關程度越小,具體見下圖:
    統計學三大相關係數之Pearson相關係數、Spearman相關係數

二、Pearson相關係數:

  • 1. 先給出公式推導:

    • ①首先由Pearson相關係數的定義可知,

      統計學三大相關係數之Pearson相關係數、Spearman相關係數

    • ②這裡,分子cov表示協方差,分母表示標準差(以兩個變數為例):

    統計學三大相關係數之Pearson相關係數、Spearman相關係數
    統計學三大相關係數之Pearson相關係數、Spearman相關係數
    這裡分母位置為什麼是n-1而不是n呢?是為了使我們得以用更小的樣本更好的逼近總體,即達到“無偏估計”的效果,詳見:blog.csdn.net/hearthougan…

    • ③代入即可消得Pearson相關係數計算公式為:
      統計學三大相關係數之Pearson相關係數、Spearman相關係數
  • 2. Pearson相關係數可用於衡量變數之間的線性相關程度,但有一定的使用條件:

    統計學三大相關係數之Pearson相關係數、Spearman相關係數

三、Spearman相關係數

  • 1. 總的來說,Spearman相關係數的計算方法和Pearson相關係數是一樣的,只是計算用特徵的等級取代特徵的真實值。例如,給定三個值:30,50,10,它們的等級就分別是2,3,1,則計算時用2,3,1這幾個等級代替30,50,10這些本身的值

  • 2. 照例,先給出公式(兩種):

    • 公式一:

      統計學三大相關係數之Pearson相關係數、Spearman相關係數

    • 公式二:

      統計學三大相關係數之Pearson相關係數、Spearman相關係數

  • 3. 適用範圍:

    • ①相對於皮爾森相關係數,斯皮爾曼相關係數對於資料錯誤和極端值的反應不敏感
    • ②斯皮爾曼等級相關係數對資料條件的要求沒有皮爾遜相關係數嚴格,只要兩個變數的觀測值是成對的等級評定資料,或者是由連續變數觀測資料轉化得到的等級資料,不論兩個變數的總體分佈形態、樣本容量的大小如何,都可以用斯皮爾曼等級相關係數來進行研究。

相關文章