SciTech-Mathmatics-Probability+Statistics:Quantifing Uncertainty_統計資料分析: 多後設資料 + 多元統計分析

abaelhe發表於2024-10-06

多後設資料和多元統計分析

<<實用多元統計分析>> 清華大學出版社,5校 正文1.indd 1 2023/9/12 17:14:25

Chapt 1 學習目標

  1. 理解多後設資料及多元統計分析與一元統計分析的區別。
  2. 掌握資料的計量尺度與資料型別。
  3. 瞭解多元統計分析的應用分類。

1.1  多後設資料認知
1.1.1 多後設資料 的概念
對任何一個現實問題要轉化為一個統計問題,首要的工作是要對其特徵進行刻畫;

  • 一般採用隨機變數多個特徵採用多個隨機變數,如\(large (X_1, X_2,\ \cdots\ , X_p)\)
  • 隨機變數一般是抽象的
    • 當隨機變數描述的是有具體的意義的指標(特徵)時,常用的經濟指標有其概念單位核算方法等, 如宏觀經濟指標 GDP、社會商品零售總額、固定資產投資額、消費、個人可支配收入等。此類統計問題:
      • 如果僅考慮單一特徵(一個變數),則是一元統計問題,
      • 若要同時考慮多個特徵,且要體現多個經濟變數(指標)之間的相關性,
        例如,個人消費與其可支配收入正相關等,則不但要分析每一個變數,還要分析它們之間的關聯程度
        這就需要對一元統計分析方法進行擴充,
        同時對諸多變數large (X_1, X_2,\ \cdots\ , X_p)$ 進行分析,這就是多元統計分析分析問題的構思

為了對多變數進行統計分析(描述性的或推斷性的),我們需要:

  1. 透過大量的重複觀察結果(資料)捕捉多變數及其之間的規律
  2. 對有 p 個變數的多元統計問題,我們可以採用矩陣方法對其觀察資料進行展示,如矩陣 X 。
    xx x11 12 1p xx x21 22 2pX =  xx x1 2 n n np
    其中, xij 是第 i 個個體的第 j 個變數的觀測值; n 是觀測的次數(或稱為觀測的個體數,樣本容量); p 是變數的個數。如果有幾個不同的個體歸屬於 s 個不同的群體,則可設 s2是取值為 1,2,…的分類變數以區分這些群體。

相關文章