多後設資料和多元統計分析
<<實用多元統計分析>> 清華大學出版社,5校 正文1.indd 1 2023/9/12 17:14:25
Chapt 1 學習目標
- 理解多後設資料及多元統計分析與一元統計分析的區別。
- 掌握資料的計量尺度與資料型別。
- 瞭解多元統計分析的應用分類。
1.1 多後設資料認知
1.1.1 多後設資料 的概念
對任何一個現實問題要轉化為一個統計問題,首要的工作是要對其特徵進行刻畫;
- 一般採用隨機變數,多個特徵採用多個隨機變數,如\(large (X_1, X_2,\ \cdots\ , X_p)\) 。
- 隨機變數一般是抽象的
- 當隨機變數描述的是有具體的意義的指標(特徵)時,常用的經濟指標有其概念、單位、核算方法等, 如宏觀經濟指標 GDP、社會商品零售總額、固定資產投資額、消費、個人可支配收入等。此類統計問題:
- 如果僅考慮單一特徵(一個變數),則是一元統計問題,
- 若要同時考慮多個特徵,且要體現多個經濟變數(指標)之間的相關性,
例如,個人消費與其可支配收入正相關等,則不但要分析每一個變數,還要分析它們之間的關聯程度;
這就需要對一元統計分析方法進行擴充,
即同時對諸多變數large (X_1, X_2,\ \cdots\ , X_p)$ 進行分析,這就是多元統計分析分析問題的構思。
- 當隨機變數描述的是有具體的意義的指標(特徵)時,常用的經濟指標有其概念、單位、核算方法等, 如宏觀經濟指標 GDP、社會商品零售總額、固定資產投資額、消費、個人可支配收入等。此類統計問題:
為了對多變數進行統計分析(描述性的或推斷性的),我們需要:
- 透過大量的重複觀察結果(資料)捕捉多變數及其之間的規律。
- 對有 p 個變數的多元統計問題,我們可以採用矩陣方法對其觀察資料進行展示,如矩陣 X 。
xx x11 12 1p xx x21 22 2pX = xx x1 2 n n np
其中, xij 是第 i 個個體的第 j 個變數的觀測值; n 是觀測的次數(或稱為觀測的個體數,樣本容量); p 是變數的個數。如果有幾個不同的個體歸屬於 s 個不同的群體,則可設 s2是取值為 1,2,…的分類變數以區分這些群體。