Chapt 1 學習目標
- 理解多後設資料及多元統計分析與一元統計分析的區別。
- 掌握資料的計量尺度與資料型別。
- 瞭解多元統計分析的應用分類。
1.1 多後設資料認知
1.1.1 多後設資料 的概念
對任何一個現實問題要轉化為一個統計問題,首要的工作是要對其特徵進行刻畫;
- 一般採用隨機變數,多個特徵採用多個隨機變數,如\(large (X_1, X_2,\ \cdots\ , X_p)\) 。
- 隨機變數一般是抽象的
- 當隨機變數描述的是有具體的意義的指標(特徵)時,常用的經濟指標有其概念、單位、核算方法等, 如宏觀經濟指標 GDP、社會商品零售總額、固定資產投資額、消費、個人可支配收入等。此類統計問題:
- 如果僅考慮單一特徵(一個變數),則是一元統計問題,
- 若要同時考慮多個特徵,且要體現多個經濟變數(指標)之間的相關性,
例如,個人消費與其可支配收入正相關等,則不但要分析每一個變數,還要分析它們之間的關聯程度;
這就需要對一元統計分析方法進行擴充,
即同時對諸多變數large (X_1, X_2,\ \cdots\ , X_p)$ 進行分析,這就是多元統計分析分析問題的構思。
- 當隨機變數描述的是有具體的意義的指標(特徵)時,常用的經濟指標有其概念、單位、核算方法等, 如宏觀經濟指標 GDP、社會商品零售總額、固定資產投資額、消費、個人可支配收入等。此類統計問題:
為了對多變數進行統計分析(描述性的或推斷性的),我們需要:
-
透過大量的重複觀察結果(資料)捕捉多變數及其之間的規律。
-
對有 p 個變數的多元統計問題, 可採用矩陣方法對其觀察資料進行表示, 如\(\large 矩陣 X\):
\(\large \begin{array}{rl} \\ \begin{bmatrix} \\ & x_{11} & x_{12} & \cdots & x_{1p} \\ & x_{21} & x_{22} & \cdots & x_{2p} \\ & \vdots & \vdots & & \vdots \\ & x_{n1} & x_{n2} & \cdots & x_{np} \\ \end{bmatrix} \\ \end{array}\)
\(\large \begin{array}{rl} \\ \ \ & where, & \\ & \bm{ x_{ij}}: \bm{Oberservation}\ of\ \bm{i-th\ Individual} \ and\ \bm{j-th\ Variable}\\ & \bm{ n }: \bm{Sample \ Size} \\ & \bm{ p }: \bm{Variable \ Size} \\ \end{array}\) -
分類變數:
如果,.有幾個不同的個體屬於 s 個不同的群體,
則, 設 s 是取值為$1, 2, \cdots, $的分類變數, 以區分這些群體。