統計建模基礎

xunnan發表於2024-07-02

原文網址 : https://www.cnblogs.com/stayme/p/18279302

什麼是建模？

問題——>資料——>模型——>結論

統計建模的本質

收集、分析、展示、解釋資料

統計問題

迴歸：
橫截面資料、縱向資料
分類：
橫截面資料、分類資料
我們觀測不到真值，觀測到的資料一定有誤差。

如何確定模型？

1.根據探索性資料分析主觀確定一個引數模型或者一個演算法。
2.根據已知資料訓練/學習出引數或者演算法模型的程式。
模型是被訓練出來的

注意：

1.統計方法不能單獨使用，必須有問題的背景在
2.統計指標如果顯著，不能證明模型正確，但統計指標不顯著，則能證明模型錯誤。例如：某海灘上溺水死亡的人與冰淇淋的銷量正相關，但他們之間不能簡單的劃等號。必須有背景在。
在例如：公雞打鳴太陽上升，注意因果關係與相關關係。建模時不能再沒有任何理論依據，背景等的情況下設定假設變數。要根據文獻，尊重事件的本質規律。

縱向資料

在計量經濟學中普遍存在。空間溢位效應，經濟發展的空間溢位效應是指由具有時間和空間特徵的區域間要素流動及其衍生的文化擴散及制度環境演化導致的地區經濟活動狀態和效率發生變化的現象,當一個地區經濟發展對另一地區有利時稱為正的溢位效應,反之則是負向溢位。

分類問題

去醫院看病就是一個分類問題，就是醫生在對我們的病進行歸類。
獎學金評定也是分類問題。
考古學也是分類問題。

引數模型

所有模型都是錯的，但是有一些模型是有用的。

演算法模型

一定能算。
沒有任何模型假設，也就沒有模型假設的錯誤。好算，快。
與統計模型相比，黑匣子問題。

可以兩者結合使用，相互驗證。

R軟體英文參考資料

1.Vincent Zoonekynd編寫的Statistics with R
2.Modern Applied Statistics with S

國內統計教學課本的若干誤區

假設檢驗的錯誤：不能拒絕就接受

當P值被認為不夠小而不能拒絕原假設時，只能說“目前沒有足夠證據拒絕原假設”，而不能說是“接受原假設”

P值小於0.05即顯著

p值是由一個樣本算出來的，不能對其含義誇大或過分理解

置信區間問題

如果根據公式

\[\bar{x}\pm t_{\alpha/2}*\frac{s}{\sqrt{n}} \]

算出來$\mu$的置信區間是$[a,b]$,也不能說區間[a,b]以機率 $1 -\alpha覆蓋\mu $
只能說對於無窮多個不同樣本，根據公式算出來無窮多個區間中大概有$1-\alpha$比例的置信區間覆蓋$\mu$.
置信區間的前提是樣本服從獨立正態同分布的。

大樣本，小樣本

n>30即為大樣本的定義是荒唐的，該界限不好確定。

彙總資料與原始資料

能用原始觀測資料就不要用匯總資料了，彙總資料會丟失一些東西。

前端建模基礎
2022-04-11
前端
威脅建模基礎
2020-08-30
《JAVA併發程式設計實戰》基礎構建模組
2018-10-24
Java程式設計
數理統計基礎統計量
2020-11-01
統計學基礎(一）
2018-10-22
零基礎或者有點基礎該如何學好建模？
2018-07-25
【scipy 基礎】--統計分佈
2023-11-28
多元統計分析01：多元統計分析基礎
2021-10-19
Java併發程式設計實戰筆記3：基礎構建模組
2018-12-19
Java程式設計筆記
Linux基礎命令---文字統計paste
2019-01-12
LinuxAST
Linux基礎命令---wc文字統計
2019-01-13
Linux
Linux基礎命令—文字統計wc
2019-01-13
Linux
Linux系統程式設計基礎
2024-10-30
Linux程式設計
基於SysML和EA進行系統設計與建模培訓
2020-04-10
02.統計學基礎知識
2021-04-01
0基礎學習建模，3D次世代MAYA遊戲角色建模的方法
2020-10-10
3D遊戲
嵌入式系統程式設計基礎
2020-09-24
程式設計
R語言進行基礎統計分析（一）
2020-09-25
R語言
Flink 熱詞統計(1): 基礎功能實現
2019-05-01
圖解AI數學基礎 | 概率與統計
2022-02-24
圖解AI
資料統計分析的 16 個基礎概念
2022-09-14
零基礎學習遊戲建模的15大常識
2020-11-03
遊戲
linux系統基礎
2024-09-07
Linux
Java 基礎02Java程式設計基礎
2019-03-03
Java程式設計
計算機系統結構的基礎知識
2018-09-29
計算機
Linux基礎學習-crond系統計劃任務
2018-08-17
Linux
Python文字統計與分析從基礎到進階
2024-05-06
Python
計算機基礎
2024-06-13
計算機
計算機基礎-網路基礎
2021-07-26
計算機
0基礎入門金融風控的 Task4 建模調參
2020-09-24
程式設計必備基礎計算機組成原理+作業系統+計算機網路,計算機基礎——更適合程式設計師的程式設計必備基礎知識
2020-12-29
作業系統計算機網路程式設計師
分散式系統基礎
2018-09-04
分散式
檔案系統基礎
2024-10-19
Socket程式設計基礎
2018-10-25
程式設計
Go程式設計基礎
2018-11-05
Go程式設計
Shell程式設計-基礎
2018-05-11
程式設計
java 設計模式基礎
2019-08-30
Java設計模式
雲端計算基礎
2024-11-25