3.3 資料整理的原則
無論臨床研究,實驗室研究,或者其他各種方式獲得的資料,在匯入統計學軟體之前,都要問一下自己,格式對不對?你的軟體能夠識別嗎?
注:這裡是指統計學軟體,像R之類具有強大指令碼功能的,不能歸到統計學軟體之列,咳咳,他們只是包括統計學軟體罷了~
在最終在資料操作、視覺化、建模之前,都要保證資料格式是規範化的,能夠被相應程式識別的。
達到這一目的,實際上有三條小的規則,說來容易,做來難的規則:
就是要求,每一個資料表都
- 每一個變數構成一列
- 每一個觀測構成一行
- 每一類觀測單元構成一個資料表
這一規則可以保證同一個觀測的不同變數都出現在同一行。
相關定義:
值:資料集的構成單位,或者是數字,或者是字串(eg.姓名)。
值按照兩種方法組織,每個值都要屬於一個變數和一個觀測。
變數:包含相同屬性的測量值。
觀測:包含統一單位的所有屬性值。
上面兩段都有些生硬,可憐現代資料科學的母語不是中文。
通俗來講:就是說,每一個觀察物件(或樣本)構成一行;所有觀察物件同一個屬性,構成一列。
如此,在探索變數間相互關係時,使用同一行的不同變數;在進行組間比較時,使用同一列的變數(當然,要配合分組變數相應列)。
相關文章
- UITableViewCell資料重新整理方法和原則UIView
- 程式設計原則(整理)程式設計
- 資料表的設計原則
- 資料庫建立索引的原則資料庫索引
- 有關資料驗證的原則
- 資料治理的目標和原則
- 資料庫索引的設計原則資料庫索引
- 資料科學家的15項原則資料科學
- 資料治理的十二條技術原則
- 企業主資料治理的“五化”原則
- 對待資料質量的28個原則
- 提升資料安全的五大原則
- 大資料的分散式機器學習的策略與原則大資料分散式機器學習
- 關聯式資料庫分片原則資料庫
- 企業資料庫設計原則資料庫
- mysql資料庫最佳化需要遵守的原則MySql資料庫
- 我設計資料庫常用的幾個原則資料庫
- 設計模式整理--面相對像設計原則設計模式
- 資料領域,甲方和乙方分工的18個原則
- 大型資料庫的設計原則與開發技巧資料庫
- 資料庫入門之RDS選擇原則資料庫
- c語言資料結構補齊原則C語言資料結構
- 【資料操作】SQL語句效能調整原則SQL
- LOCK的整理資料
- 幾條Oracle資料庫開發的原則歸納(上)Oracle資料庫
- 幾條Oracle資料庫開發的原則歸納(下)Oracle資料庫
- c語言中的資料型別的自動轉換原則C語言資料型別
- 【原】移動web資源整理Web
- OCP原則——開閉原則
- 鉛筆的原則
- 資料庫資料整理資料庫
- CDGA認證|資料治理和數字化的12項原則
- css規則整理CSS
- 製作資訊圖時要遵循的10條原則——資料資訊圖
- 資料庫整理資料庫
- 設計原則:開閉原則(OCP)
- 2.2.1.1 共性的原則
- 重構的原則