Spss 學習筆記(二)

orchidllh發表於2004-12-13

spss中,資料檔案的管理功能基本上都集中在datatransform選單上,其中transform主要實現變數級別的資料管理,如計算新變數、變數取值重新編碼等,data的功能主要是實現檔案級別的資料管理,如變數排序,檔案合併、拆分等。


Transform選單說明:

計算新變數:compute

變數轉換:recode,visual bander,count,rank cases,automatic recode五個過程,可以看成是compute再某一方面的強化和打包。

專用過程:建立時間序列、缺失值代替和設定隨機種子三個過程,前兩個專用於時間序列模型。設定隨機種子的功能主要影響偽隨機函式的使用。

資料分析中,將連續變數轉換為等級變數,或將分類變數不同的變數等級進行合併是常見的工作。而recode可以很好的完成這個任務。

Recode提供了精確的分組功能,但是如果希望進行的分組是有規律的,比如等距分組或者等樣本量分組,使用recode過程進行操作就顯得非常麻煩,而且視覺化程度不高,可以使用visual bander過程進行視覺化分段。

在資料分析中,將字元變數轉換為數值變數是非常實用的一個功能,除了使用recode過程手工設定轉換規則外,還可以使用automatic recode過程自動按照原變數的大小或者字母排序生成新變數,而變數值就是原值的大小次序。

Automatic recode的排序功能和rank cases類似,不同在於,automatic recode可以用於字元型變數。

所謂變數的秩序,就是對記錄按照某個變數值得大小來排序。Rank cases就是用來排序的專用過程。

Count:該過程用來表示某個變數的取值中是否出現某個值,可以使單個數值,也可以指定區間,並且可以僅給出條件,而不必對整個資料集進行操作。該過程可以直接使用recode過程來實現。

Random number seed:預設情況下,隨機種子隨時間不停改變,這樣計算出的隨機數值無法重複,可以用該過程人為指定一個種子,以後所有的偽隨機函式在計算時都會以該種子開始計算,即結果可以重現。

Data選單說明:

簡單命令:包括插入變數、插入記錄和到達某條記錄,這些功能都可以用滑鼠在資料介面上直接完成,很少會使用選單呼叫。

常用的簡單過程:包括排序、拆分檔案、選擇記錄和加權記錄。

變數與資料檔案屬性向導:用於定義資料字典,或者將預定義的資料字典直接引入當前資料檔案,對於大型或者連續性的資料分析專案而言,這是一個非常有用的功能。

資料重構嚮導:用於進行資料轉制,或者對重複測量資料進行長型、寬型記錄格式間的轉換。

檔案合併過程:用於生成實施聯合分析所需的設計。

其他過程:包括定義日期變數過程、資料彙總過程和查詢重複記錄嚮導。

Sort cases:記錄排序。

Split file:記錄拆分。

Select cases:不需要分析全部的資料,而是按照要求分析其中的一部分。

Weight cases:記錄加權。預設情況下,每行就是一條記錄,但是有時非常麻煩。這時候可以使用頻數格式錄入資料,即相同取值的觀測只錄入一次,另加一個頻數變數用於記錄該資料出現了多少次。

Aggregate資料彙總:分類彙總就是按照指定的分類變數對觀測值進行分組。分類彙總的分類變數可以指定多個,稱為多重分類彙總。

Define variable properties:變數屬性定義嚮導,用於對資料集中已存在的變數進一步定義其屬性。

Copy Data Properties:用於將定義好的資料字典直接應用到當前檔案中。

Identifying Duplicate cases:查詢個別變數值重複,或者所有數值完全重複的記錄。

Restructure:根據使用者的要求改變資料的排列格式。

Transpose:用於對資料進行行列轉置。主要用於編成,進行矩陣運算時的矩陣轉置操作。

資料檔案的合併有兩種:縱向連線和橫向合併。縱向連線是幾個資料集中的資料縱向相加,組成一個新的資料集,新資料集中的記錄是原來幾個資料集中記錄數的總和。橫向合併是按照記錄的次序,或者某個關鍵變數的數值,將不同資料集中的不同變數合併為一個資料集,新資料集中的變數數十所有原資料集中不重名變數的總和。

 

 

 

 

 

 

 

 

 

 

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/51862/viewspace-180556/,如需轉載,請註明出處,否則將追究法律責任。

相關文章