聚類分析軟體操作流程

gaorongchao1990626發表於2013-06-07


                                       

 2011/2/24

背景簡介:

在晶片資料聚類分析中,可用的軟體有很多,其中最重要的軟體就是Cluster和它的相關樹視覺化軟體TreeView。

 

軟體下載:

那如何獲取這兩款軟體呢?以下為兩款軟體的獲取地址:

http://bonsai.hgc.jp/~mdehoon/software/cluster/

選擇Cluster 3.0 for windows JavaTreeView 下載。

 

軟體安裝:

1.Cluster 3.0的安裝:

Cluster 3.0 for windows 的執行環境為windows系統,所以直接點選clustersetup.exe即安裝成功。

 

2.Java TreeView的安裝:

Java TreeView下載完成後,檔案解壓後如下圖(圖-1)所示,此時Treeview.jar此時預設的是壓縮檔案,千萬不要解壓TreeView.jar檔案包。在windows系統中,按理說雙擊 setup.exe 檔案能完成安裝,但出於某些原因,有的電腦可能執行不了,那是因為缺少了一個Java的執行環境,因此我們需要下載 JRE(Java Runtime Environment,Java執行環境)。

JRE軟體官方下載地址為http://www.java.com/it/download/manual.jsp(For Windows版本)。

安裝完JRE軟體後,Treeview.jar檔案會自動預設JRE開啟,如下圖(圖-2)所示,若沒有自動預設,可右擊選擇預設開啟程式選擇JAVA(TM)Platform開啟。

 

 

 

 

 

 

 

 

 

 

 

 圖-1                                       圖-2

 

 

軟體使用:

簡單地說:

1、Cluster的作用是應用一定的公式對一定格式的資料進行

過濾(Filter Data)、

校準(Adjust Data)、

分層聚類(hierarchical clustering)、

K-均值聚類(K-meansclustering)、

自組織圖譜SOM(self organizing map)、

PCA(principle-componetanalysis)。

最後輸出CDT和GTR格式檔案 ( CDT格式為TreeView的預設開啟檔案格式 ) 。

    

 2、TreeView的作用是對Cluster輸出的資料進行視覺化顯示。

 

1.Cluster 3.0的使用:

(1)資料的載入:Cluster所識別的檔案格式為TXT文字檔案,檔案格式如下圖(圖-3)所示,資料可由Excel表格直接複製貼上入文字檔案。

點選選單欄File / Opendata file 選擇相應檔案即可。

圖-3

 

 

 

(2)資料的過濾:Cluster的主介面如下圖(圖-4)所示,點選Filter Data標籤,點選所有核取方塊,資料值預設,最後點選ApplyFilter按鈕及AcceptFilter按鈕。此時資料過濾完成。

圖-4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3)資料的校準:點選主介面的AdjustData標籤如下圖(圖-5),選擇對數轉換資料(Log transform data)、聚類基因(Center genes)以及聚類列(Centerarrays)前的核取方塊,資料預設,點選Apply按鈕。

圖-5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 (4)資料的分層聚類:點選主介面的Hierarchical 標籤如下圖(圖-6),需要解釋的是Genes區域是設定資料每一行即是否對各個基因進行聚類,Arrays區域是設定資料每一列即是否對幾個時期進行聚類。

圖-6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   此處我們只對每行即各個基因進行聚類,所以將Genes區域的Cluster前核取方塊勾上,

聚類標準(SimilarityMetic)我們選擇correlationuncentered聚類方法函式(Clustering method)我們一般選擇輸出均值(Averagelink age)。點選完Averagelink age按鈕則會在原始資料所在的資料夾自動生成兩個檔案,檔案格式分別為CDT和GTR格式檔案。

 

(5)此時Cluster軟體的使命已經完成,接下來進入TreeView進行圖形輸出。

 

2.Java TreeView的使用:

(1) 軟體的執行:雙擊(圖-2)中的Treeview.jar檔案。軟體主介面如下圖(圖-7)所示。

圖-7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2) 檔案的載入:同樣,點選選單欄File / Open選擇Cluster輸出的DAT檔案,稍等片刻即如下圖(圖-8)所示。

圖-8

 

 

 

 

 

 

 

 

 

 

 

 

 

(3) 顯示區域的選擇:用滑鼠左鍵按住在上圖(圖-8)中的彩圖區域選擇需要的顯示區域,所選區域會在右邊空白區顯示如下圖(圖-9)所示。

圖-9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(4)所選區域設定:基因色塊大小顏色深淺均在選單欄Settings /  PixelSettings裡設定,設定介面如下圖(圖-10)所示。

圖-10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Global:是設定全域性圖片大小;

Zoom :是設定每個基因色塊的大小;

Contrast:是調節基因色塊的對比度。

 

其他,比如字型等等如有需要均可在選單欄Settings子目錄下找到相應項進行設定,此處不再贅述。

 

(5) 影象的輸出:點選選單欄Export / Exportto image ,設定選單的資料預設(當然有需要也可作相應更改),點選Save按鈕,則輸出如下圖(圖-11)所示的圖片。

圖-11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(6) ColorBar的輸出:點選選單欄 Export/ Export ColorBar to image,設定介面如下圖(圖-12)所示:

圖-12

 

 

 

 

 

 

 

 

 

 

 

對ColorBar裡單個色塊的多少、大小及整體的大小輸出路徑等都可進行設定,好!點選Save按鈕即可輸出圖片檔案如下圖(圖-13)所示。

圖-13

 

 

(7)收工:OK!全都完成啦!(*^__^*)嘻嘻……

相關文章