聚類分析軟體操作流程
2011/2/24
背景簡介:
在晶片資料聚類分析中,可用的軟體有很多,其中最重要的軟體就是Cluster和它的相關樹視覺化軟體TreeView。
軟體下載:
那如何獲取這兩款軟體呢?以下為兩款軟體的獲取地址:
http://bonsai.hgc.jp/~mdehoon/software/cluster/
選擇Cluster 3.0 for windows 和 JavaTreeView 下載。
軟體安裝:
1.Cluster 3.0的安裝:
Cluster 3.0 for windows 的執行環境為windows系統,所以直接點選clustersetup.exe即安裝成功。
2.Java TreeView的安裝:
Java TreeView下載完成後,檔案解壓後如下圖(圖-1)所示,此時Treeview.jar此時預設的是壓縮檔案,千萬不要解壓TreeView.jar檔案包。在windows系統中,按理說雙擊 setup.exe 檔案能完成安裝,但出於某些原因,有的電腦可能執行不了,那是因為缺少了一個Java的執行環境,因此我們需要下載 JRE(Java Runtime Environment,Java執行環境)。
JRE軟體官方下載地址為http://www.java.com/it/download/manual.jsp(For Windows版本)。
安裝完JRE軟體後,Treeview.jar檔案會自動預設JRE開啟,如下圖(圖-2)所示,若沒有自動預設,可右擊選擇預設開啟程式選擇JAVA(TM)Platform開啟。
圖-1 圖-2
軟體使用:
簡單地說:
1、Cluster的作用是應用一定的公式對一定格式的資料進行
過濾(Filter Data)、
校準(Adjust Data)、
分層聚類(hierarchical clustering)、
K-均值聚類(K-meansclustering)、
自組織圖譜SOM(self organizing map)、
PCA(principle-componetanalysis)。
最後輸出CDT和GTR格式檔案 ( CDT格式為TreeView的預設開啟檔案格式 ) 。
2、TreeView的作用是對Cluster輸出的資料進行視覺化顯示。
1.Cluster 3.0的使用:
(1)資料的載入:Cluster所識別的檔案格式為TXT文字檔案,檔案格式如下圖(圖-3)所示,資料可由Excel表格直接複製貼上入文字檔案。
點選選單欄File / Opendata file 選擇相應檔案即可。
圖-3
(2)資料的過濾:Cluster的主介面如下圖(圖-4)所示,點選Filter Data標籤,點選所有核取方塊,資料值預設,最後點選ApplyFilter按鈕及AcceptFilter按鈕。此時資料過濾完成。
圖-4
(3)資料的校準:點選主介面的AdjustData標籤如下圖(圖-5),選擇對數轉換資料(Log transform data)、聚類基因(Center genes)以及聚類列(Centerarrays)前的核取方塊,資料預設,點選Apply按鈕。
圖-5
(4)資料的分層聚類:點選主介面的Hierarchical 標籤如下圖(圖-6),需要解釋的是Genes區域是設定資料每一行即是否對各個基因進行聚類,Arrays區域是設定資料每一列即是否對幾個時期進行聚類。
圖-6
此處我們只對每行即各個基因進行聚類,所以將Genes區域的Cluster前核取方塊勾上,
聚類標準(SimilarityMetic)我們選擇correlation(uncentered),聚類方法函式(Clustering method)我們一般選擇輸出均值(Averagelink age)。點選完Averagelink age按鈕則會在原始資料所在的資料夾自動生成兩個檔案,檔案格式分別為CDT和GTR格式檔案。
(5)此時Cluster軟體的使命已經完成,接下來進入TreeView進行圖形輸出。
2.Java TreeView的使用:
(1) 軟體的執行:雙擊(圖-2)中的Treeview.jar檔案。軟體主介面如下圖(圖-7)所示。
圖-7
(2) 檔案的載入:同樣,點選選單欄File / Open選擇Cluster輸出的DAT檔案,稍等片刻即如下圖(圖-8)所示。
圖-8
(3) 顯示區域的選擇:用滑鼠左鍵按住在上圖(圖-8)中的彩圖區域選擇需要的顯示區域,所選區域會在右邊空白區顯示如下圖(圖-9)所示。
圖-9
(4)所選區域設定:基因色塊大小顏色深淺均在選單欄Settings / PixelSettings裡設定,設定介面如下圖(圖-10)所示。
圖-10
Global:是設定全域性圖片大小;
Zoom :是設定每個基因色塊的大小;
Contrast:是調節基因色塊的對比度。
其他,比如字型等等如有需要均可在選單欄Settings子目錄下找到相應項進行設定,此處不再贅述。
(5) 影象的輸出:點選選單欄Export / Exportto image ,設定選單的資料預設(當然有需要也可作相應更改),點選Save按鈕,則輸出如下圖(圖-11)所示的圖片。
圖-11
(6) ColorBar的輸出:點選選單欄 Export/ Export ColorBar to image,設定介面如下圖(圖-12)所示:
圖-12
對ColorBar裡單個色塊的多少、大小及整體的大小輸出路徑等都可進行設定,好!點選Save按鈕即可輸出圖片檔案如下圖(圖-13)所示。
圖-13
(7)收工:OK!全都完成啦!(*^__^*)嘻嘻……
相關文章
- 聚類分析聚類
- 聚類分析-案例:客戶特徵的聚類與探索性分析聚類特徵
- 機器學習-聚類分析之DBSCAN機器學習聚類
- K-均值聚類分析聚類
- 軟體測試LR效能分析流程
- 資料處理 聚類分析聚類
- 【機器學習】K-means聚類分析機器學習聚類
- 軟體專案管理流程分析與設計專案管理
- 聚類分析--k中心點演算法聚類演算法
- Mybatis操作主體流程MyBatis
- mahout之聚類演算法——KMeans分析聚類演算法
- 軟體工程-----高內聚低耦合軟體工程
- 分類 和 聚類聚類
- 硬聚類(HCM)和模糊聚類(FCM)在彩色影象分割中的具體應用聚類
- 軟體缺陷管理流程
- 軟體開發流程
- 軟體測試流程
- 流程圖繪製軟體,流程圖製作軟體哪個好流程圖
- 各類垃圾車的免徵操作流程
- 聚類之K均值聚類和EM演算法聚類演算法
- 聚類(part3)--高階聚類演算法聚類演算法
- 分析服裝研製流程用什麼管理軟體好?
- 教你文字聚類聚類
- 軟體測試的流程
- 聚類演算法聚類演算法
- 機器學習——dbscan密度聚類機器學習聚類
- 【scipy 基礎】--聚類聚類
- 機器學習(8)——其他聚類機器學習聚類
- Python數模筆記-Sklearn(2)樣本聚類分析Python筆記聚類
- 部分聚類演算法簡介及優缺點分析聚類演算法
- 乾貨 :基於使用者畫像的聚類分析聚類
- 軟體測試工作流程
- 軟體專案開發流程
- 09聚類演算法-層次聚類-CF-Tree、BIRCH、CURE聚類演算法
- ERP出入庫進階操作與子流程--開源軟體誕生28
- 04聚類演算法-程式碼案例一-K-means聚類聚類演算法
- 操作簡單的BI資料分析軟體有哪些?實際體驗如何?
- 統計分析和智慧聚類在遊戲資料中的應用聚類遊戲