kraken軟體操作手冊
轉錄組資料質量分析完,想拿kraken軟體分析下資料有沒有微生物的序列汙染
找了全網沒看見什麼相關的指導文章,看官網的操作手冊也很雞助,所以自己翻譯了官網手冊以及寫了程式碼,希望對後來的人有些幫助。
Kraken是2013年Wood提出的的巨集基因組序列分類軟體,能夠快速對巨集基因樣品中的DNA序列進行分類,因此可以進行微生物檢測。Kraken在序列比對環節(環節C)採用精確k-mer匹配和精簡資料庫的方法(環節B),忽略基因變異,採取精確匹配;並且建立了專用資料庫與k-mer匹配相配合,極大地提高了檢測速度.Kraken分為兩個版本:記憶體開銷較大的normal版和將記憶體開銷限制為2Gb以內的mini版.Kraken速度極快,精度較低,適用於做微生物檢測的預處理.
官網網址:http://ccb.jhu.edu/software/kraken/
操作文件網址 :http://ccb.jhu.edu/software/kraken/MANUAL.html
一 安裝
1、如果安裝了miniconda的話可以直接用命令安裝
conda install kraken
2、從kraken官網下載source包,其中包括了kraken的一些程式碼,安裝指令碼install_kraken.sh,以及readme檔案
在安裝指令碼目錄下執行
./install_kraken.sh $KRAKEN_DIR
$KRAKEN_DIR指定kraken安裝的目錄
當看到提示 "Kraken installation complete."說明安裝完成,隨後將kraken兩個主要的指令碼複製到加入環境變數
cp $KRAKEN_DIR/bin/kraken $HOME/bin
cp $KRAKEN_DIR/bin/kraken-build $HOME/bin
$HOME/bin你環境變數的位置
二、下載kraken標準資料庫
kraken-build --standard --threads 24 --db $DBNAME
--threads 24 指定執行緒數24
--db $DBNAME 指定安裝的目錄
當資料庫構建完成,可以使用以下命令刪除冗餘的檔案
kraken-build --db $DBNAME --clean
三、分類程式碼
kraken --db $DBNAME seqs.fa
主要引數:
--threads NUM 設定執行緒數
--classified-out 輸出已經被分類的序列也就是汙染的序列
--unclassified-out 輸出未被分類的序列也就是未汙染的序列
--output 輸出
| or > 也是輸出
--fastq-input 宣告輸入檔案是fastq格式
--gzip-compressed 宣告輸入檔案是.gz的壓縮格式
--bzip2-compressed 宣告輸入檔案是.bz的壓縮格式
--paired 如果是雙端測序,則需宣告為是雙端測序
四、例項程式碼
程式碼一:輸出classify序列和unclassify序列以及一個.kraken檔案
--threads 8:指定執行緒 8
--db /data/program/Assessment/kraken_database/ 指定標準資料庫的路徑
--fastq-input--gzip-compressed 指定fastq檔案格式,這裡指定為gzip
--paired 指定是雙端測序
${output_forward_paired}${output_reverse_paired}輸入檔案的路徑與名稱:read1 read2
--classified-out 指定輸出分類的序列檔案——有汙染
${output_classify} 輸出分類的序列檔案的路徑及名稱
--unclassified-out 指定輸出未分類的序列檔案——無汙染
${output_unclassify}輸出未分類的序列檔案的路徑及名稱
> ${kraken} 輸出一個.kraken檔案
程式碼二:輸出報告,報告統計了汙染的比例,還有汙染的種類
${kraken}上面生成的.kraken檔案
> ${kraken_report} 指定輸出報告的路徑及名稱
最終我加入我自己的輸入檔案路徑與輸出檔案路徑等內容,寫成的程式碼如下:
nohup...& 是把任務掛到後臺執行
最終得到的報告如下:
98.46%未被汙染
1.54%被汙染,且列出汙染的序列屬於哪個物種。
就醬
希望對大家有幫助。
相關文章
- jquery操作手冊jQuery
- DHorse操作手冊
- GIt tag 操作手冊Git
- PDB插拔操作手冊
- rman duplicate操作手冊
- 軟體開發專案文件系列之十三如何撰寫使用者操作手冊
- mpaas-springboot-base操作手冊Spring Boot
- 列印交易票功能操作手冊
- wps+ps 寫操作手冊
- 資料載入操作手冊
- ORACLE基礎運維命令操作手冊Oracle運維
- MySQL5.7.26 MHA叢集部署操作手冊MySql
- [原創] Frida操作手冊-Android環境準備Android
- Centos7安裝MySQL8.0 - 操作手冊CentOSMySql
- iOS應用釋出操作手冊-應用釋出篇iOS
- 給自己的軟體製作註冊碼
- ENVI新機器學習:隨機森林遙感分類工具操作手冊機器學習隨機森林
- 君正x1000軟體開發指南手冊
- CRM中介軟體裡CRM local changes的註冊管理
- Oracle 叢集軟體資源的手工註冊(zt)Oracle
- Kraken v0.8.0 釋出 — 支援 Flutter 2.0Flutter
- Xilinx官網查詢各個版本軟體的手冊
- 片式學習記憶軟體:Studies for Mac 註冊啟用版Mac
- 註冊多個賬號需要使用代理IP軟體技巧!
- DrawPad for Mac(圖形編輯軟體) v6.74註冊版Mac
- 瞄準Windows的新興殭屍網路:KrakenWindows
- Affinity Photo for Mac(專業修圖軟體)v1.10.2.266註冊版Mac
- Data Guardian for Mac(mac資料加密軟體) v5.1.4註冊版Mac加密
- 左邊那個是什麼軟體 還需要註冊才可以
- 使用 minitouch 遠端操作手機時,手動操作手機後 minitouch 執行命令就失效了
- 加密保護軟體 WinLicense 註冊常見問題(一):許可證加密
- Prism 10 for Mac(統計分析繪圖軟體)10.0.0.3註冊啟用版Mac繪圖
- Prism 10 for Mac(統計分析繪圖軟體) v10.0.0.3註冊版Mac繪圖
- 加密貨幣交易所Kraken將停止在日運營加密
- XnViewMP 註冊碼啟用版:mac電腦強大的看圖軟體ViewMac
- 序列號查詢工具KCNScrew解決多個軟體的註冊問題
- Crescendo Masters for mac(音樂創作軟體) v5.66註冊啟用版ASTMac
- 深入解析基於 Flutter 的 Web 渲染引擎「北海 Kraken 」技術原理FlutterWeb