Linux下把sra檔案轉成fastq檔案
記錄下自己在安裝sratoolkit和轉換檔案的摸索步驟
轉換檔案需要使用sratoolkit軟體,所以首先要下載,先說下下載、解壓、安裝這個軟體。我事先在我的Linux目錄下新建一個資料夾software用來存放下載的軟體,新建資料夾命令:mkdir software,然後就在這個資料夾下載軟體了。
1. 在Linux下直接用wget來下載,輸入如下命令:
wget http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-centos_linux64.tar.gz
2. 在當前目錄解壓下載的壓縮包,輸入如下命令:
tar -xzf sratoolkit.current-centos_linux64.tar.gz
3. 為了避免因升級而需要修改配置檔案,把軟體的版本號去了,該名字為sratoolkit
mv sratoolkit.2.9.6-1-centos_linux64 sratoolkit
4. 在sratoolkit資料夾下檢視絕對路徑
[wuchan@login sratoolkit]$ pwd
/share/home/wuchan/software/sratoolkit
[wuchan@login sratoolkit]$ ls
bin CHANGES example README-blastn README.md README-vdb-config schema
5. 配置環境變數,用的是vi編輯文字命令
vi ~/.bashrc #用vi編輯修改.bashrc檔案
i #切換成插入
export PATH=/share/home/wuchan/software/sratoolkit/bin:$PATH #這裡的絕對路徑是通過在存放sratoolkit資料夾下輸入pwd檢視得到的
Esc #回到命令
:wq #儲存退出.bashrc檔案
source ~/.bashrc #讓配置生效
接下來是第二部分,使用sratoolkit把sra檔案轉為fastq檔案,為什麼要轉?
因為sra是二進位制檔案,在Linux下如果用less去檢視,它會顯示這是個二進位制檔案,你是否確定開啟它。一般我們分析測序資料,是用fastq檔案開啟分析,所以就需要轉格式。
1. 我的下載下來的sra檔案儲存在SRAdata資料夾下,所以進入SRAdata資料夾去轉換
cd SRAdata
2. 用絕對路徑去轉換,輸入如下:
/share/home/wuchan/software/sratoolkit/bin/fastq-dump --split-3 /share/home/wuchan/SRAdata/SRR5831963.sra
前面的語句是呼叫sratoolkit/bin/目錄下的fastq-dump,然後--split-3表示雙端測序拆分成兩個reads,後面的SRR5831963.sra就是我下載的sra資料。這個拆分後的是存放在SRAdata資料夾下的。這裡補充一點,當時我直接在sratoolkit資料夾下面輸入如下命令:fastq-dump --split-3 /share/home/wuchan/SRAdata/SRR5831962.sra 得到的fastq檔案是存在sratoolkit資料夾下。說明在當前資料夾下面呼叫轉換命令,生成的檔案也就是在當前目錄下。補:這裡還出現了一個錯誤,我直接在SRAdata下輸入這個命令會報錯。目前還不知道原因,猜測應該是不能直接呼叫fastq-dump
[wuchan@login SRAdata]$ fastq-dump --split-3 /share/home/wuchan/SRAdata/SRR5831963.sra
bash: fastq-dump: command not found...
一些錯誤與嘗試記錄
1. 發現使用自己安裝的sratoolkit,可以直接這樣使用也能拆分
/share/home/wuchan/software/sratoolkit/bin/fastq-dump --split-3 SRR5831962.sra
也就是不需要加sra資料的絕對路徑,但前提是在儲存sra資料的資料夾下。
2. 不能直接按照下面輸入會報錯的。
[wuchan@login SRAdata]$ /sratoolkit/bin/fastq-dump --split-3 SRR5831965.sra
-bash: /sratoolkit/bin/fastq-dump: No such file or directory
[wuchan@login SRAdata]$ ~/sratoolkit/bin/fastq-dump --split-3 SRR5831965.sra
-bash: /share/home/wuchan/sratoolkit/bin/fastq-dump: No such file or directory
說明使用fastq-dump命令,必須輸入完整的軟體sratoolkit/bin目錄的絕對路徑才能使用。
使用別人的軟體,發現sra檔案也不需要寫絕對路徑,也可以這樣輸入命令:
/share/home/yeguojun/softwares/sratoolkit.2.9.6-1-ubuntu64/bin/fastq-dump --split-3 SRR5831964.sra
最終得到的拆fastq檔案也儲存在當前資料夾下
[wuchan@login SRAdata]$ /share/home/yeguojun/softwares/sratoolkit.2.9.6-1-ubuntu64/bin/fastq-dump --split-3 SRR5831964.sra
Read 46413234 spots for SRR5831964.sra
Written 46413234 spots for SRR5831964.sra
相關文章
- 把 .xyz 檔案轉換成 .ply 檔案
- sra 資料轉成 fastq並改名AST
- sra轉fastq格式AST
- FastQ檔案格式AST
- 本地blast的使用及SRA轉fastq,解決sra轉換成fastq後bwa無法識別的問題AST
- sra檔案下載及解析的問題
- ncbi下載資料sra和轉換fastq流程AST
- 如何使用python把json檔案轉換為csv檔案PythonJSON
- java 把檔案壓縮成 zipJava
- 如何把多張jpg轉換成一個pdf檔案?
- 老曹的作業本之sra轉fastqAST
- Linux下合併檔案Linux
- GBFF檔案轉GFF檔案
- word檔案怎樣取消只讀模式 把只讀檔案轉化為可編輯檔案模式
- PDF檔案如何轉成markdown格式
- day58:Linux:BashShell&linux檔案管理&linux檔案下載上傳Linux
- ofd檔案如何轉換成pdf格式 電腦上ofd檔案如何轉換成pdf格式
- Linux下安裝whl檔案Linux
- 如何進行Linux下檔案編碼格式轉換Linux
- win10系統把cdr格式轉換成psd檔案的方法Win10
- 轉換Linux 檔案編碼方式Linux
- Linux與Windows共享檔案Samba(轉)LinuxWindowsSamba
- 如何把大 Excel 檔案拆成多個小檔案Excel
- caj檔案怎麼轉換成word文件,簡單的檔案格式轉換教程
- Java 透過aspose.words 把docx檔案轉成pdf檔案後中文變成小方塊,aspose轉pdf亂碼問題的解決方法Java
- PDF檔案轉換為DWF檔案
- Linux----12 檔案與檔案操作Linux
- SpringMVC檔案上傳下載(單檔案、多檔案)SpringMVC
- linux下oracle安裝檔案.cpio.gz檔案的解壓LinuxOracle
- Linux下玩轉nginx系列(二)——nginx配置檔案說明LinuxNginx
- linux下使用windows標頭檔案LinuxWindows
- chm檔案怎麼轉換成TXT格式?chm檔案快速轉化成TXT格式的方法
- python 將 CVS檔案轉為HTML檔案PythonHTML
- 檔案程式設計、檔案下載程式設計
- Linux-檔案寫入和檔案同步Linux
- Linux核心檔案Linux
- Linux檔案管理Linux
- linux 檔案操作Linux