GEO資料庫下載 SRA

rainsc發表於2024-10-04

要從 GEO(Gene Expression Omnibus)資料庫下載 SRA(Sequence Read Archive)檔案,可以使用以下步驟:

1. 查詢 GEO 資料集

首先,訪問 GEO 資料庫的 GEO 網站 並搜尋你感興趣的資料集。通常資料集的 ID 以 "GSE" 開頭,例如 GSE12345。

2. 找到 SRA 訪問連結

在資料集頁面上,你可以找到與 SRA 相關的資訊。通常在資料集的 "Sample" 或 "Series" 資訊中,會列出 SRA 訪問號(SRR),你可以從中獲取 SRA 的 ID。

3. 使用 SRA Toolkit 下載 SRA 檔案

要下載 SRA 檔案,你需要使用 SRA Toolkit。你可以從 SRA Toolkit 下載頁面 下載並安裝 SRA Toolkit。

安裝完成後,你可以使用 prefetch 命令下載 SRA 檔案。例如,假設你的 SRA ID 是 SRR123456,你可以在命令列中執行:

prefetch SRR123456

這將把 SRA 檔案下載到預設的目錄中。

4. 轉換 SRA 檔案(可選)

如果你想將 SRA 檔案轉換為 FASTQ 格式,可以使用 fastq-dump 命令。例如:

fastq-dump --split-files SRR123456

示例步驟

以下是一個完整的示例,假設你已經找到了 SRA ID:

# 下載 SRA 檔案
prefetch SRR123456

# 轉換為 FASTQ 格式
fastq-dump --split-files SRR123456

注意事項

  • 確保在下載和轉換過程中有足夠的磁碟空間。

相關文章