R:SNP資料篩選.R

王哲MGG_AI發表於2024-06-19
# 清空工作環境,刪除所有物件
rm(list = ls())
library(data.table)

# 載入data.table包
library(data.table)

# 設定工作目錄
setwd("C:\\Users\\Administrator\\Desktop") # 設定為你的工作目錄路徑

# 讀取大檔案
file_path <- "AMP_lines456_maf0.05_het2N_geno0.6.hmp.txt"  # 替換為你的檔案路徑
data <- fread(file_path, header = TRUE, sep = "\t") # 使用fread高效讀取大檔案

# 篩選並在指定範圍上下50KB
start_range <- 136606701 - 50000 # 計算範圍下限
end_range <- 136613008 + 50000 # 計算範圍上限

# 根據條件篩選chr6資料
filtered_data <- data[chrom == "6" & pos >= start_range & pos <= end_range]

# 將篩選結果寫入新的檔案,確保NA值被正確寫出,不新增引號
output_path <- "filtered_data.txt" # 輸出檔案路徑
fwrite(filtered_data, output_path, sep = "\t", na = "NA", quote = FALSE) # 寫入檔案

# 顯示篩選後的結果
print(filtered_data) # 列印篩選後的資料

相關文章