生信分析預處理:plink兩種格式識別與轉換
生信分析預處理:plink兩種格式識別與轉換
檔案格式1
bed fam bim 是一組的:
bed
bed檔案採用二進位制的方式儲存檔案,代表的資料意義和其他兩個檔案對應;
bim
1.第一列是染色體資訊
2.第二列是snp的名字
3.第三列是摩爾距離,檔案中說可以用0,沒關係
4.第四列是物理距離
5.第五列是次要等位基因
6.第六列是主要等位基因
舉例:
fam
舉例:
檔案格式2
ped 和 map 是一組的
ped
舉例
每一行是一個個體,前六列是固定的,從第七列開始後面就是每個snp位點的基因型情況,第七列第八列就是第一個snp位點,第九列第十列就是第二個snp位點,依次類推。。。 其中 0 代表 no calling, 從圖中可以看出 第一個個體第一個snp 就是 00 第二個個體第二個snp 就是 AG 。
我們再回過頭來看前六列:
第一列 Family ID
第二列 Individual ID
第三列 Paternal ID
第四列 Maternal ID
第五列 Sex (1=male; 2=female; other=unknown)
第六列 Phenotype
map
第一列代表染色體
第二列代表snp的名稱
第三列代表摩爾距離,一般用不上
第四列代表物理距離,這個有用的
舉例:
格式轉換
bed bim fam 轉 ped map
命令:
plink --bfile bed等檔案字首 --recode --out ped_map相應要生成的檔案字首
轉化完成提示:
ped map 轉 bed bim fam
plink --file ped_map相應的檔案字首 --out bed等檔案需生成的字首
相關文章
- 【視訊處理】YUV與RGB格式轉換
- 資料匯入與預處理實驗二---json格式檔案轉換JSON
- php 與 nginx 的兩種處理方式PHPNginx
- heic轉換格式的兩種方法:你get到了嗎
- 10種資料預處理中的資料洩露模式解析:識別與避免策略模式
- ABAP和XML資料格式互相轉換的兩種方式XML
- C#轉義字元的兩種處理方式C#字元
- ChannelHandler之間處理資料格式轉換與Netty自帶的ChannelhandlerNetty
- opencv圖片處理與OCR識別OpenCV
- fMRI預處理之DICOM格式轉NII格式——SPM12批次碼
- Java 檔案換行符識別與轉換Java
- sql monitor中timestamp變數轉換可識別格式SQL變數
- Java SimpleDateFormat處理日期與字串的轉換JavaORM字串
- Python 編碼轉換與中文處理Python
- JN專案-型別轉換異常處理型別
- 生信公共資料庫下載處理資料庫
- heic格式轉換jpg怎麼轉?兩步搞定
- 資料預處理-資料整合與資料變換
- Javascrip 之 字串處理 & 定時器 & 型別轉換Java字串定時器型別
- 處理檔案上傳時的訊息格式轉換問題
- Drawable轉換為Bitmap兩種方法
- 影片格式處理:騰訊影片格式怎麼轉換成mp4檔案?
- 時間型別及格式轉換型別
- Oracle中Date的各種格式轉換Oracle
- 強制型別轉換時的異常處理_java與c++比較型別JavaC++
- 用兩種方法把JSON資料格式轉換為Python的類物件JSONPython物件
- Windows中兩種多字元與寬字元的轉換方法薦Windows字元
- Json 的日期格式與.Net DateTime型別的轉換JSON型別
- 網易雲音樂ncm格式分析以及ncm與mp3格式轉換
- java型別轉換與強制型別轉換(轉)Java型別
- 資料分析--資料預處理
- 安裝LaTeX-OCR截圖識別轉換成LaTeX-Markdown格式
- GPT與MBR格式 以及互相轉換GPT
- split用法與影像預處理
- SqlServer 2005處理xml格式 (轉)SQLServerXML
- 第二天:識別符號、賦值、資料型別、格式符、常量、自動轉換、強制轉換。符號賦值資料型別
- MyBatis多對多的兩種處理方式MyBatis
- sqlldr同時處理兩種分隔符SQL