FastQ檔案格式

weixin_33670713發表於2018-05-26

fastq格式是生物資訊分析中最常見的格式之一

  • 通常我們可以將測序的資料分為雙端測序單端測序雙端測序的資料含有兩個fastq格式的檔案,單端測序的資料只有一個fastq格式的檔案
    fastq格式的檔案詳解如下圖:
    主要分為四行
  • 第一行是用來區分不同reads的一個ID號,一般以@符號開頭,這一行是用來區分不同的reads,而這一行本身包含了很多的資訊。
  1. Read Record Header
  2. Flow Cell ID
  3. Lane
  4. Tile
  5. Tile Coordinates
  6. Barcode
  • 第二行是測序的序列,也就是reads的序列
  • 第三行一般是一個+號,或者與第一行的資訊相同
  • 第四行是鹼基質量值,是對第二行序列的鹼基的準確性的描述,一個鹼基會對應一個鹼基質量值,所以這一行和第二行長度是一樣的,如果不一樣就說明資料有問題


    11644424-88957f73f314e801.png
    圖片.png

相關文章