生物資訊大資料&資料庫(NCBI、EBI、UCSC、TCGA)

wangprince2017發表於2019-03-27

生物資訊大資料&資料庫(NCBI、EBI、UCSC、TCGA)

想系統的學習生信資料庫可以先看一下北大的公開課,有一章專門講的資料庫與軟體:

1-生物資訊學:導論與方法  北大\10 生物資訊資料庫及軟體資源

一個優秀的生信開發者能夠解決如下問題:

  • 如何鑑定一個重要的且沒有被解決的生物學問題?
  • 如何將該問題轉化為一個可計算的問題?
  • 如何提出一個解決此問題的演算法?
  • 如何實現該演算法?
  • 如何評估演算法?

生信工具使用者需要解決如下問題:

  • 每個方法解決的是哪個生物學問題?
  • 該方法有哪些基本的假設?
  • 每個引數是什麼意思,都是用來幹什麼的?
  • 準確度評估,sensitivity and specificity,tradeoff,應該追求哪一個?
  • 生物學問題和方法的侷限性?

生信資源的分類:

  • 集中資源&獨立資源
  • 資料庫&軟體工具
  • 原始資料庫&二級資料庫
  • 命令列工具&網頁伺服器工具

image

image

NCBI

EBI

UCSC Genome Browser:基因組瀏覽器,表達調控、變異資料,track,ENCODE 非編碼元件(計劃)

集中資源

 

NCBI

EBI

UCSC

連結

DatabaseToolsResource List(A-Z)

by topic 
by name

Table Browser 
Genome Browser

Tools

BLAST

BLAST、Exonerate、ClustalW2

BLAT、In-Silico PCR

Data Repository

GenBank、GEO、SRA

ArrayExpress、ENA、PDBe

ENCODE

DNA/Genome

Genome

Ensembl、Genomes

Ideogram、Recombination Rate、GC Content

DNA/Gene

Gene

Ensembl

UCSC Genes、GENCODE、RefSeq Genes

RNA

RefSeq

Ensembl

mRNAs、ESTs、UniGene

Proteins

Protein, RefSeq、Conserved Domain

UniProt、InterPro、PRIDE

 

Expression

UniGene

Expression、Atlas

Affy Exon Array、Caltech RNA-seq、Allen Brain

Regulation

 

 

Transcription、TFBS、Epigenetics、DNaseI HS

Literature

PubMed

 

 

Ontology

 

Gene Ontology

 

Comparative Genomics

Taxonomy、HomoloGene

*Ensembl

Conservation、Neandertal

Variation

dbSNP、dbVar

*Ensembl

SNPs、DGV、RepeatMasker

Disease

OMIM、MeSH、dbGaP、ClinVar

 

GAD、COSMIC、ClinVar、GWAS Catalog、QTLs

獨立資源

image

image

image

 


癌症

DNAnexus Reanalyzes Cancer Genome Atlas Data

DNAnexus完成世界上最大的泛癌症資料的重分析(附資料下載) - 基因慧

DNANexus:DNANexus專注於建立一個雲端計算伺服器中的DNA資料庫,然後以服務方式將該資料庫提供給研究者和科學家。DNAnexus和谷歌開展技術合作,提供最為全面的DNA資料庫,它可通過美國國家生物技術資訊中心(NCBI)下SRA的網站訪問到這些DNA資料(2011年2月,NCBI曾宣佈由於聯邦政府削減經費支援逐步淘汰SRA)。

Cancer Genome Atlas:泛癌症基因組

The Cancer Genome Atlas:就是 TCGA 的全稱,Atlas 古希臘的一個神

TCGA 官網   User Guides and Help

相關文章