2020.10.28【讀書筆記】丨生物資訊學與功能基因組學(第一章 引言)

穆易青發表於2020-10-28
  • 學習目標
    • 定義生物資訊學
    • 解釋生物資訊學的範疇
    • 解釋為何球蛋白可以作為一個有用的例子闡釋這一學科
    • 描述何為基於網頁和基於命令列的生物資訊學手段
  • 生物資訊學定義
    • 作者定義:使用計算機資料庫和計算機演算法來分析蛋白質、基因和組成生物體的所有DNA的完整集合(基因組)的學科。
    • 美國國立衛生研究院(NIH)定義:研究、開發或應用計算工具和方法來拓寬對生物、醫學、行為學或健康資料的使用,包括用於獲取、儲存、組織、分析和視覺化這些資料的計算工具和方法
    • 美國國家人類基因組研究所(NHGRI)定義:生物資訊學是生物學的一個分支,關注對在核酸和蛋白序列資料中所發現的資訊的採集、儲存、顯示和分析
    • Russ Altman、Altman和Dugan的兩種定義:
  • 1.1 本書的組織架構
    • 第一部分:第1~7章,解釋如何獲取生物序列資料,尤其是DNA和蛋白質序列
    • 第二部分:第8~14章,描述了針對DNA、RNA和蛋白質的功能基因組學的分析手段,及如何決定基因功能。
    • 第三部分:第15~21章,涵蓋了對生命樹的基因組分析
  • 1.2 生物資訊學:全景
    • 三個視角總結生物資訊學和基因組學
      • 細胞:遵從中心法則
      • 生物體:每個生物體在發育的時空上會產生變化,基因表達也會發生變化。
      • 生命之樹:三大分支,細菌、古細菌和真核生物。
    • 貫穿本書的例子:球蛋白(Globins)
      • 球蛋白家族是生物學中被研究得最好的基因家族之一
        • 血紅蛋白肌紅蛋白是最早被研究的蛋白質之一
        • 測序技術很早就在測球蛋白區域
    • 本書概覽
  • 1.3 各章節組織架構
    • 理論知識與實用指導
    • 展望
    • 常見問題
      • 使用工具時可能會遇到的一些常見困難
      • 人為錯誤
    • 給學生的建議
    • 練習題
    • 參考列表
  • 1.4 對學生和教師的建議:練習,尋找一個基因,研究一個基因組
    • 本書兩個課程
      • 生物資訊學簡介(第一部分、第二部分)
      • 功能基因組學簡介(第三部分)
      • 學生可以選擇一個感興趣的基因組,並對如下5個方面進行深入描述
        • 描述該基因組的基本特徵,如基因組大小、染色體數目和其他特徵
        • 進行比較基因組學分析以研究該物種與相鄰物種的關係
        • 描述通過基因組分析所學到的生物學原理
        • 描述與人類疾病的關聯
        • 描述在基因組分析中所用到的關鍵資料庫或演算法等生物資訊學資訊
  • 1.5 生物資訊學軟體:兩種風格
    • 基於網路工具、基於命令列的工具
      • 圖示
    • 基於網路的軟體
      • 公共資料庫
        • 美國國家生物技術資訊中心(NCBI)
        • 歐洲生物資訊學研究所(EBI)
        • Ensembl
        • 加州大學聖克魯茲分校(UCSC)
    • 命令列軟體
      • 特點
        • 通常為Linux作業系統
        • 程式語言(Perl、Python、R)被廣泛使用
        • Unix系統提供Bash語句
      • 作者建議
        • 在Windows上使用Putty訪問Linux伺服器
    • 整合兩種風格
      • 許多生信資源可用於彌合兩種不同的風格
        • 各章節使用的一些基於網路的軟體與命令列軟體一覽表
      • 通過參加業內“競賽”組織者可以評估每個軟體的效能,並通過定義靈敏度與特異性來了解選用何種工具。
    • 學習生信程式設計的新範例
      • 除了書籍和課程,我們也提供一些線上資源,如大型開放式網路課堂(慕課、MOOC等)
      • Searls推薦的線上學習的十條規則
        • 制定一個計劃
        • 有選擇性
        • 管理你的學習環境
        • 做閱讀
        • 做練習
        • 做評估
        • 優勢探索(是否便捷)
        • 主動接觸他人(與他人溝通)
        • 記錄個人成績
        • 對學到的內容有較為實際的期待
    • 生物資訊血的可重複研究
      • 在研究時保證該研究可悲其他研究人員重複,有利於工作的累積和進展。
        • 工作流應該有據可查
        • 儲存在計算機上的資訊應該妥善整理
        • 資料應該可被他人使用
        • 後設資料(資料集相關的資訊)與資料一樣同等重要
        • 所使用的的資料庫應做好記錄
        • 軟體應做好記錄,最好提供版本號,記錄使用具體步驟,引數,可食用GitHub進行儲存方便共享。
  • 1.6 生物資訊學和其他資訊學學科
    • 生物資訊學與一些資訊學學科有重合,齊關注點在於DNA及其他生物分子。
    • 越來越多的工具使用者也成為了工具製造者
      • 圖示
  • 1.7 對學生的建議
    • 學生需要決定研究什麼範疇的問題,並決定什麼技術最適合解決這些問題。
    • 使用Biostars——生物資訊理論壇,可以釋出問題,獲取答案,探索教程
    • 推薦讀物
      • Dudley和Butte提供了一些近期的綜述性文章
      • Eric Green、Mark Guyer文章《從鹼基對到臨床,繪製一個基因組醫學藍圖》
      • 每年一月《Nucleic Acids Researc》出版一個描述核心生信資源的資料庫專刊,該期刊網站上會提供眾多文獻連結

相關文章