機器學習:解讀基因密碼「食譜」
我們身體裡的每一個細胞都讀取著一本同樣的書——相同的基因組,亦即被編譯成DNA密碼、用以製造蛋白質的指令集。但是,我們體內不同細胞的功能卻非常不同。神經元傳送電訊號,肝細胞分解化學物質,肌肉細胞讓身體動起來。這些細胞採用了相同的基礎基因指令,卻執行著各種不同的特殊功能,為什麼?答案就隱藏在支配蛋白質生產的這套複雜的多層系統裡。
[caption id="attachment_5293" align="aligncenter" width="615"] 每份食譜都有烹飪指南和配料介紹。人類基因組也是如此。指南出了問題,就會有患病的風險。[/caption]
到目前為止,所有的基因研究都專注於基因組的那百分之一,也就是為蛋白質指定遺傳密碼的部分。但是,一項發表在《科學》雜誌上的新研究卻首次繪製出了負責蛋白質製造過程的那部分基因組圖譜。多倫多大學的計算機生物學家Brendan Frey領導了這項新研究,他說,「有書看是一回事,但最大的問題是怎麼讀這本書。」
Frey將基因組比喻成烹飪食譜。所有的食譜都既包括配料清單,比如麵粉、雞蛋和奶油,也有做法指導。在細胞裡,配料就是為蛋白質指定遺傳密碼的那部分基因組;圍繞它們的是基因組指令,告訴它們如何使用這些配料。
麵粉、雞蛋和奶油能做出幾百種不同的烘焙食物,同樣,基因成份也有很多種組合方式。這一過程就是可變剪接(alternative splicing),也是細胞從單一基因程式碼創造出如此多的細胞種類的過程。Frey和他的同事使用了一種成熟的機器學習模型(form)來識別這套指令集中的突變,預測這種突變可能造成的影響。
[caption id="attachment_5294" align="aligncenter" width="615"] Olena Shmahalo/Quanta Magazine[/caption]
研究人員已經識別出可能引發自閉症的風險基因,目前正在研發一種系統,用以預測與癌症有關的基因突變是否有害。MIT計算機生物學家Chris Burge(沒有參加這項研究)認為,「論文為基因科學家們提供了識別利害相關變異(variants of interest)的工具,希望能對人類基因領域的研究有重大影響。」
但是,這項研究的真正重要性可能在於這些新工具,它們能探測到龐大的DNA片段,到目前為止,我們還很難解釋這些片段。許多基因研究只對產生蛋白質的小部分基因組進行了排序。休斯頓貝勒醫學院的生物學家Tom Cooper 說,「這也論證了對整個基因組進行測序的重要性。」
相關文章
- 美食食譜
- Mac 開箱食譜Mac
- 重磅 | 我國《密碼法》正式頒佈,解讀密碼分類與密碼裝置管理密碼
- Crystal Kyber密碼演算法解讀(一)密碼演算法
- 大棚解讀卓越程式設計師密碼程式設計師密碼
- 日本COOKPAD:食譜分享社群如何電商化
- 【雲棲大會】基因計算:解讀生命的力量
- 安天工程師解讀CryptKeeper通用密碼事件工程師密碼事件
- 【C#食譜】【麵食】選單7:用預設值初始化泛型變數C#泛型變數
- 資料基因公司:研究顯示1234為最常用密碼密碼
- 藉助機器學習提高CRISPR基因編輯準確率機器學習
- mysql學習之-密碼管理(預設密碼,修改密碼,解決忘記密碼)MySql密碼
- 阿里媽媽:零食行業口味圖譜研究報告阿里行業
- 拓端tecdat:解讀出租房市場的資料密碼密碼
- 密碼學常用解碼網站密碼學網站
- 微播易&SocialBeta:拆解食飲新消費品牌的增長密碼(附下載)密碼
- 【密碼學系列】|| 分組密碼的工作模式詳解密碼學模式
- 《圖解機器學習》全書程式碼圖解機器學習
- 【機器學習】--譜聚類從初始到應用機器學習聚類
- 《卓越程式設計師密碼》讀後感程式設計師密碼
- Nebula Graph 原始碼解讀系列|客戶端的通訊祕密——fbthrift原始碼客戶端
- oracle 密碼詳解以及破解Oracle密碼
- 你真的瞭解“密碼”嗎?密碼
- WeakHashMap,原始碼解讀HashMap原始碼
- Handler原始碼解讀原始碼
- Laravel 原始碼解讀Laravel原始碼
- Swoft 原始碼解讀原始碼
- SDWebImage原始碼解讀Web原始碼
- MJExtension原始碼解讀原始碼
- Masonry原始碼解讀原始碼
- HashMap原始碼解讀HashMap原始碼
- Redux原始碼解讀Redux原始碼
- require() 原始碼解讀UI原始碼
- ZooKeeper原始碼解讀原始碼
- FairyGUI原始碼解讀AIGUI原始碼
- kafka程式碼解讀Kafka
- PostgreSQL 原始碼解讀(3)- 如何閱讀原始碼SQL原始碼
- 【C++】【原始碼解讀】std::is_same函式原始碼解讀C++原始碼函式