各種ID轉化之心路歷程

weixin_34148456發表於2018-08-13

心路歷程:

接上篇從CAZy database中爬取資料+多噁心的資料都要堅持清洗,我拿到了一批帶有Genbank protein accession的資料,無知的我居然手動在NCBI上搜尋gene symbol然後粘到excel裡!大概搜了幾百個,一上午過去了,中午吃完飯,一邊昏昏欲睡一邊聽著音樂機械的重複勞動,忽然一激靈,為什麼我要做這種無聊的工作?
想起上回師兄炫耀說他存在的意義:做溼實驗96孔板得到的資料,一條條往excel裡貼上需要半小時,他花十分鐘寫了個程式實現自動貼上,就幫全實驗室人解決了N個半小時。
Excuse me??? 我是個做生信的啊,為什麼我要手動??為什麼???
對自己呵呵呵了幾聲。

於是我爬了谷歌,度娘,又在群裡請教了大神,總結了幾種方法,按好用順序排列:

  1. https://biodbnet-abcc.ncifcrf.gov/db/db2db.php
    最好用的,基本cover常見的任何ID
  2. DAVID
    不過聽說老舊,於是沒有嘗試
  3. 谷歌上有biomaRt的教程,我執著的想用R裝一波,尚未成功。
    在此感謝小丫畫圖群中的某同學,不知他是否願意透露姓名,我就不在此公開了。= =

相關文章