circBase:環狀RNA資料庫

weixin_34128411發表於2019-02-22

歡迎關注”生信修煉手冊”!

circBase是一個環狀RNA的資料庫,收錄了人類,小鼠等多個物種的環狀RNA資訊,採用了find_circ軟體來預測去核糖體文庫中的環狀RNA,該資料庫的 網址如下

http://www.circbase.org/

在該資料庫中,環狀RNA的ID以物種的三字母縮寫開頭,比如hsa_circ_0018046,記錄了circRNA的頭尾在染色體上的為位置,來源基因,序列等資訊。通過以下3種方式可以檢索該資料庫

1. 直接檢索

在主頁的檢索框中,可以根據環狀RNA的ID, 來源基因的名稱,轉錄本名稱等多種方式進行檢索

檢索結果示意如下

軟體通過檢測覆蓋連線點兩側的reads來識別環狀RNA,對於一個環狀RNA,只能夠給出其頭尾在染色體上的位置和正負鏈資訊, 檢索結果中的genomic length對應的就是基因組上環狀RNA頭尾之間的長度。

同時還提供了環狀RNA對應的染色體區域上的重複元件和基因組特徵的註釋。

對於環狀RNA的序列資訊,根據頭尾的染色體位置去和已知的轉錄本進行比較,選擇一個最佳的轉錄本,即best transciprt作為參照,然後確定剪下之後環狀RNA的序列,從而得到spliced length。 需要注意的是,這種方式得到的序列只是一個生信預測的結果,後續還是需要實驗手段來驗證的。

檢索結果支援匯出xlsx, txt, csv等多種格式,也可以匯出環狀RNA的序列,示意如下

支援匯出基因組序列和剪下之後的序列,還可以向上下游延伸。

2. 列表檢索

通過導航欄的list search, 可以依次檢索多條記錄,示意如下

選擇對應的物種,然後輸入多個需要檢索的ID即可。

3. table browser

和UCSC的table  browser類似,提供了更加靈活的篩選策略,檢索框示意如下

通過blat按鈕,可以輸入fasta格式的查詢序列,然後和資料庫中的circRNA序列進行比較,示意如下

查詢結果如下所示

該資料庫是免費下載的,可以下載物種對應的環狀RNA的列表,也可以下載對應的序列,同時還提供了find_circ軟體的原始碼,可以用於分析自己的測序資料中的circRNA。

·end·

—如果喜歡,快分享給你的朋友們吧—


掃描關注微訊號,更多精彩內容等著你!

相關文章