如何基於Perl實現批次蛋白名轉換為基因名？以做後續GO與KEGG分析

皮蛋笔记發表於2024-05-29

原文網址 : https://www.cnblogs.com/wuzhixiake/p/18221096

　　眾所周知，在完成蛋白組學組間差異蛋白篩選後，往往要做GO與KEGG功能富集分析，這就需要我們首先將蛋白名轉換為基因名，或者找出基因ID。將蛋白名轉化為基因名可能涉及不同的轉換工具或資料庫，這裡有幾種常見的方法：

①UniProt資料庫：UniProt資料庫提供了蛋白和其對應基因的關聯資訊。可以透過查詢UniProt資料庫來找到蛋白名對應的基因名。

② 基因註釋工具：一些基因註釋工具（如DAVID、Enrichr等）能夠接受蛋白名作為輸入，並返回與之關聯的基因資訊。

③文獻和資料庫搜尋：透過文獻或特定的生物資訊學資料庫（如NCBI、Ensembl等），可以手動查詢蛋白名和基因名之間的關聯。

④轉錄本和基因組資料庫：有時蛋白和基因之間的對映可以透過轉錄本和基因組序列的對應關係來確定。

以上四種方法雖然可以實現蛋白名與基因名的轉換，但是隻適應於小樣本的處理，如果差異有幾百或者上千個蛋白，那麼用以上方法處理起來會非常麻煩。下面我們將介紹如何用perl進行批次處理。原始碼可關注本公眾號（皮蛋筆記）私信獲取。

1、首先下載並安裝Perl指令碼

網頁搜尋Perl直接進入即可(Strawberry Perl for Windows)，點選下載並安裝。

2、準備所需檔案

Protein name.txt為篩選到的差異蛋白檔案如下圖所示，包含蛋白名稱或者蛋白ID，本例中所使用的為蛋白名稱。uniprot_Human.tsv為從uniprot資料庫下載的物種蛋白資料庫，如何下載之前筆記已經講述。addSymbol檔案就是Perl指令碼，可關注本公眾號（皮蛋筆記）私信獲取。

3.開啟addSymbol檔案，更改程式碼中的檔名，以輸入、輸出檔案

4.在電腦搜尋框中輸入“cmd”，開啟命令提示符。

5.如下圖所示，輸入“cd ”(cd後有空格)，將檔案所在工作路徑複製或貼上至cd後面，並按下“enter”開啟工作路徑

6.手動輸入addSymbol.pl檔名，按下“enter”鍵執行即可得結果。

7.可以發現在資料夾裡已經多了結果檔案，開啟進行後處理即可

在獲取蛋白質的基因的名稱後，需要獲取基因的ID以為後續進行GO和KEGG分析，下篇筆記將會展示如何應用R語言進行GO分析，敬請關注與期待。本篇內容程式碼與檔案見以下連結

連結：https://pan.baidu.com/s/1oQ9dqOeHdO5I08skBt40VQ

提取碼：r3ml

內容轉自公眾號：皮蛋筆記，歡迎關注，獲取第一時間諮詢和相關資料。

相關文章

如何基於R包做GO分析？實現秒出圖
2024-06-12
Go
Python實現批次將ppt轉換為pdf
2023-03-31
Python
PDF批次轉換器，批次轉word為pdf，批次轉ppt為pdf
2024-10-23
JPG轉PDF如何實現？圖片批次轉換PDF的快捷方法
2021-09-09
批次目錄檔名大小寫轉換器
2024-12-06
基於 go pprof` 與 go trace 進行持續效能剖析
2021-12-30
Go
如何基於文件的內容實現 AI 對話功能，以 Documate 為例
2024-02-26
AI
使用UiBot實現批次html轉換成PDF檔案
2020-04-14
UIHTML
vscode如何將所有檔案格式lf批次轉換為crlf
2024-05-16
VSCode
2. Spring早期型別轉換，基於PropertyEditor實現
2020-12-08
Spring型別
使用Python實現批次PPT轉圖片，格式支援PNG、JPG，轉後圖片後批次重新命名
2022-09-08
Python
如何使用macOS預覽批次轉換影像
2020-10-23
Mac
GO 實現一個把結構體做 Sign 簽名
2019-07-21
Go結構體
自己動手做一個批次doc轉換為docx檔案的小工具
2024-03-20
如何在 Go 中將 []byte 轉換為 io.Reader？
2021-12-29
Go
基於Flutter實現的 IT換換（已開源）
2019-08-21
Flutter
批次轉換大量影片為TS格式的技巧分享
2023-03-27
jenkins：實現Jenkinsfile與Json的轉換
2021-02-09
JenkinsJSON
Java斷點續傳（基於socket與RandomAccessFile的簡單實現）
2019-05-09
Java斷點randomMac
HDF格式遙感影像批次轉為TIFF格式：ArcPy實現
2023-03-13
如何在 Apinto 實現 HTTP 與gRPC 的協議轉換 (下)
2023-03-17
APIHTTPRPC協議
如何在 Apinto 實現 HTTP 與gRPC 的協議轉換 (上)
2023-03-16
APIHTTPRPC協議
如何實現隱式型別轉換
2023-01-05
型別
如何基於 echarts 在柱狀圖或條形圖上實現轉換率？（有想法嗎？）
2020-05-31
Echarts
AI來實現程式碼轉換！Python轉Java，Java轉Go不在話下？
2023-03-12
AIPythonJavaGo
perl的hash轉json後按key排序
2019-01-10
JSON排序
【Go】IP地址轉換：數字與字串之間高效轉換
2019-03-25
Go字串
go用unioffice轉換word文件為pdf
2024-07-06
Go
為什麼 Go 不支援 []T 轉換為 []interface
2023-01-30
Go
實戰與原理：如何基於RocketMQ實現分散式事務？
2024-01-29
MQ分散式
Go interface實現分析
2018-12-18
Go
Bioconductor 分析基因晶片資料(轉帖）
2021-09-09
晶片
以Lgwr Worker為例,基於Strace 分析 Oracle 資料庫行為的方法
2022-09-18
Oracle資料庫
Cisdem PDFMaster for MacPDF批次轉換工具
2021-08-17
ASTMac
Go實現基於WebSocket的彈幕服務
2018-11-05
GoWeb
Pandas 基礎 (11) - 用 melt 做格式轉換
2019-04-09
基於Python的tf-idf演算法實現：以《笑傲江湖》為例
2018-09-15
Python演算法
find 批次修改檔案後輟名
2024-10-02