Bioperl的簡介 (轉)

worldblog發表於2008-01-22
Bioperl的簡介 (轉)[@more@]

Bio的簡介

  Bioperl 最近已經到了1.0版,先說bioperl.org,該組織正式成立於1995年,在此之前已經作為非正式的團體存在那很多年,現在他已經形成了一個國際性的開發者的協會,這些開發者開發用於生物資訊學,基因組學,和生命科學研究的開放原始碼的Perl 工具.

 該組織的支持者和推動者是Open Bioinformatics Foundation. 他們的夥伴還有bio.org, bio.org, DAS, bio.org, bio.org, ENSEMBL 和 EMBOSS.

Bioperl的提供供下列服務,用於生命科學的基於perl的模組,指令碼,聯接的.

Bioperl現在已發展成為一個令人矚目的國際性的自由計劃,bioperl在生物資訊學的使用加速了生物資訊學、基因組學以及其他生命科學研究的發展。最近bioperl 1.0版本正式釋出,這其間歷時七年,成績斐然。Bioperl 1.0 包括832個,93個Script,功能豐富,原始碼全部開放。它是生物資訊學研究的利器。詳細的內容大家可以訪問。

Bioperl作為perl的擴充的專門用於生物資訊的工具與集,自然也繼承了perl的眾多優點.

第一. Perl強大的正則表示式(regular expression)比對以及字串操作使這個工作變得簡單而沒有其它語言能相比。Perl 非常擅長於切割,扭轉,絞,弄平,總結,以及其它的操作文字檔案。生物資料大部分是文字檔案:物種名稱,種屬關係,基因或序列的註解,評住,目錄查閱, 甚至DNA序列也是類文字的。現在互相以以文字檔案的形式存在的但是具有不相容的資料格式生物資訊資料是一個很頭疼的問題,perl的這個方面的優點,可以在這一方面解決不少問題.

第二. Perl 能容錯。生物資料通常是不完全的,錯誤或者說誤差從資料的產生時候可能就產生了.另外生物資料的某項值欄位可以被忽略 ,可能是空著的,或是某個欄位也就是某個值,被預期要出現好幾次(舉例來說,一個實驗可能被重複的操作),或是資料以手動輸入所以有錯誤。Perl並不介意某個值是空的或是有奇怪的字元。正規表示式能夠被寫成取出並且更正錯誤的一般錯誤。當然這種彈性也可能是各壞處。


  還有,Perl 是導向的。Perl 鼓勵人們將他們的軟體寫成小模組,不論是用 Perl 函式庫模組或是正統的 工具導向的方式。外部能夠輕易的被整合進 Perl 程式,靠著管道(pipe),呼叫,或是插座(socket)。Perl5 引進的動態載入器允許人們使用 C 的函式,或者讓整個過的函式庫,被使用在 Perl 直譯器中。最近的成果是世界各地的智慧結晶都會收錄在一組模組裡面,稱為”bioPerl”(請參考 Perl Journal)
  Perl 很容易去寫並且能很快開發完。直譯器讓你不需要宣告你所有的函式型式以及資料型態,當未定義的函式被呼叫時只會引起一個錯誤,除錯器也能與Emacs很好的合作並且讓你能用令人舒服的交談式的開發。
  Perl 是良好的原型語言。因為它快而且髒(quick and dirty),用 Perl 建構新演算的原型比直接寫成一個快的需要程式設計過的語言來的有意義。有時候發現結果是Perl已經夠快了,所以程式變不需要移植;更多情形是某人可以用C寫一個小的核心程式,程式設計成動態載入的模組或是外部的可程式,然後其它的部分用Perl來完成。這部分的例子可以參考 /distribution/software/rhmapper/)。">)。

  有一點要強調的是, Perl 在寫作網頁 方面非常優秀,而且重要性隨著各實驗將資料發表在上之後更是增加。我在基因中心環境下使用 Perl 的從頭到尾都是值得稱讚的。然而我發現 Perl 也有它的問題。它的鬆散的程式風格導致許多錯誤,這些在其它嚴格的語言都會被抓到。舉例來說,Perl 讓你在一個變數在被指定值之前就能使用,這是個很有用的特性當你需要的時候,但是卻是一個災難當你單純的打錯了辨識名稱。同樣的,很容易忘記要宣告一個函式裡面的區域變數,導致不小心地改到了全域變數。
  最後,Perl 的不足之處在於建立圖形化的使用者介面。雖然 Unix忠實信徒所有事情都能在命令模式下完成,大多數的終端使用者卻不同意。視窗,選單,彈跳的圖案已經變成了必要的時尚。


  直到最近,直到最近,Perl 的使用者介面(GUI)發展仍是不成熟的。然而 Nick Ing-Simmons的努力使得 perlTK(pTK) 的整合使得以 Perl 的使用者介面在 X-window上面成為可能。我的夥伴和我曾經在 MIT 基因中心寫過幾個 pTK 為基礎的應用程式供互連網使用者,而且從頭到尾都是一個令人滿意的經驗。其它的基因中心則更大規模的使用 pTK,在某些地方已經成為主要的生產力。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10752043/viewspace-998138/,如需轉載,請註明出處,否則將追究法律責任。