MIT新研究:用AI把氨基酸序列編碼成曲子,再哼哼兩句還能“創造”全新蛋白質

大資料文摘發表於2019-07-02

想要創造一些具有有用特性的全新蛋白質?

沒問題。只要哼上幾個小調就可以了。

在科學和藝術的有機結合下,麻省理工學院(MIT)的研究者開發出了一套系統,用於將蛋白質的分子結構(所有生物體的基本構成物質)轉化為一小段音樂片段。

然後,將這個過程反轉過來,如果你改變幾個音符,還能“創造出”一些自然界中從未見過的全新蛋白質。

MIT新研究:用AI把氨基酸序列編碼成曲子,再哼哼兩句還能“創造”全新蛋白質

此項研究已經發表在了ACS Nano上面。研究下載地址:https://pubs.acs.org/doi/pdf/10.1021/acsnano.9b02180

它提供了一種將蛋白質的氨基酸序列“翻譯”成音樂序列的系統方法,並且能通過分子的物理特性來確定所屬的聲音。

雖然這些聲音都是為了能使人耳聽到而經過了一定的變換,但是這些變換是基於每個氨基酸分子的實際振動頻率的,這些頻率又是經過量子化學理論計算得來,因此它們和原始的聲音一一對應。

讓AI學習蛋白質的語言,並“翻譯”成樂曲

氨基酸是蛋白質鏈的組成部分,因此,氨基酸所構成的蛋白質長序列被轉化為一系列的音符。

雖然對於那些習慣了傳統音樂的人來說,這樣的音階聽起來並不熟悉,但是聽眾在熟悉之後就能輕鬆地意識到其中的聯絡和差異。Buehler說,在聽完這些氨基酸所產生的旋律之後,他現在能夠分辨出那些具有特定結構功能的蛋白質所對應的氨基酸序列。他會說:“這是一個 beta sheet”,或者“那是一個 “alpha helix”。

MIT新研究:用AI把氨基酸序列編碼成曲子,再哼哼兩句還能“創造”全新蛋白質

Buehler解釋說,整個概念是為了更好地瞭解蛋白質及其各種變異。蛋白質是構成皮膚、骨骼和肌肉的結構材料,同時也是酶、化學訊號物質,以及構成所有生物機器的大量其他功能材料。

但是它們的結構,包括它們將自身轉換成通常決定其功能的形狀所用到的方法,都是極其複雜的。“它們有著自己的語言,並且我們也不知道它是如何運作的,”他說。“我們不知道是什麼使絲蛋白成為絲蛋白,也不知道是什麼模式反映了酶中所發現的功能。我們不知道它編碼方式。”

將蛋白質的語言翻譯成一種人們易於理解的形式,並允許不同方面的資訊能夠在不同維度—音高,音量和持續時間上進行編碼。

Buehler 和他的團隊希望收集到關於不同的蛋白質家族之間的關係和差異以及其變異的新見解,並以此探索許多可以用來調整和修改蛋白質結構和功能的方法。和音樂一樣,蛋白質的結構也是分層的,在不同的結構層次上有著不同的長度或時間。

研究團隊之後採用了人工智慧系統來研究由多種不同的蛋白質所生成的旋律目錄。他們讓人工智慧系統在音樂序列中引入微小的變化,或者生成全新的序列,然後翻譯回與修改後的序列或新設計的序列所對應的蛋白質。

藉助這個過程,他們可以創造出現有蛋白質的變體。例如,藉助於在自然界中強度最高的材料之一—蜘蛛絲中所發現的蛋白質,製造出與自然進化所產生的蛋白質不同的新品種。

雖然這些研究者可能並不瞭解這些潛在的規則,“但是人工智慧已經學會了蛋白質的設計語言,”並且它可以對其編碼,創造出現有品種的變體,或全新設計的蛋白質,Buehler如是說。鑑於存在著成千上萬億的潛在組合,當涉及到創造新的蛋白質時,“你不可能從頭開始,但是AI可以。”

“雖然我們不知道模型內部發生了什麼,但是它很有用”

通過使用這樣一個系統,用一組特定種類的蛋白質的資料來訓練人工智慧系統可能需要幾天的時間,但是它之後可以在幾微秒的時間內設計出一種新的變體。

Buehler表示:“沒有其他方法能與之媲美,缺點就是我們並不知道這個模型內部發生了什麼。我們只知道它管用。”

這種將結構編碼為音樂的方式確實反映了更深層次的現實。

“當你在教科書中看到一個分子時,它是靜態的,”Buehler說到,“但它根本不是靜止的。它正在移動和振盪。每一個物質都是一組振動。我們可以用這個概念來描述物質。”

這個方法尚不允許任何型別的定向修改—諸如機械強度,彈性,或者化學反應性等性質的任何變化基本上是隨機的。“你仍然需要做實驗,”他說,當一種新的蛋白質變體產生時,“沒有方法去預測它會發生什麼。”

該團隊還創造了由氨基酸的聲音開發的音樂作品,這些氨基酸定義了20個新音階。他們創作的藝術品完全由氨基酸的聲音組成。

“它沒有使用任何人造的或天然的樂器,這展示了這種新的聲音源是如何被用作創意平臺的,”Buehler說到。從自然存在的蛋白質和人工智慧生成的蛋白質中提取出來的音樂主題貫穿於整個示例,所有的聲音,包括一些類似於男低音或小軍鼓的聲音,也都來自於氨基酸的聲音。

研究人員還開發了一款名為Amino Acid Synthesizer的免費的Android智慧手機應用程式,用於播放氨基酸的聲音,並將蛋白質序列記錄為音樂作品。

“Markus Buehler擁有最具創造力的靈魂,他對生物分子內部運作的探索正在以一種最重要的方式促進我們對生物材料的機械響應的理解。”Marc Meyers說到。他是加州大學聖地亞哥分校的一名材料科學的教授,並沒有參與這項工作。

Meyers補充道,“這種將其設想為音樂的方式是一個新穎而有趣的方向。這是最好的實驗音樂。生命的韻律,包括我們心臟的搏動,是重複聲音的最初來源,而這些聲音構成了美妙的音樂世界。Markus已經進入了奈米空間,去提取構成生命體的氨基酸的獨特韻律。”

澳大利亞悉尼大學的生物化學和分子生物技術教授Anthony Weiss說到:“蛋白質序列是複雜的,正如蛋白質序列之間的比較一樣。

他表示:麻省理工學院的團隊“提供了一種令人印象深刻,有趣和不尋常的方法來訪問並解釋這種複雜性。……這種方法得益於我們與生俱來的能夠聽到複雜音樂的能力。通過音樂的和諧與不和諧,我們現在有了一個有趣並且有用的工具來比較和對比氨基酸序列。”

相關報導:http://news.mit.edu/2019/translating-proteins-music-0626

相關文章