ML如何推動結構生物學的發展?哈佛科學家用AI在最小尺度上研究人類發育

ScienceAI發表於2024-07-19
圖片

編輯 | 白菜葉

對於結構生物學家 Lucas Farnung 來說,沒有比單個受精卵如何發育成一個功能齊全的人類更令人著迷的問題了。他正努力在最小尺度上研究這一過程:數萬億個原子必須同步工作才能實現這一過程。

「我看不出解決 5,000 塊拼圖和我們在實驗室進行的研究有什麼大區別。」哈佛醫學院布拉瓦尼克研究所(Blavatnik Institute at Harvard Medical School)細胞生物學助理教授 Farnung 說,「我們試圖從視覺上弄清楚這個過程是什麼樣子,然後我們就可以形成關於它如何運作的想法。」

人體中的幾乎所有細胞都含有相同的遺傳物質,但是這些細胞在發育過程中會變成什麼組織型別(例如,變成肝臟還是皮膚)很大程度上是由基因表達決定的,基因表達決定了哪些基因被開啟和關閉。

基因表達受轉錄過程調控,而轉錄正是 Farnung 研究的重點。在轉錄過程中,分子機器讀取 DNA 記憶體儲的遺傳藍圖中包含的指令,並生成執行指令的分子 RNA。其他分子機器讀取 RNA 並利用這些資訊製造為身體幾乎所有活動提供能量的蛋白質。

Farnung 研究負責轉錄的分子機器的結構和功能。

在接受媒體採訪時,Farnung 討論了他的工作以及機器學習如何加速該領域的研究。

Q:你的研究試圖回答的核心問題是什麼?

Farnung:我總是說,我們感興趣的是最小的邏輯問題。人類基因組幾乎存在於每個細胞中,如果你把組成基因組的 DNA 拉長,它的長度大約是兩米,也就是六英尺半。但這種兩米長的分子必須塞進細胞核裡,而細胞核只有幾微米大小。

這就相當於把一條從波士頓延伸到康涅狄格州紐黑文(約 150 英里)的魚線塞進一個足球裡。

為了實現這一點,我們的細胞將 DNA 壓縮成一種稱為染色質的結構,但分子機器卻無法再訪問 DNA 上的基因組資訊。

這就產生了衝突,因為 DNA 需要足夠緊湊才能容納在細胞核內,但分子機器必須能夠訪問 DNA 上的基因組資訊。

我們特別感興趣的是觀察 RNA 聚合酶 II 這種分子機器如何獲取基因組資訊並將 DNA 轉錄為 RNA 的過程。

Q:你們團隊使用什麼技術來視覺化分子機器?

Farnung:我們的一般方法是從細胞中分離出分子機器,然後使用特定型別的顯微鏡或 X 射線束對其進行觀察。

為此,我們將編碼感興趣的人類分子機器的遺傳物質引入昆蟲或細菌細胞中,這樣細胞就會大量製造這種機器。

然後,我們使用純化技術將機器從細胞中分離出來,以便我們能夠單獨研究它。

然而,這很複雜,因為我們通常不只是對單個分子機器感興趣,我們也將其稱為蛋白質。

有數千種蛋白質相互作用來調節轉錄,因此我們必須重複這個過程數千次才能瞭解這些蛋白質-蛋白質相互作用。

Q:人工智慧開始滲透到基礎生物學的方方面面。它是否改變了你進行結構生物學研究的方式?

Farnung:在過去的三四十年裡,我所在領域的研究一直是一個繁瑣的過程。一個博士生的科研生涯可能只專注於研究一兩種蛋白質,而要了解蛋白質在細胞中的相互作用,則所需的工作量是數千名學生都未必能完成的。

然而,在過去的兩三年裡,我們越來越多地尋求透過計算方法來預測蛋白質相互作用。谷歌 DeepMind 釋出了可以預測蛋白質摺疊的機器學習模型 AlphaFold,這是一個重大突破。重要的是,蛋白質的摺疊方式決定了它們的功能和相互作用。

我們現在正在使用人工智慧來預測數以萬計的蛋白質-蛋白質相互作用,其中許多相互作用以前從未被實驗描述過。實際上,並非所有這些相互作用都發生在細胞內部,但我們可以透過實驗室實驗來驗證它們。

這非常令人興奮,因為它確實加速了我們的科學研究。當我回顧我的博士學位時,前三年基本上是失敗的——我沒能發現任何蛋白質之間的相互作用。

現在,有了這些計算預測,我實驗室的博士生或博士後可以非常有信心,實驗室驗證蛋白質-蛋白質相互作用的實驗將會成功。我稱之為分子生物學的強化版——但合法——因為我們現在可以更快地找到我們想要回答的實際問題。

Q:除了效率和速度之外,人工智慧還在哪些方面重塑你的領域?

Farnung一個令人興奮的變化是,我們現在可以以無偏見的方式測試人體中的任何蛋白質與任何其他蛋白質,看看它們是否有可能相互作用。我們領域中的機器學習工具正在造成類似於個人電腦對社會造成的破壞。

當我剛成為研究員時,人們正在使用 X 射線晶體學來揭示單個蛋白質的結構——這是一項美妙的高解析度技術,但可能需要很多年的時間。後來,在我攻讀博士和博士後期間,低溫電子顯微鏡(簡稱低溫電子顯微鏡)應運而生。這項技術讓我們能夠以高解析度觀察更大、更動態的蛋白質複合物。

過去 10 年,低溫電子顯微鏡讓我們對生物學的理解取得了很大進展,並加快了藥物開發。

我以為自己很幸運能參與到低溫電子顯微鏡帶來的所謂解析度革命中。但現在,感覺蛋白質預測的機器學習正在帶來第二次革命,這對我來說真是太神奇了,讓我想知道我們還會看到多少加速。

據我估計,我們現在的研究速度可能比 10 年前快 5 到 10 倍。看看機器學習如何改變我們在未來 10 年進行生物研究的方式將會很有趣。

當然,我們必須小心謹慎地管理這些工具,但我很高興能夠以 10 倍的速度找到我思考已久的問題的答案。

Q:除了實驗室之外,你的工作還有哪些下游應用?

Farnung:我們正在從基礎層面瞭解人體內的生物學工作原理,但我們始終堅信,瞭解基本的生物學機制可以幫助我們開發出針對各種疾病的有效治療方法。例如,事實證明分子機器對 DNA 染色質結構的破壞是許多癌症的主要驅動因素之一。一旦我們弄清楚了這些分子機器的結構,我們就能瞭解改變幾個原子來複制導致癌症的突變的效果,此時我們就可以開始設計針對蛋白質的藥物。

我們剛剛與 HMS 治療計劃合作啟動了一個專案,該專案正在研究染色質重塑劑,這是一種在前列腺癌中發生嚴重突變的蛋白質。我們最近獲得了這種蛋白質的結構,並正在進行虛擬篩選,以檢視哪些化合物可以與其結合。

我們希望能夠設計出一種抑制這種蛋白質的化合物,並有可能開發成一種可以減緩前列腺癌進展的成熟藥物。我們也在研究與自閉症等神經發育障礙有關的蛋白質。機器學習可以在這方面為我們提供幫助,因為我們用來預測蛋白質結構和蛋白質間相互作用的工具也可以預測小分子化合物如何與蛋白質結合。

Q:說到合作,跨研究領域和學科的工作對您的研究有何重要性?

Farnung:合作對我的研究來說非常重要。生物學領域已經變得非常複雜,有如此多不同的研究領域,以至於不可能瞭解一切。透過合作,我們可以讓具有不同專業知識的人聚在一起研究重要的生物學問題,例如分子機器如何訪問人類基因組。

我們與哈佛醫學院的其他研究人員在多個不同層面展開合作。有時,我們會利用結構專業知識來支援其他實驗室的工作。有時,我們已經解決了某種蛋白質的結構,但我們需要合作來了解該蛋白質在更廣泛的細胞環境中的作用。我們還與使用其他分子生物學方法的實驗室合作。合作對於推動進步和更好地理解生物學至關重要。

相關內容:https://hms.harvard.edu/news/how-machine-learning-propelling-structural-biology


相關文章