編輯 | 蘿蔔皮
「如果這可以重現的話,這就是我們所知的世界末日!功能建模的新時代已經開始。」歐洲分子生物學實驗室(EMBL)的科學家 Jan Kosinski 發推文表示。他在 AlphaFold 3 釋出後,立刻用它做了一系列簡單的測試,並把相關結果發在了 X 上。
「我取出了一個結構未知的轉錄因子,將其摺疊起來,將其識別序列嵌入更長的 DNA 中。AlphaFold 3 準確定位了轉錄因子。」Kosinski 解釋道。
影片連結:https://mp.weixin.qq.com/s/-T-c603cFN5BCmPk5M1JFg
他使用的轉錄因子:https://jaspar2020.genereg.net/matrix/MA0027.2/
使用的 DNA 序列:CAGGATCCTAATTATGGATCCTGTGTATCTTCAGT
他用的模型是:https://oc.embl.de/index.php/s/SsDKcS06P1xewAV
他說:「一旦 AlphaFold 3 的開源副本可用並且執行良好,我們也許能夠透過計算來預測所有轉錄因子的序列特異性。我認為那會很大,對吧?」
同時,嚴謹的 Kosinski 呼籲網友:「但如果有人檢查我是否沒有混淆,是否與其他轉錄因子一致,以及分數是否可以用於區分特定和非特定序列,我會很高興。」
Kosinski 還做了其他實驗。
影片連結:https://mp.weixin.qq.com/s/-T-c603cFN5BCmPk5M1JFg
「還有一個,也許沒有訓練偏差。應該特異性結合啟動子區域 ATTTTAGTCGCGCCTAAAAT 並且它再次出現!左為晶體結構,右為 AlphaFold 3 模型。啟動子為紅色。」他發文解釋道。
「我們還不知道是否如此,但如果這種序列特異性推廣到 CRISPR、鋅指結構、TALEN、限制性核酸酶——可以為 AlphaFold 3 所有者帶來多少收入?」他在推文裡調侃道。
第二天 Kosinski 又用限制性內切酶做了相關測試。
「它『不能』推廣到我手中的限制性核酸酶。識別序列為青色,切割位點為紅色。」他說,「但請注意:只有兩個示例和長 DNA,有人可以嘗試精確長度的序列並比較特定和非特定序列。」
「AlphaFold 3 無法正確預測限制性核酸酶 BamHI 的序列,儘管有 5 種結構可用,其中 4 種帶有 DNA。」他發推文說,「左邊是模型,右邊是晶體結構。鑑於其中一些結構可能包含在訓練和模板資料庫中,這表明訓練集中結構的存在並不能保證準確的預測。」
BamHI:https://uniprot.org/uniprotkb/P23940/entry#struct
洛桑聯邦理工學院(EPFL)的 Martin Pacesa 評論道:「可能是因為來自 MSA 的噪音!如果有太多 RE 同源物識別非常不同的目標序列,它可能會迷失在共同進化噪聲中。」
Kosinski 對 Pacesa 的觀點表示肯定:「是的,你可能是對的,REases 在它們的 MSA 中通常很少有相似的序列……或者當我在碩士期間研究它們時,它們就這樣做了。」
「它『識別』了什麼?」網友 Evgenii 問道。
「CAAGCTTG,它只是繫結了另一個迴文序列(像迴文序列這樣的 REases,原始序列 GGATCC 也是一個迴文序列)。」Kosinski 回覆道,「我嘗試對序列進行洗牌,但它仍然找到並繫結了另一個不完美的迴文序列(GCACGC)。我想我們需要一個更好的『背景誘餌序列』」
「有趣的!AAGCTT 那是 HindIII。根據您迄今為止的經驗,AlphaFold 3 如何處理較長的 dsDNA 片段?」維也納大學 Max Perutz 實驗室的 Pim Huis in 't Veld 發文評論說。
「之前那這個起作用的原因是它搜尋任何迴文序列,因為這是相似的二聚體所結合的嗎?有時它是否會尋找與訓練模型中類似的一維 DNA 模式(例如迴文、不匹配)? 」法國 CNRS Orléans 的 Marcin J. Suskiewicz 發文評論道。
「也許會有一個合理的解釋!」Kosinski 說道。
帕拉茨基大學(Univerzita Palackého)的理論物理化學家、化學和生物資訊學家 Karel Krápník Berka 則使用 AlphaFold 3 對膜上的脂質分子進行了研究。
「AlphaFold 3 還可用於預測膜位置。」他發文表示,「這是 CYP2E1 與油酸 (OLA) 的示例。這是與我 2013 年的 MD 膜模型和來自奈米圓盤的冷凍電鏡進行對比。」
Kosinski 做了相關測試並跟帖道:「使用這種技巧在類脂膜雙層內建模的候選新型大麻素受體,新增油酸(OLA)作為配體。」
影片連結:https://mp.weixin.qq.com/s/-T-c603cFN5BCmPk5M1JFg
相關內容:https://twitter.com/jankosinski/status/1788532231939453015