科學家發出警告:AI可在6小時內提出40000種潛在新化學武器
但這項研究是個例外。
這是一個由瑞士政府設立的“融合”系列會議,以確定可能對《禁止化學武器公約》和《禁止生物武器公約》產生影響的技術發展。會議每兩年舉行一次,彙集了一批國際科學和裁軍專家小組,探討化學和生物領域的最新技術現狀及其發展軌跡,思考潛在的安全影響,並考慮如何最有效地在國際上處理這些影響。
為了準備這次演講,collaboration 公司的一些研究人員進行了一項他們稱之為“思考實驗”的活動,通過計算證明了製造生化武器的概念。
在這個瑞士會議上,Collaborations Pharmaceuticals 公司決定探索如何使用 AI 來設計有毒分子。該公司之前設計了一種名為 MegaSyn 的藥物分子生成模型,藉助機器學習模型預測生物活性,尋找人類疾病靶點的新治療抑制劑。這種生成模型通常會懲罰預測的毒性並獎勵預測的目標活動。
在新的實驗中,他們進行了調整,讓模型同時獎勵毒性和生物活性,並使用來自公共資料庫的分子對模型進行訓練。
他們的方法和結果簡單得令人不安:通過對從公開資料庫中提取的一組類藥分子(定義為易於合成並容易被身體吸收的物質)的化學結構以及這些分子的已知毒性進行訓練,修改後的軟體不到六個小時就能發現四萬個潛在的致命分子。這些分子符合研究人員預定義的引數,可能用作化學武器。
研究團隊以前從未有過這種想法,他們也模糊地意識到與病原體或有毒化學品工作的安全問題。Urbina 的工作植根於為治療和毒性靶點建立 ML 模型,並非是製造病毒,而是以更好地協助藥物發現新分子的設計,利用 ML 模型對新生產藥物的毒性進行預測。
這就像是,有一種奇妙的藥物可以神奇的降低血壓,但它的副作用卻是擊穿心臟通道,那麼,這種藥觸碰了禁區,是不可能上市的,因為這太危險了。
幾十年來,團隊一直在藉助計算機和 AI 來改善人類健康。換句話說,無論試圖開發哪種藥物,首先得需要確保它們不會有毒。
最近,該公司釋出了很多用於不同領域毒性預測的計算 ML 模型,並且 Urbina 在會議演講時,選擇翻轉開關,真正的走向毒性,探索如何使用 AI 來設計有毒分子。
這是團隊前所未有的一次思想練習,最終演變成了製造生化武器的計算概念證明。
Urbina 在對一些細節的描述上有點模糊不清,刻意的隱瞞了某些細節,以防止被加以利用。
簡單來說,整個實驗的大體工作流程就是,藉助研發歷史中已有的分子資料集作為預測標籤,因為這些分子已經經過測試是否含有毒性了。
需要注意的是,團隊重點關注的是 VX。
顯然,這是人們想要避免的。因此,從歷史上看,已經對不同型別的分子進行了實驗,以檢視它們是否抑制乙醯膽鹼酯酶。於是,Urbina 建立了這些分子結構及其毒性的大型資料集。
然後,團隊便可以利用這些資料集來建立一個 ML 模型,該模型基本上可以分辨分子結構的哪些部分對毒性很重要,哪些部分對其不重要。然後,便可以給該 ML 模型提供新的分子,可能是先前從未測試過的新藥物。隨後,它的判斷結果會告訴我們哪些藥物被預測為有毒,或者預測為無毒。
正是上述方法,有效地提高了研究人員對藥物的篩選速度,即他們可以非常迅速的篩選出大量的分子,並剔除那些被預測有毒的分子。
然而,在團隊的這項研究中,正好顛倒了這一點。顯然,團隊試圖採用該模型達到的目的是預測毒性。
此外,另一個關鍵的部分是這些新的生成模型。團隊可以通過給生成模型輸入一些完全不同的結構,它可以學習如何將分子放在一起。然後,從某種意義上說,便可以要求它產生新的分子。此時,生成模型可以在整個化學空間中產生新的分子,但也只是一些隨機分子,沒有實質性的意義。但是研究人員可以做的一件事是,告訴生成模型所期望的走向。
當然,通過設計一個評分函式就可以實現這點,如果它生成的分子是研究人員所期望的,就給它打一個高分。以生成毒劑為例,就是要給有毒分子打高分。
實驗結果可以看到模型開始生成的這些分子,其中許多看起來像 VX,也像其他的一些化學劑。
但一個尤其注意的問題是,很多生成化合物的毒性預測結果比 VX 的毒性更大。更加令人震驚的是,VX 基本上是已知的最有效的化合物之一,也就意味著只需要非常、非常、非常少的量就能致死。
雖然這些預測結果在現實生活中尚未驗證,研究人員也表示他們也不想自己去驗證,但預測模型通常效能相當不錯。因此,即使存在很多假陽性反應,其中應該也會有毒性更強的分子。
其次,研究團隊其實觀察了這些新生成分子的許多結構。不難發現,其中很多看起來確實像 VX 和其他戰劑,甚至在一些模型中生成的是真正的化學毒劑。並且,這些是在模型從未見過這些化學毒劑的情況下而生成的。毋庸置疑,模型肯定能夠生成一些有毒的分子,因為其中一些分子以前就已經被製造出來了。
那麼,令人擔心的是,它到底有多容易實現呢?
研究人員表示,在開發過程中所使用的很多東西都是免費的。你可以從任何地方下載毒性資料集。如果有一個人知道如何用 Python 程式設計,並且具備一些 ML 能力,那麼可能利用一個短暫的週末,就可以構建出類似於這種由有毒資料集驅動的生成模型。
因此,這就是研究人員真正考慮將這篇論文發表出來的原因:對於這種型別的濫用來說,它的門檻實在是太低了。
Urbina 在論文中表示:“我們仍然跨越了一個灰色的道德界限,證明有可能設計出虛擬的潛在有毒分子,而不需要太多的努力、時間或計算資源。雖然我們可以輕易地刪除我們創造的成千上萬的分子,但我們不能刪除如何重新創造它們的知識。”
Urbina 表示,這是一個非常不尋常的話題,他們想把這些真正的資訊拿出來,去真正的談論它。與此同時,不希望將其落入非法者之手。
但他明確表示,作為科學家,應該注意釋出的內容必須是負責任地完成的。
除此之外,Urbina 表示,目前所做的確實很容易被複制。因為其中很多東西都是開源的——科學的共享,資料的共享,模型的共享。
Urbina 殷切希望更多的研究人員承認並意識到潛在的濫用。
當你開始在化學領域工作時,你確實會被告知化學濫用的危害,你有責任確保你儘可能地避免這種情況。而在 ML 中,與之相反,沒有任何關於濫用該技術的指導。
“我們只是希望更多的研究人員承認並意識到潛在的濫用” ,Urbina 說道。
考慮到模型的效能越來越好,所以將這種意識公開是非常有必要的,可以真正地幫助人們去注意這個問題:至少在更廣泛的圈子裡被討論過,至少可以成為研究人員所關注的點。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70013629/viewspace-2885014/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Google 發出了 40000 次國家支援駭客攻擊警告Go
- AI搞科研?西湖大學釋出「AI科學家」Nova,效果比SOTA競品提升2.5倍AI
- 科學家提出超越傳統機器學習的量子演算法機器學習演算法
- 「顛覆性」科學沒有衰落,谷歌 AI 推動科學發展的 9 種方式谷歌AI
- 我在2020年作為資料科學家學習的8種新工具 - kdnuggets資料科學
- AI for Science,開啟智慧科學時代!AI
- 科學家最新發現:新磁性元素
- Web開發與資料科學家:誰在統治Python世界?Web資料科學Python
- 新「AI科學家」?MIT整合多智慧體,實現材料科學研究自動化AIMIT智慧體
- 《科學》:腦子裡“長”出電極了!科學家開發出能在腦內生成電極的新技術,或有助於治療神經系統疾病
- 科學區塊鏈:革命性機遇和潛在問題區塊鏈
- AI將是數學家的得力助手,陶哲軒談AI在證明過程中的潛力AI
- 法國科學家將AI演算法用於植物研究,植物學家開始慌了AI演算法
- 【資料科學家】如何成為一名資料科學家?資料科學
- 實在智慧RPA教你如何科學反內卷?
- 睡眠不足,連疫苗都“消極怠工”!科學家發現,接種疫苗前後睡眠時間不足6小時,疫苗抗體反應降低,抗體滴度與接種後2個月相似
- 資料科學家最常用的十種演算法資料科學演算法
- 哪名科學家被稱為“(現代)AI之父”或“深度學習之父”?AI深度學習
- 「資料科學家」必備的10種機器學習演算法資料科學機器學習演算法
- 你信得過AI嗎?聽聽IBM科學家怎麼看AIIBM
- Airbnb資料科學家:歷時6個月,我終於找到了心儀的工作AI資料科學
- 女科學家流失之殤
- 跟著 AI 一個小時學會 PythonAIPython
- 科學計算器學生時代小作品原始碼(C++版)原始碼C++
- 兩位資料科學家跟你聊聊AI那點事兒(附學習資料)資料科學AI
- 走進AI科學之美AI
- iScience:科學家發現炎症的“致命要害” ,有望開發出靶向性抗炎症療法
- 2018年科學家們都在搜尋什麼:AI還是癌症?AI
- 開啟AI黑匣子,「三段式」AI用於化學研究,最佳化分子同時產生新化學知識,登NatureAI
- 美國西北大學:研究發現美國孩子在繪畫中更多地描繪女性科學家
- 歷史上54位偉大科學家、數學家的專屬LOGO,你能認出幾個?Go
- ML如何推動結構生物學的發展?哈佛科學家用AI在最小尺度上研究人類發育AI
- 倫敦大學學院:睡眠會在最初的幾個小時內重置大腦連線
- 機器學習將在遊戲開發中的6種應用機器學習遊戲開發
- 熬夜變傻有科學依據,人類睡覺時會被“洗腦”,科學家首次拍下全程
- 電腦科學家釋出不會被黑的加密程式碼加密
- 歐美科學家釋出三款神經形態晶片晶片
- 召喚100多位學者打分,史丹佛新研究:「AI科學家」創新確實強AI