用於星系的人臉識別:人工智慧為天文學帶來新工具

人工智慧快報發表於2018-05-12

【概要】名為“深度學習”的機器學習方法被廣泛應用於人臉識別以及其他影像和語音識別應用程式,該方法在幫助天文學家分析星系影像及瞭解它們如何形成和演變方面展示了潛力。

在一項新研究中,科研人員使用計算機模擬星系的形成來訓練深度學習演算法,該演算法隨後被證實在分析來自哈勃空間望遠鏡(Hubble Space Telescope)的星系影像方面表現異常出色。這項研究的成果已發表在《天文物理期刊》(Astrophysical Journal

科研人員利用來自模擬的輸出結果生成被模擬星系的模擬影像,就像使用哈勃空間望遠鏡對其進行觀測時看到的一樣。模擬影像被用於訓練深度學習系統,使其能夠識別之前在模擬中確定的星系演變的三個關鍵階段。科研人員隨後為該系統提供大量真實的哈勃影像用於分類。

結果表明,神經網路對模擬星系和真實星系的分類具有高度一致性。“我們並沒有指望它會如此成功。我對它的強大能力感到吃驚,”參與研究的喬爾·普里馬克(Joel Primack)說道他是加利福尼亞大學聖克魯斯分校(UC Santa Cruz)物理學榮譽教授兼聖克魯斯粒子物理研究所(Santa Cruz Institute for Particle PhysicsSCIPP)成員。“我們知道模擬存在侷限性,因而我們不想發表太過確定的主張,但我們不認為這只是好運氣的意外收穫。”

星系是複雜的現象,其外觀會在數十億年的演變過程中改變,而星系影像只能提供其在各個時間點的快照。天文學家可以更深入地觀察宇宙,從而“回到過去”檢視早期的星系(因為光在宇宙距離上傳播所需的時間),但跟蹤單個星系隨時間演變的過程卻只能通過模擬實現。將模擬的星系與觀測到的星系進行比較可以揭示真實星系及其可能歷史的重要細節。

1藍核

在這項新研究中,科研人員對富含氣體的星系的早期演變模擬中發現的以下現象尤其感興趣:當大量氣體流入星系的中心時,星系的中心會形成一個小而密集的恆星形成區域,稱為“藍核”。年輕、熾熱的恆星會發出“藍色”短波長光,因此藍色表示具有活躍恆星形成的星系,而較為衰老、溫度較低的恆星則會發出更多的“紅色”光。

計算機程式在模擬資料和觀測資料中都有以下發現:“藍核”階段只在質量屬於特定範圍的星系中發生。中心區域的行星形成隨後會平息,帶來緊湊的“紅核”階段。質量範圍的一致性是令人興奮的發現,因為它表明深度學習演算法正在自行確定真實星系中發生的重要物理過程的模式。

“這有可能是因為,在一定的大小範圍內,星系剛好具有讓這一物理過程發生的質量,”加利福尼亞大學聖克魯斯分校天文學和天體物理學榮譽教授戴維·庫(David Koo)說道。

科研人員使用了由普里馬克和國際協作者團隊開發的最先進的星系模擬(VELA模擬),這些協作者包括執行模擬的丹尼爾·塞韋裡諾(Daniel Ceverino,海德堡大學)和領導模擬的分析和解釋並據此發展出新物理概念的艾維沙·德克爾(Avishai Dekel,希伯來大學)。但是,所有此類模擬在捕獲星系形成的複雜物理特性方面均能力有限。

需要特別指出的是,本研究中使用的模擬不包括來自活躍星系核(galactic nuclei)的反饋(中心超大質量黑洞吸收氣體時,通過輻射注入能量)。許多天文學家認為這一過程是調節星系中恆星形成的重要因素。儘管如此,對遙遠、年輕星系的觀測似乎表明存在相關證據,可證實模擬中看到的導致藍核階段的現象。

2CANDELS

對於觀測資料,該團隊使用了通過CANDELS專案(宇宙近紅外超深空組合河外星系遺產巡天,Cosmic Assembly Near-infrared Deep Extragalactic Legacy Survey)獲得的星系影像。該專案是哈勃空間望遠鏡有史以來規模最大的專案。第一作者馬克·韋爾塔斯-孔帕尼(Marc Huertas-Company)是巴黎天文臺(Paris Observatory)和巴黎第七大學(Paris Diderot University)的天文學家,他已經完成了使用公開可用的CANDELS資料將深度學習方法應用於星系分類方面的開創性工作。

CANDELS合作研究員庫邀請韋爾塔斯-孔帕尼訪問加利福尼亞大學聖克魯斯分校來繼續這項工作。谷歌通過向庫和普里馬克提供研究基金捐贈,為他們在天文學方面的深度學習工作提供支援,這讓韋爾塔斯-孔帕尼得以在聖克魯斯度過兩個夏天,並計劃在2018年的夏天再次來訪。

“這個專案只是我們幾個想法中的一個,”庫說道。“我們想要挑選一個理論學家可以基於模擬明確定義的過程,並且這個過程應該與星系的外觀有一定關係。然後,我們會讓深層學習演算法在觀測中找到這一過程。我們剛剛開始探索這種新的研究方法。這是將理論和觀測融合的新方法。”

多年來,普里馬克一直與加利福尼亞大學聖克魯斯分校的庫和其他天文學家密切合作,將其團隊對星系形成和演變的模擬與CANDELS的觀測結果進行比較。“VELA模擬在幫助我們理解CANDELS的觀測結果方面取得了很多成功,”普里馬克說道,“儘管沒有人擁有完美的模擬,但隨著我們繼續這項工作,我們將不斷開發出更好的模擬。”

庫表示,深度學習演算法具有揭示觀測資料中人類無法看到的方面的潛力。缺點在於該演算法就像一個“黑匣子”,因而很難知道計算機使用資料的哪些特徵進行分類。但網路詢問技術可以確定影像中的哪些畫素對分類貢獻最大,科研人員已在其網路中對其中一種方法進行了測試。

“深度學習技術會尋找模式,而計算機可以發現因複雜程度太高而導致人類無法發現的模式,”庫說道。“我們想要對這種方法進行更多測試,但在目前的概念驗證研究中,計算機似乎成功地在資料中發現了模擬中確定的星系演變的不同階段。”

他表示,在未來,由於大型巡天專案和新望遠鏡(例如大型綜合巡天望遠鏡[Large Synoptic Survey Telescope]、詹姆斯·韋伯空間望遠鏡[James Webb Space Telescope]和廣域紅外巡天望遠鏡[Wide-Field Infrared Survey Telescope])的存在,天文學家將擁有更多可供分析的觀測資料。深度學習和其他機器學習方法可成為理解這些海量資料集的強大工具。

“這是在天文學中使用高階人工智慧的激動人心的階段的開端,”庫說道。

相關文章