講堂丨人工智慧在天體物理中的應用
編者按:從人類誕生的那一刻起,人們對宇宙奧秘的求索就從未停止。今天,天文學已經進入了一個具有多波段、多信使的海量觀測資料的黃金時期,人工智慧技術將對天文領域產生深遠影響。近日,美國亞利桑那大學天體物理學博士、清華大學天文系蔡崢教授受邀來到微軟亞洲研究院,與我們分享了天體物理研究與人工智慧方法相結合的前沿探索。
嘉賓介紹
蔡崢,2015 年獲得美國亞利桑那大學天體物理學博士學位,2015 年—2019 年在美國加州大學聖克魯茲分校從事博士後研究,獲美國太空總署(NASA)“哈勃學者”(Hubble Fellow)稱號。2019 年任清華大學天文系助理教授(tenure track),同年入選中組部第十五批青年千人計劃,共發表論文 30 餘篇,引用 1500 餘次,擔任《Nature》等雜誌審稿人。他發現宇宙早期大尺度結構以及發現宇宙早期最亮的星雲,被美國 CNN,英國 BBC 等主流媒體報導。蔡崢領導的多項研究入選哈勃太空望遠鏡、以及地面最大望遠鏡的觀測計劃。他也參與多個新望遠鏡與探測儀器研發,如位於智利的新的世界最大光譜巡天望遠鏡等。
當我們談論宇宙,我們在談論什麼?
經常有人問我做什麼,我說“天體物理”,他們就說:“那你給我算個命吧”,可能跟大家最有關的就是星座。但是我們宇宙研究究竟在做什麼呢?中國的一些哲學家在 2000 多年前就說了,“上下四方謂之宇,古往今來謂之宙。”所謂宇宙,就是空間和時間上的研究。
我們先從空間上看。離地球最近的恆星是太陽,如果到一光年尺度,就可以看到離太陽最近的恆星。到幾百、上千甚至到上萬光年,你可以看到銀河系的旋臂。到了 10 萬光年,你就可以看到銀河系的全貌和它周圍的星系。而到上百萬、上千萬光年,我們發現還有很多像銀河系一樣的星系。所有星系在宇宙中的三維排布是一個纖維網的大尺度結構。我們的血管還有蜘蛛網也是拓撲結構,是非常相似的。
圖1:人類對宇宙在空間上的認識
在圖 1 中,人們腦海中的星系大概是最左邊的樣子,但是,近二三十年,我們發現星系實際上處於巨大的暗物質當中,可見部分只佔整個暗物質暈非常小的比例,暗物質是可見物質的六倍多。但是你為什麼感覺不到呢?因為我們所有的感受都是因為電磁相互作用,但是暗物質和我們只有引力作用,除此之外可能還存在一點點弱相互作用,但這還只是理論假設。
大家可能聽說過清華大學在 2400 米的地下有一個錦屏山地下實驗室。為什麼在 2000 多米的地下可能探測到暗物質呢?因為在那裡所有可見物質,不管能量多高,都已經被擋住了。如果能觀測到那裡的粒子,那應該就是不和正常物質有電磁相互作用的暗物質。目前錦屏山還沒有發現任何痕跡,但暗物質是客觀存在的,已經有科學家透過星系的旋轉曲線等多種獨立的天文方法推測出來了。星系就是被暗物質凝聚在一起,整個暗物質暈又呈纖維網狀排布。這是空間上我們研究的一個尺度。
從時間上說,我們知道宇宙中有一次大爆炸,宇宙正在膨脹中。宇宙起源離現在大概 130 億年,爆炸後它一直在減速膨脹,但在距今 70-80 億年,它開始加速膨脹。這也是我們用很多方法實際觀測到的。為什麼會加速膨脹呢?因為宇宙中還有一種更神秘的東西叫暗能量,在宇宙膨脹到一定程度,物質密度已經極低的情況下,它能驅動宇宙的加速膨脹。在宇宙中,暗能量佔 70%,暗物質佔近 26%,可見物質只佔 4% 左右。
圖2:人類對宇宙在時間上的認識
現在天文學進入了一個黃金時期。我們進入了多波段、多信使的時代,從最短的波,到最長的波,我們在全波段都有一些比較好的裝置;不光能看電磁波,還能看引力波。引力波也是最近發現的,兩黑洞併合時會產生一種波,這種波很弱,但是能讓整個度規或時空發生變化。引力波實驗是相對論和量子力學最完美的一個結合。
天文學與我們的生活也息息相關。我們手機用的鋰電池,它的材料就是大爆炸三分鐘以內的產物。我們戴的金戒指,是八個太陽質量以上的超大恆星爆炸才產生的東西。太陽爆炸最多形成鐵,而這些金是太陽系周圍的一些超大恆星爆炸了,金經過億萬年終於飄到地球上,然後被我們撈起來做成戒指。我們身體裡所有的碳和鐵都是超新星爆炸產生的,人的意識是怎麼來的我們還不知道,但是構成人體的材料都來自宇宙。當然,最後地球也會被太陽吞食,所有原料也都會進入星際空間,再形成一顆恆星,所以卡爾·薩根曾經說過,宇宙在哪兒呢?宇宙實際就在我們的身體裡。從這個意義上來說,我們每個人都是“來自星星的你”。
天文學也將進入一個大資料時代,在這個過程中,微軟還做了巨大的貢獻。在智利,有全球最大的光學望遠鏡——大型綜合巡天望遠鏡(Large Synoptic Survey Telescope, LSST),它能對太空進行不間斷地掃描,預計將發現 100 億個新星系,每年能產生 10 PB 資料。比爾·蓋茨也曾捐贈 1000 萬美元給該專案。
圖3:大型綜合巡天望遠鏡
天文學-人工智慧應用的最好領域
我覺得天文學是人工智慧大資料應用的最好領域。在現在的天文學研究裡,即使只是用了一點點和人工智慧相關的技術,就能對整個天體物理領域產生深遠影響。雖然人工智慧技術在天體物理領域的應用還處於起步階段,但人工智慧已經開始真正參與人類對自然界新規律的發現。今天我想給大家舉一些人工智慧在天體物理中應用的例子。
引力透鏡
大家去高檔餐廳肯定見過這樣的蠟燭,你能在酒杯底部看到這種光環,因為光線偏折了。這種透鏡的效應在天文學中的對應現象叫引力透鏡。愛因斯坦就曾預言,如果光透過質量巨大的一個東西,就能讓光彎曲並圍繞前方的星球形成一個圓環。所以愛因斯坦環的形狀就能告訴我們光透過了多大的暗物質暈。
圖4:由於光線偏折,蠟燭在酒杯底部產生的光環
愛因斯坦環的正向問題是比較簡單的——給定暗物質暈,光透過暗物質暈後產生怎樣的引力透鏡,這是比較容易計算的。但是逆問題,即給定愛因斯坦環,計算光透過了多大的暗物質暈、暗物質暈怎麼分佈,就比較複雜了。傳統的方法需要用 4000 個 CPU 的計算機算整整 6 周,才能完成一次分析。但在 2017 年,發表在《Nature》上的一個研究應用了卷積神經網路來解決這個問題。研究人員先正向計算出很多引力透鏡的資料,構建訓練集來訓練神經網路,然後給定一個引力透鏡的資訊,透過 CNN 就能逆向生成暗物質暈的分佈。我們可以看到,輸出結果與真實情況非常相似,而且最令人驚訝的是,它連暗物質暈的子結構都預測得非常準確。訓練好了之後,只需要個人電腦就能得出結果,這使得大樣本、從統計上面精細地對暗物質結構的探索首次成為可能。
圖5:應用卷積神經網路的輸出結果
星系際介質吸收
當光穿過宇宙網交匯處,即有星系的地方時,就會產生一個比較大的吸收。我們就透過這些吸收線去重構三維的空間。當在高訊雜比情況下觀察吸收是挺容易識別的,但在低訊雜比時就很難,很容易出現判斷不準確的情況。用了深度學習,對低訊雜比的識別效果能超過人的眼睛。比如圖6中的第一張圖,10 個專家裡有 9 個說沒有吸收,而真實是有吸收,電腦就能正確識別出來這點。因此,人工智慧幫助我們發現了新的吸收體,也重新整理了人類對中性氫含量的認識,從藍色的部分(利用人工智慧之前)更新到了紅色部分(利用人工智慧之後)。
圖6:深度學習在識別星系際介質吸收上的應用
大尺度結構
第三個例子,是人工智慧在大尺度結構上的應用。一組暗物質和暗能量的比例變化(比如暗物質佔 30%、暗能量佔 70%,或暗物質佔 20%、暗能量佔 80%)會影響宇宙學的資訊,但是要逆向推出兩者的比例是很難的。而計算機就可以模擬星系分佈,用深度學習將逆問題變成正向的問題——先透過比例引數變化產生很多三維的星系分佈來訓練網路,訓練好後,輸入一個三維分佈,CNN 就能預測暗物質和暗能量的比例。這種方法比傳統的數學方法要好,明顯提高了解決這種逆問題的精度。
圖7:宇宙學的神經網路可以用星系的三維分佈預測宇宙學引數
看到這些結果,我一直在思考。第一點是深度學習為什麼會比一些傳統的數學方法好?我覺得它可能是找到一些額外的資訊,比如說以前我們用兩點相關函式,但是深度學習相當於找到了三點相關函式甚至是四點相關函式,它比我們找到了更多的關係。
第二個問題是,既然人工智慧比傳統方法進步了那麼多,那麼擅長解決逆問題,那它能不能進一步告訴我們這些引數之間的規律或定律。比如剛剛所說的深度學習在高噪聲下識別出吸收線的問題,比人還厲害!其實,這樣的吸收體,是因為海森堡發現能量和時間存在 “不確定性原理”(uncertainty principle)。只要你承認量子力學有不確定性原理,時間和能量並不能同時測準,位置和動量也不可能同時測準,就必然產生這樣的吸收。還有引力透鏡實際上代表了愛因斯坦一個非常深刻的思想,就是質量告訴時空怎麼彎曲、時空告訴光線怎麼運動。愛因斯坦場方程可以寫成非常優美的一個公式。計算機在深度學習大量知識後,能不能也推出像這樣有深度的原理或公式呢?
如果這個對人工智慧來說太複雜了,那能不能試著讓人工智慧找出開普勒第三定律呢?這是大家高中都學過的,由開普勒根據第谷在 16 世紀精度有限的實測資料提出的,他發現行星公轉週期的平方和行星公轉軌道半長軸的三次方成正比。這是牛頓萬有引力定律的重要基礎,也是引力平方反比例的直接推論,而平方反比例是引力波靜質量為零,以光速傳播、甚至光子靜質量為零的重要基礎。我覺得計算機到現在仍然總結不出來這麼優美、深刻的公式,它算出來可能會很精確,有很多小數,因為它還發現不了數字背後深刻的規律。大自然就是這麼神奇,這也許是人工智慧未來的方向之一。
天文學進入大資料時代
我們將會迎來一個天文學的大資料時代,機器學習在天文學上的應用也會越來越多。剛剛提到了美國正在智利建設的大型綜合巡天望遠鏡 LSST,它每晚能產生近 1 千萬個變源,預計將發現 100 億個新星系,每年的資料量達到 10 PB 。它的資料能讓幾代的研究者去挖掘資料,發現新的宇宙規律。下一個十年,世界各國將開展大視場影像巡天,但是我們國家這方面準備還不夠。另外,LSST 也有一個缺點,它只拍照片,但沒有光譜。光譜所蘊含的資訊非常豐富,是天體的物理指紋,它能告訴我們太陽是由什麼組成的,還有太陽的動力學資訊等。缺光譜就無法認識天體的本質。
我們現在就在聯合民營資本和高校的力量,推動一個光譜巡天望遠鏡專案:南天寬視場光譜巡天望遠鏡(SSST),我覺得這是中國地基裝置趕超世界先進水平的一個機會。SSST 選址在世界上觀測條件最好的智利,擁有6.5米光譜巡天望遠鏡,視場達到 5 平方度,遠超其它望遠鏡,巡天速度會更快。建成之後,SSST將擁有世界級的光譜巡天能力,能專注解決一些關鍵的科學問題,如宇宙起源、系外行星、時域天文學(引力波電磁對應體)等問題,總的建設造價不超過 10 個億(不超過10年建設週期)。我們的 SSST將與 LSST 結合,提供真正三維的宇宙大資料。
圖8:正在規劃建設中的南天大視場光譜巡天望遠鏡(SSST),它和其他望遠鏡的協同觀測,將有望將我國的天文研究帶入新時代。
最後我來講一下天文在大家生活中的一些應用吧。比如 CCD(感光耦合元件),其實上世紀 70 年代 NASA 應用 CCD 最重要的原因之一,就在於為了天文觀測更高的訊雜比,因為當時僅靠膠片看不清楚宇宙圖片,所以做出了一個可以持續曝光的元件。經過 40 年的發展,我們手機裡的 CCD 已經完全改變了大家的生活。沒有 CCD 大概也不會有人工智慧,因為如果都是膠片,就不可能把圖片數字化。WIFI 也是為了發現天文的“霍金輻射”發展出來的,GPS 中也應用了廣義相對論的原理。
如果你問我天文有什麼用,我還是堅持會說,天文實際上沒用,它主要是為了滿足人類的好奇心。但我覺得天文學最“有用”的一點就在於,它能將我們眼前的未知變成身後的已知。將未知變成已知,這才是人類文明進步中最重要的一個能力和動力。我希望有朝一日,我們中國也能加入這個俱樂部,真正能夠有更多引領人類文明、知識燈塔的科學工程,這也是對我們大學 2050 年前建立世界學術殿堂的必然要求。
圖9:蔡崢教授(中)與本次活動主持秦濤博士(右二)合影
QA時間
提問一:剛才說透過愛因斯坦環可以預測暗物質暈的分佈,這個分佈是唯一的嗎?
答:這個問題特別好,我相信是不唯一的,比如多幾個子結構可能能產生差不多的愛因斯坦環,或者取決於背景和前景的星系。但是從現在訓練出來的結果來看,雖然真實分佈可能有一些微小的差別,但是它能把主要的結構預測得非常好。這點其實非常神奇。
提問二:對於某一個宇宙規律,假如我知道函式和引數形式,當有很好的資料的時候,擬合引數的能力會很強。但大部分時候,宇宙的規律,引數的形式,這些我們並不知道。那麼怎樣讓我們有些先驗,去知道這些規律和引數形式?是不是能把一些公理、定理表示到計算機系統裡,把它當作一種先驗,再去推導其他規律。
答:這個問題也非常好,首先我們還不知道怎麼解決。我跟微軟的沈向洋博士(微軟全球執行副總裁)和 UCSD 的蘇浩教授都聊過,他們也覺得可能得建立一個公式集,讓計算機先了解人類已有公式的形式,讓它知道怎麼嘗試。(提問者:也可以讓計算機跟我們建議一些候選的公式形式,最後還需要人去證實。)對,一個是需要人去證實,第二,實際上每一條公理背後都有更深刻的哲學層面的原理,比如說光速不變原理,這些可能只能靠人來歸納,但是能找到公式可能已經會是下一步很厲害的一個進展了。
提問三:我們其實已經知道愛因斯坦環是怎麼形成的了,那我們做這個研究的目的,是想要知道那個地方有什麼、是什麼樣的,還是說我想發現一些新的東西?
答:這個問題也很深刻,就像你說的那樣,這個研究確實不會給我們增加新的知識,但它鐵證如山地告訴我們的是那塊暗物質暈長什麼樣,它讓我們更一步確信了暗物質的存在,並且暗物質比可見物質多得多。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2658704/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 小講堂:線上編輯在Mobox文件管理軟體中的意義
- 人工智慧(AI)在遊戲中的應用(下)人工智慧AI遊戲
- 人工智慧在智慧製造中的應用人工智慧
- 人工智慧在IT運維中的研究和應用人工智慧運維
- 人工智慧在新零售中的應用人工智慧
- 人工智慧在採購中的應用有哪些?人工智慧
- 人工智慧在資料壓縮中的應用人工智慧
- 淺談人工智慧在流媒體領域的應用人工智慧
- 資訊科技在CRM軟體中的應用
- 人工智慧技術在24個行業中的應用人工智慧行業
- 講堂丨周明:預訓練模型在多語言、多模態任務的進展模型
- 人工智慧在客戶關係管理軟體銷售和服務模組中的應用人工智慧
- 人工智慧在媒體和娛樂中的應用——你的工作會被取代嗎?人工智慧
- 六西格瑪在IT職場中的應用體現
- TiDB Online DDL 在 TiCDC 中的應用丨TiDB 工具分享TiDB
- 5G+人工智慧技術在垃圾分類中的應用人工智慧
- 專案管理軟體在企業中的應用專案管理
- 【新炬網路名師大講堂】Data Guard–物理主備庫切換
- 資料標註在AI教育領域中的具體應用丨曼孚科技AI
- 資料標註在智慧金融領域中的具體應用丨曼孚科技
- 小講堂:Mobox文件管理軟體中的檔案外鏈是什麼?
- 軟體專案管理在小軟體專案中的應用專案管理
- 3分鐘講書丨《iOS應用逆向與安全》-講書人 劉培慶iOS
- Refs 在React中的應用React
- MQTT 在 Elixir 中的應用MQQT
- HMM在NLP中的應用HMM
- SSD在SQLServer中的應用SQLServer
- HugePage在mysql中的應用MySql
- HugePage在oracle中的應用Oracle
- sar 在unix中的應用
- 六西格瑪在日常生活中的應用體現
- FMEA原理在HACCP體系中的應用(轉載)
- 【天行健課堂】能力分析的價值體現在哪?
- 運維大師講堂,7天從入門到進階運維
- 資料標註在自動駕駛領域中的具體應用丨曼孚科技自動駕駛
- 資料標註在智慧農業領域中的具體應用丨曼孚科技
- 資料標註在智慧安防領域中的具體應用丨曼孚科技
- 資料標註在智慧醫療領域中的具體應用丨曼孚科技