前言: 就在昨天,人類歷史上第一張黑洞影象被“拍”出來了。

請配戴眼鏡檢視高清大圖
儘管黑洞的第一張真身照是一張模糊、不規則的圓環,但這張照片的背後凝結了目前最先進的探測技術,整個過程歷時十餘年,動用了來自非洲、亞洲、歐洲、北美洲和南美洲的200多名研究人員,八個探測望遠鏡不分晝夜觀測,最終的這張影象也有可能獲得諾貝爾獎。
這一切成就,都離不開視界望遠鏡和背後的計算。
人類“拍”到的第一張黑洞照片,並不是像我們拿手機拍照那樣,點下螢幕就好,而是需要分佈在全球各地的許多天文望遠鏡在同一時間“按下快門”,記錄無線電資料。

然後,再依靠機器學習演算法,把資料拼到一起,重建出影象。
圖片的形成過程:
其實拍攝這些圖片來自智利、夏威夷、南極洲、亞利桑那、西班牙、墨西哥六個地方的一共八臺天文望遠鏡。天文望遠鏡獲取的資料量非常大,然而這些資料裡面不僅僅包含黑洞,還包含天空中的各種複雜、凌亂的資料,科學家們要靠這些資料,拼出一張完整的黑洞寫真。
2017年4月5日,由位於南極、智利、墨西哥、美國夏威夷、美國亞利桑那州、西班牙的8臺亞毫米射電望遠鏡同時對黑洞展開觀測,利用甚長基線干涉測量技術(VLBI)將這8臺望遠鏡構建成超級“虛擬”望遠鏡——視介面望遠鏡(EHT),EHT口徑13000公里,約等同於地球直徑。

處理照片:
其實,天文望遠鏡早就拍完了照片,而“洗照片”的過程長達兩年。為什麼“洗照片”時間如此之長?
因為這類觀測的資料處理並非只用一套現成的方法。多臺望遠鏡之間的鐘差、望遠鏡自身狀態隨時間的微小改變等問題都會影響觀測精度。另一方面,“拍照”物件黑洞本身也在不斷變化,科學家需要探索新方法對“相機”進行校準,建立模型,以提升合成影象的質量和精度。

本來,根據天文望遠鏡資料還原天體影象,用成像演算法即可。
然而面對PB級稀疏、嘈雜的資料,想靠人力從中找出影象太難了。於是,科學家們使用了機器學習方法。
影象處理經常被處理成反問題,什麼是反問題:
考慮正問題f=Au+n,n是觀測噪聲,反問題就是在有了觀測f的條件下怎麼獲得真實圖片u
如果A是一個恆同運算元,反問題就是去燥
如果A是一個模糊,反問題就是去模糊
如果A是一個CT,反問題就是CT恢復
在將演算法之前說一下這個問題意義,打個比方你要做核磁共振,你要綁在床上聽著快一個小時噪聲,那麼你就希望A這個演算法進行sample 次數變少,那麼如果我演算法更厲害,你mri時間會越少。
有人說,這個問題簡單

就好了,那麼如果A不可逆呢? 你說這個也簡單,最小二乘啊

,那麼你就是沒有考慮到n--觀測噪聲

考慮一個去模糊問題,如果有噪聲,直接求逆結果會是怎麼樣的呢?

噪聲在求逆的時候無數倍的被放大了,產生了棋盤一樣的artifact 那麼怎麼解決問題呢?加入正則項!

這裡的R的作用時 如果u不是“圖片”,那麼R值大一點 如果u像一張圖片,R的值小一點 數學家就花了很久來構造R,第一個成功的是total variation,定義為


那麼我們用到的這個演算法是什麼樣的呢: 對於simulate資料

用了total variation的效果是

為什麼呢,為了達到這個分辨尺度,根據測不準原理,他們需要整個地球半徑的天文望遠鏡。但是事實上我們造不出來這麼大的望遠鏡,只能用九個觀測站點的資料來做。這是一個高度不適定的反問題,那麼需要更好的正則項。 設計正則項他們用到的想法是學習
From Learning Models of Natural Image Patches to Whole Image Restoration
他們用高斯混合模型對圖片patch進行建模,學習出圖片patch的distribution作為上面問題的正則項。
ted talk裡面還將到他們用了多個資料集去學習,用日常圖片,宇宙照片,望遠鏡資料。。學習出來了很多個正則項,發現恢復出來的圖片都是這樣的圖片。
其實看到這裡,我們已經是很震驚了,原來霍金的黑洞論真實存在,我們人類還宇宙面前真的很渺小。但是隨著科技的不斷髮展,我們人類也會認識更加深入的宇宙。