這是第一次,物理學家證明了機器學習可以利用相對較少的實驗測量結果來重建量子系統。這種方法可以讓科學家們大大減少探索微觀世界所需的時間——相比傳統的蠻力方法有指數級的速度提升。此前需要數千年才能完成的重建任務現在只需要幾個小時就可完成了。相關論文於 2 月 26 日發表在 Nature Physics 上,機器之心簡單編譯了該論文,感興趣的讀者參見文末。
「這項研究將會讓量子計算機和其他相關量子技術的應用受益,」研究者在論文中寫道。
「我們證明了機器智慧可以使用非常精巧的方式捕捉量子系統的本質,」論文共同作者,來自紐約 Flatiron Institute 量子物理計算中心的 Giuseppe Carleo 介紹道。「我們現在可以有效地擴充套件實驗的規模了。」
Carleo 是在蘇黎世聯邦理工學院(ETH Zurich)擔任講師時提出這項研究的,他表示該工作受到了 DeepMind 著名圍棋程式 AlphaGo 的啟發。後者曾在 2016 年擊敗了前世界冠軍李世石並轟動世界。「AlphaGo 非常強大,」Carleo 說道「這讓我們不得不思考它背後的技術能否被用於量子物理的研究中去。」
在微觀物理世界中,電子這樣的粒子可以以多個不同的能級存在,每個能級有特定的出現概率。每個電子都可以呈現自旋上或自旋下,類似於著名思想實驗「薛定諤的貓」中的死或生。在量子領域中,未經觀察的系統並不具有其中的任何一種狀態(量子態)。取而代之的是,該系統會被認為具備可能出現的任何一種狀態。
當被測量後,系統會坍縮為其中一個狀態——就像薛定諤的貓在你開啟黑箱之後會表現為活著或死去。這種量子機制的詭異特性意味著你無法通過單次實驗觀測探究整個系統的複雜性。實驗者通常只能通過一次次地測量的方法才能最終確定整個系統的狀態。
這種方法在包含幾個粒子的簡單系統很好用,但是「粒子多了事情就複雜了」Carleo 說。當粒子的數量增加時,複雜度突増。如果只考慮每一個電子只有自旋上或自旋下的量子態,一個有 5 個電子的系統將有 32 種可能的量子態。一個有 100 個電子的系統可以有超過 1 百萬*千億*千億的量子態數目。
粒子糾纏進一步使問題變得複雜。通過量子糾纏,獨立的粒子變成了糾纏的而且不能被當成純粹的分離的實體,即使當物理上它們分開的時候。這個糾纏改變了不同量子態的概率。
所以,傳統的辦法是無法處理複雜的量子系統的。
滑鐵盧大學的 Giacomo Torlai 以及加拿大 Perimeter Institute 的 Carleo 和他的同事通過開發機器學習技術繞過了這些限制。這些研究員把量子系統的實驗性測量輸入到了一個以人工神經網路為基礎的軟體工具中。這個軟體學習並嘗試去模擬這些系統的行為。一旦軟體模擬了足夠的資料,它就可以重建整個量子系統。
研究員用以不同的量子系統樣例為基礎的模擬實驗性資料集來測試。在這些測試中,這個軟體的表現遠遠超越傳統的方法。對於 8 個電子,每一個都是自旋向上或者自旋向下,這個軟體只經過 100 次左右的測量就可以重建系統。相比之下,一個傳統的靠蠻力的方法需要大約 1 百萬次測量才能達到一樣程度的正確率。這項新的技術也可以處理更大的系統。研究員稱,這項技術可以幫助科學家驗證一臺量子計算機是正確配置的,以及讓任何量子軟體按照要求執行。
用緊湊的人工神經網路捕捉複雜量子系統的本質有其他更深遠的影響。量子物理計算中心(Center for Computational Quantum Physics)的主任 Andrew Millis 注意到以這項技術為中心,可以繼續開發分析互動量子系統的新方法,並可結合其他量子物理啟發的機器學習方法。
除了基礎研究應用以外,Carleo 說融合機器學習和量子物理的思想可以進一步改良人工智慧的通用應用。「我們可以將該方法擴充套件到其他應用場景裡」,他說,「某一天我們也許會有一個自動駕駛車是由量子機制所啟發的,誰知道呢。」
論文:Neural-network quantum state tomography
論文地址:https://www.nature.com/articles/s41567-018-0048-5
摘要:隨著研究的量子系統變得越來越複雜,其實驗實現將變得越加困難,因而需要開發普遍性的理論方法來驗證和完整地探索量子資源。量子態斷層攝影(QST)技術可從簡單的測量中重構完整的量子態,因而是獲取對系統的可靠分析的關鍵技術。然而,QST 的蠻力計算方法需要大量的計算資源,這使其只能應用於小規模系統。我們在本文中展示機器學習如何能處理超過 100 個量子位元的高度糾纏量子態的 QST,並獲得相當高的準確率。我們證明了機器學習方法可以用於重構量子多體系統的物理量,而這在傳統方法上是非常困難的,涉及海量的計算(例如糾纏熵計算),而我們僅需要簡單的實驗上可行的測量就可以做到。該方法可用於改善當前和未來的量子裝置,如量子計算機、冷原子量子模擬器等。
近期由於資料科學的快速發展,機器學習技術也被研究者用於解決物理學中的基本問題。去年就有論文發表了應用機器學習分析量子多體系統的研究成果,例如物相分類 [11-13]、模擬量子系統 [14] 等。
本文考慮的問題是重構一般性的多體系統的目標波函式 Ψ(x)≡ ⟨ x∣Ψ ⟩,其中 x 是某個參考測量基(例如,自旋 1/2 的σ_z)。我們將用人工神經網路表徵下式的多體量子態:
其中網路 p_λ(x) 和 ϕ_µ(x) 分別代表量子態的振幅和相位,Z_λ 是歸一化常數。本文中使用的神經網路架構基於受限玻爾茲曼機(RBM)。該架構有二值神經元構成的一個可見層(描述量子位元)和一個隱藏層(和可見層全連線)。RBM 能為多體量子態提供緊湊的變分表徵,可以保留 non-trivial 的關聯,例如高糾纏度或拓撲特徵 [19-24]。具體來說,取 p_λ 作為 RBM 網路(λ是引數),以及另一個獨立的 RBM 網路 p_µ(µ是引數)來對相位ϕ_µ=log p_µ(x) 建模。
本文使用的 QST 機器學習方法的執行步驟為:首先,RBM 在由一系列獨立的態密度|Ψ(x^|b|)|^2 測量構成的資料集上訓練(這些量子態由 n 體量子系統的基矢 {x^|b|} 構成)。這一階段將優化網路引數(λ,µ)以最大化資料集似然度,使得|Ψ_λ,µ(x^|b|)|^2≃|Ψ(x^|b|)|^2,即讓網路表徵的量子態逼近真實的量子態。一旦完成訓練,Ψ_λ,μ(x) 就可以逼近波函式的振幅和相位,從而重構目標量子態。重構的準確率可以通過增加 RBM 中的隱藏神經元數量 M 而系統地提升。本文的 QST 方法的關鍵之處在於它只需要使用原始資料(即來自單次測量的多個實驗快照),而不需要估計算符的期望值。這種設定意味著可以避免在對算符平均值的評估中必須獲得低水平內在高斯噪聲的過程。
圖 1:W 態的神經網路斷層攝影的基準測試。圖 a,當 N=20 量子位元時,W 態的每一個疊加態的概率分佈柱形圖。我們用在包含了 50(紅)、100(藍)和 20,000(綠)獨立樣本的資料集上訓練出來的 RBM 取樣畫出了 3 個柱狀圖。圖 b,是 W 態與訓練後 RBM(α=1)生成波函式的重疊率,作為訓練資料集中取樣數 N_s 的函式。圖 c、d 是在相位增強 W 態下 N=20 的每一個相位 θ (σ_k^z )(不同顏色)。我們展示了真實量子態(c)和一個 RBM(d)學習到的量子態的比較。這裡,RBM 斷層攝影技術允許通過不斷增加實驗樣本的數量系統地收斂到 W 態,在實數和複數波函式係數的案例中都能成功實現。
原文連結:https://phys.org/news/2018-02-artificial-intelligence-techniques-reconstruct-mysteries.html