敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

機器之心發表於2021-01-31

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

零和 1;零零碎碎;陰與陽。最重要的開關,有的開,有的關。我們都已經習慣了使用現代計算機。每年,像英特爾、AMD、ARM 以及英偉達這樣的行業巨頭都會發布各自的下一代頂級矽晶片,彼此之間競爭角逐,不斷挑戰傳統計算機的極限。

如果我們嚴格評估這些多核 CPU、GPU 和龐大的雲端計算叢集,則很快就會意識到速度更快的處理器並不一定增加計算能力。說實話,在過去幾十年裡,計算速度以及能夠處理的資料都呈指數級增長。我們可以在網路上儲存和分析數兆位元組的資料,訓練 GPT-3 這樣的深度學習模型,並且計算智慧可以在圍棋和國際象棋等複雜遊戲中擊敗冠軍和大師級對手。

但是,所有這些技術的進步是否已經從根本上擴大了我們能夠利用計算機做的事情,是否超出了最初利用計算機的範疇?或者簡單來說,我們是否已經改變了傳統的計算機模式

現代計算機是根據馮 · 諾依曼結構(Ogban 等人, 2007)的原理執行。馮 · 諾依曼結構利用處理單元的輸入和輸出,並且該處理單元根據一組指令對輸入執行邏輯函式,如下圖所示:

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

雖然馮 · 諾依曼結構非常適合解決實際問題,但它並不能描述計算過程本身。為此,我們需要一臺圖靈機(De Mol, 2018)。圖靈機提供了當今計算機的一個抽象模型,並按照一套規則操作磁帶(tape)上的符號,然後磁帶根據機器的當前狀態前進或停止。

眾所周知,傳統計算機能夠執行的所有計算也都可以在圖靈機器上完成。聰明的讀者會將這個結果與邱奇 - 圖靈論題(Church-Turing thesis)聯絡起來,該論題表明「任何真實世界的計算都可以使用λ-calculus 來完成,這相當於使用一般遞迴函式」(Rabin, 2012)。然而,在實踐中,對於任何實際的、合理大小的問題來說,圖靈機的速度都太慢了。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

圖靈機示意圖。圖源:https://web.mit.edu/manoli/turing/www/turing.html

正如邱奇 - 圖靈論題所證明的那樣,圖靈機的計算能力是我們還沒有突破的天花板。正如文章後面討論的那樣,儘管基於圖靈機的計算裝置開啟了計算的可能性,但也存在缺點。

然而,這也不是說一切都完了。馬丁路德金曾經說過:「我們必須接受有限的失望,但萬萬不可失去無窮的希望」。打破這種天花板不僅僅是將大量電晶體塞入晶片中,還需要從根本上重新思考計算機,這要從最基本的單元 - 位元開始

進入量子領域

在過去 120 年裡,我們或許取得了物理學歷史上最偉大的進步。愛因斯坦的狹義和廣義相對論改變了我們對時間、空間和引力的看法,而狄拉克(英國)、泡利(奧地利)、費曼(美國)、薛定諤(奧地利)以及海森堡(德國)和普朗克(德國)的量子力學公式則徹底改變了我們對電子、質子和中子的無限小世界的理解。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

1927 年左右的索爾維國際會議(Solvay International Conference)被認為是近代物理學的轉折點。圖源:https://rarehistoricalphotos.com/solvay-conference-probably-intelligent-picture-ever-taken-1927/

量子力學是這些物理學相關進步中的最後一個,它與尋找強大的新計算模型有著最直接的關聯。二十世紀 80 年代早期,費曼設想量子計算機可以提供一種方法來解決當代(或經典)計算機難以解決的指數級問題(費曼, 1986)。這是可能的,因為量子計算機要求我們採用完全不同的位元概念。在我們深入研究這種計算模式之前,必須定義量子計算機的含義。

經典計算機擁有可以在任何給定時刻以 0 或 1 狀態存在的位元,而量子計算機中的量子位元(或簡稱量子位, qubit )能夠以額外的狀態存在。量子位元既能夠以離散狀態(0 或 1)存在,也可以兩種狀態疊加存在。這是量子位元的一個固有屬性,為其自身的定域性(locality)賦予了一個機率分佈。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

經典位元和量子位元。圖源:https://www.cloudtp.com/doppler/what-is-quantum-computing/

本文的目的不是解釋量子計算機引擎蓋下發生的量子離心率(eccentricities)。然而,值得回顧的是量子物理的兩個基礎概念:波粒二象性(wave-particle duality)和糾纏(entanglement),它們是量子計算機的基石。

量子力學

量子位元的狀態可以用列向量(column vector)表示。不同狀態由不同的列向量表示,其中每個列向量與其餘向量正交。量子比對應的狀態由其他可能的狀態線性組合而成,這些可能的狀態利用複數加權。也就是說,在任何給定的時刻,量子位元處於這些基態的疊加中,或處在一個機率波(probability wave)中。在所有這些可能的位置中測量一個精確位置的行為會使這個機率波或波函式(wavefunction)崩潰,從而揭示單一狀態。

這就是波粒二象性(wave-particle duality)的關鍵:一個粒子既表現出類波行為又表現出類粒子行為。除非我們明確地觀察到一個粒子,否則永遠無法說它處於什麼狀態;哥本哈根詮釋(Copenhagen Interpretation)正式提出了一個關於粒子在測量前位置的問題(Faye, 2002)。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

波粒二象性。圖源:https://www.4piacademy.com/wave-particle-duality/

第二個需要理解的重要原理是量子糾纏(quantum entanglement)。以一個粒子系統為例,每個粒子都有自己的波函式。多粒子系統被定義為狀態空間的張量積。這個由 k 個粒子組成的張量積(每個粒子用 n 維列向量表示)被稱為具有 n^k 維。這種狀態空間的表示被稱為狀態集合。

現在,為便於說明,讓我們把 k 個粒子的初始系統提煉為兩個粒子,每個粒子處於兩種狀態的疊加,a 和 b(為了簡單起見,它們可以是圓形或正方形)。如果關於一個粒子狀態的知識不能揭示另一個粒子狀態的資訊,我們就說這兩個粒子是相互獨立的

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

獨立粒子。圖源:https://www.quantamagazine.org/entanglement-made-simple-20160428/

然而,如果知道一個粒子的狀態給了我們關於另一個粒子狀態的即時資訊,則可以說這兩個粒子是糾纏在一起的。不管一對糾纏粒子之間的距離如何,測量一個粒子的狀態會在瞬間揭示另一個粒子的資訊。這意味著,如果你產生了兩個糾纏粒子,把它們帶到太陽系的對立兩端,一個粒子波函式的坍縮將立即導致另一個粒子波函式的坍縮。兩個粒子之間的交流速度比光速還快,愛因斯坦將這種特質總結為「幽靈般的超距作用(spooky action at a distance)

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

粒子糾纏。圖源:https://www.quantamagazine.org/entanglement-made-simple-20160428/

完全不同的計算模型

就像經典計算機中一個電晶體代表 1 位元資訊一樣,矽或磷等半導體材料的核自旋代表 1 量子位元資訊。這些半導體矽或磷原子透過電場和磁場進行操作和讀取(Vogel 於 2019 年發表在 Physics World 期刊上)。

如前所述,量子位元是量子計算機的基本單元。由於量子位元可以存在於比傳統 0 和 1 位元更多的狀態中,我們可以使用量子位元來編碼更多的資訊。實際上,使用量子位元對經典位元進行編碼是可能的,但反過來就不成立了。你無法用一個經典的電晶體來編碼量子位元的資訊。對於位元而言,n 個電晶體可以編碼 n 元件系統;封裝一個 8 位元的經典系統只需要 8 個儲存位。

如果 n 元件系統是量子的,則需要 2^n 個複數對其進行編碼(Kopczyk, 2018)。推而廣之,編碼一個 8 量子位元的量子計算機則需要 256 個複數。若要在經典計算機上模擬 64 個量子位元,則需要 2^64=18, 446, 744, 073, 709, 551, 616 個複數。因此,與經典計算機相比,量子計算提供了更大的勢態(potential states)空間;雖然量子位元是一個更大的計算物件,但需要更小數量的量子位元來表示困難的計算問題。顯然,經典計算機很難模擬這樣的表示。

經典的門運算包括 AND、 OR、XOR 等,它們是對位元進行任何操作的基礎。與之類似,量子門也透過相應的「量子門」來修改量子位元的狀態。然而,量子計算機有一組特定於量子位元運算的特殊門,包括 Hadamard 和 CNOT 門(Djordjevic, 2012)。Hadamard 門可以用來建立態疊加(Qiskit/IBM, n.d.),而 CNOT 門可以用來糾纏量子位(Qiskit/IBM, n.d.)。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

量子電路圖。圖源:https://www.bsc.es/research-development/research-areas/quantum-information/quantum-algorithms

透過量子門,量子計算將從某個接收輸入的初始狀態開始。從那裡,量子計算過渡到最終狀態,然後可以對其進行測量以檢索特定資訊。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

應用在量子位元上的可能變換可以使用布洛赫球旋轉來表示。

透過巧妙地運用疊加和糾纏原理,量子計算機可以同時計算多個量子位元的結果(Kopczyk, 2018)。例如,假設我們的量子計算需要對一組輸入進行轉換或使用函式,則可以將該函式應用於多個輸入,同時獲得它們的結果。另一方面,在經典計算機上,相同的操作需要按照每個輸入順序執行或者採用獨立的經典電路完成。

舉例來說,由於經典位元沒有糾纏或者疊加,因此需要單獨的測量和計算來從中提取資訊。就量子計算機而言,糾纏和疊加使我們能夠在單次操作中同時計算多個量子位元的資訊。本質上,這種計算模型允許我們探索不同的路徑,並同時執行數學運算。

這是量子計算機提供的關鍵優勢。這種固有的並行性非常有效,我們稱之為「指數計算能力」。為了成倍增強計算能力,我們只需要在電路中增加一個量子位元。這一發現促成了「量子演算法」的發展,該演算法利用量子計算機提供的並行性,在某些問題上獲得了相比最優經典求解的指數級加速。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

量子計算機的詳細概述。圖源:https://www.engadget.com/2018-02-23-ibm-q-quantum-computer-experiments.html#/

量子計算機首次超越經典計算機出現在 2019 年。來自谷歌的研究者使用 Sycamore(一個 53 位的量子計算機)在 200 秒內解決了一個問題。相反,同樣的問題,經典超級計算機大約 1 萬年才能解決。Sycamore 的結果被官方稱為「量子優越性」,這是量子計算的典型正規化,顯示出它比經典計算正規化更強大(Arute&Arya, 2019505-510)。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

谷歌的 53 量子位量子計算機 Sycamore。(Arute & Arya, 2019, 501-510)

之後,儘管 IBM 的論文研究 (Pednault et al., 2019) 迅速質疑了 Google 的結果,但谷歌的論文《Quantum supremacy using a programmable superconducting processor》通常被認為是量子計算機發展的突破性時刻。

量子計算機的科研道路並非一帆風順

到目前為止,我們只討論了量子計算機的積極方面。但就其實現和發展而言,量子計算機的發展並非一帆風順。事實證明,在疊加狀態下懸浮量子位元非常困難。為了實現穩定性,量子計算機需要放在冷藏室,把量子位元冷卻到接近絕對零度(0 k)的溫度。這意味著,至少到目前為止,量子計算機的使用僅限於小眾研究領域和昂貴的實驗室

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

NISQ 時代典型的量子計算機環境。圖源:IBM Q

此外,量子位元容易受到噪聲的干擾(這種現象被稱為退相干),這意味著它們在相互作用的粒子環境中失去了機率量子行為和儲存的資訊。出現這種現象是因為在量子層面上,沒有任何觀察或相互作用能夠溫和地同時從一個系統中提取資訊,但卻能保持其原始的未受干擾狀態。這種相互作用有效地定域化量子,導致有利的疊加狀態消失(Bacciagaluppi, 2020),這也是我們為什麼不能完全實現量子計算機潛力的原因(Kopczyk, 2018)。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

相干性問題。圖源:https://jqi.umd.edu/news/quantum-bit/2013/11/25/coherence-time-survival-quantum-state

考慮到量子計算機的侷限性,我們正處在研究人員所說的嘈雜中型量子(Noisy Intermediate-Scale Quantum, NISQ)計算機時代。目前的量子計算機還沒有足夠的能力產生容錯結果。退相干透過破壞量子演算法的加速優勢影響它們的有效性。由於 Shor 演算法在多項式時間內實現大量數字的質因數分解,所以有可能破壞我們現有的加密標準,但該演算法仍不失為一種理論進步。

最重要的是,量子計算機並不是所有型別計算機的最佳選擇,也存在自己的短板,比如無法更快速完成兩個數字的初級運算,訓練神經網路也不是毫不費力,也不會更快地執行日常程式。就如 IBM 所稱,量子計算機「永遠不會統治、超越經典的計算機,但會和經典計算機協同合作,因為每種計算機都有自己獨特的優勢」。(Pednault & Gunnels, 2019)。

量子機器學習

近年來的研究表明,量子計算的真正潛力在於建立一個由經典段和量子段組成的 pipeline。考慮到科學應用,我們必須計算粒子的基態。這個問題在研究化學反應和平衡時往往非常重要。

基態被定義為粒子處於最低能級時的狀態,因此是最穩定的狀態。傳統上,獲得基態需要從粒子狀態的本徵向量中計算最小的本徵值,這些本徵向量由稱為哈密頓量(Hamiltonian)的矩陣表示。對於小系統來說,經典計算機在求解時不會遇到太大的困難。但是對於擁有大量粒子的大系統來說,這個簡單的任務會成指數增長,很快就會耗盡計算機資源。

然而,如果我們使用混合的量子機器學習演算法,則能更容易地處理搜尋空間的增長。變分量子本徵求解器(VQE)使用經典演算法和量子演算法來估計哈密頓量的最小本徵值。簡單地說,它的量子部分被稱為 ansatz,用於智慧地搜尋粒子所有可能的狀態空間。經典部分用梯度下降調整 ansatz 的引數,使之接近最優解。這種結合已經證明了量子計算機在這類粒子模擬任務中特別有用。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

VQE 演算法原理圖。圖源:https://www.researchgate.net/figure/Schematic-representation-of-the-Variational-Quantum-Eigensolver-algorithm-applied-to-the_fig1_312194694

在過去的幾年裡,量子機器學習領域的各種其他演算法也被陸續提出。用於傳統 k - 均值聚類的最著名的量子演算法最佳化了向量之間的 Lloyd 經典距離計運算元程式(Rebollo-Monedero & Girod, 2009),以將經典的 O(NkM)計算複雜度指數降低到 O(Mklog(N)),其中 k 是聚類的數量,M 是訓練示例的數量,N 是特徵計數(Biamonte&Wittek, 2017, 195-202)。

研究人員還研究了量子計算機在執行神經網路方面的能力。雖然在量子領域中,神經網路的魯棒表達(robust formulation)仍然需要很長的路要走(Schuld&Sinayskiy,2014),但學術界已經提出了使用量子電路來表徵經典神經網路的各種方法。例如,來自 ETH Zurich 和 IBM Q 的研究人員比較了經典神經網路和量子神經網路的維度、可最佳化性和可訓練性(Abbas 等人, 2020)。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

量子神經網路(Abbas et al., 2020)

Abbas 等人使用模型的維度來對比不同神經網路的效能。他們的結果表明,與經典神經網路相比,結合「良好」特徵圖(用於編碼資料)的量子神經網路具有更高的有效維數。此外,經典神經網路有時會由於高度退化的 Fisher 資訊矩陣放緩訓練速度,而量子神經網路提供了更具描述性的 Fisher 資訊矩陣,具有更均勻的非零本徵值。在 IBM 27 量子位元機器上,這種量子神經網路相比經典神經網路在 Iris 資料集上具有更快的訓練和收斂速度。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

量子神經網路訓練結果優於傳統的神經網路(Abbas et al., 2020)

這些結果表明,具有三段(特徵對映、變分和測量)的魯棒量子神經網路呈現出高容量和快速可訓練性等優點。

NP 困難、搜尋和蒙特卡羅模擬

量子計算機也擅長解決最佳化問題。最佳化問題利用一個特定的啟發式解決方案,從一組有效的解決方案中找到最好的解決方案。為了理解量子計算環境下最佳化是如何運作的,研究人員設計了一些 NP 困難(NP-hard)問題的量子演算法。這方面的一個例子是旅行商問題(Traveling-Salesman-Problem, TSP),它為很多城市提供了比經典蠻力方法更高的二次加速(Srinivasan et al., 2018)。

其他利用量子計算機並行性的演算法同樣取得了很好的效果。Grover 演算法是目前搜尋 N 個條目的無序資料庫的最快量子演算法。在經典計算機中,這項任務需要的時間與 N 成比例,但是量子計算機展示出平方根加速並在 O(sqrt(N))內完成任務。同樣地,量子計算機可以在 N 個資料點執行傅立葉變換,對稀疏 N*N 矩陣反演,並找到在時間上與 log (N)中多項式成正比的本徵值和本徵向量。對於這些任務,已知的最佳經典演算法需要的時間與 N log⁡(N)成正比,也就是說,量子計算機在這種情況下也表現出指數級的加速(Biamonte & Wittek, 2017, 195-202)。

金融行業也正在為量子計算機的潛在應用做準備。股票市場以及相關指標的分析可以轉化為最佳化問題。考慮到這一點,量子計算機的直接實際應用可能會在金融領域紮根。

西班牙一家銀行 BBVA 在 2020 年 7 月釋出的一項研究發現,量子計算機可以提高信用評分、現貨套利機會,以及加速蒙特卡羅模擬(經濟學人, 2020 年)。同樣,摩根大通(JPMorgan Chase&Co.)研究部門的負責人 Marco Pistoia 也希望,量子計算機可以透過加速資產定價、挖掘表現更好的投資組合以及改進現有的 ML 演算法等措施提高潛在利潤。就連高盛(Goldman Sachs)量子研究負責人 William Zeng 也大膽宣稱,量子計算機可以革新銀行業和金融業(The Economist, 2020)。

糾纏的未來

量子計算機揭示了一種很有前途的計算和解決問題的新方法。對難解問題的指數加速比和多項式時間求解是量子位元量子力學屬性的自然後果。這就使得計算模型更接近於量子圖靈機的抽象模型。

回到我們最初對圖靈機的討論,量子圖靈機是經典圖靈機的泛化或量子化,其中磁頭和磁帶是疊加的。形式上,機器的狀態是希爾伯特空間中的量子狀態。量子圖靈機的磁帶是一個無限的「單邊磁帶」,它代表了疊加的位元。在這種情況下,量子計算是一種酉變換(unitary transformation),其結果由量子測量決定,它將把相干疊加中的「單邊磁帶」簡化為具有可分離正交本徵態的經典雙邊帶(Moschovakis, 2003)。

敲開圖靈之門:CS 大四學生長文暢談量子計算機的「前世、今生、未來」

量子圖靈機圖示。

將這種計算模型與硬體相耦合,谷歌量子優越性的展示被研究界的許多人認為違反了 Church-Turing 理論的擴充套件,該理論認為這種計算模型應該使用傳統圖靈機來有效地建模。事實上,Bernstein 和 Vazirani 在 1993 年的一項研究表明量子圖靈機與傳統圖靈機有本質的區別,前者可以解決某些在經典圖靈機上需要超多項式時間的問題。

在化學、金融和最佳化問題上的實際應用也為量子計算機在現實世界中的應用提供了途徑。此外,量子神經網路顯著的可訓練性和維數也為利用量子計算機進行機器學習與深度學習的研究提供了令人興奮的新途徑。

IBM、Intel、Zapata、Amazon 和 Honeywell 等科技公司意識到量子計算機的潛力,都紛紛加大了對其商業應用的投資。用於量子計算機程式設計的高階語言、框架和庫,如 Q#、Qiskit、TensorFlow Quantum 和 Cirq 等,也都在穩步增長。這些框架和它們的教程降低了量子開發的門檻,如果這一趨勢能夠延續下去,那麼我們可以有望在這十年裡看到量子計算領域的一系列令人興奮的新發展。

儘管取得了這些進展,我們仍需要對量子計算機的現狀進行批判性的思考。量子位元對退相干的依賴加上其高昂的低溫要求對現有的硬體帶來了極大的限制。因此,量子計算機是否真的能在實際應用中發揮優越性,可能不是此時此刻要問的正確問題。更緊迫的問題是,我們能否克服 NISQ 時代不切實際的地方。

作者簡介:本文作者 Ather Fawaz 為巴基斯坦拉哈爾市 FAST 大學的一名大四學生,主修電腦科學(CS)專業。他的研究興趣在於深度學習和對抗網路領域,但同樣對物理學和數學具有濃厚的興趣。本文發表在了史丹佛大學人工智慧實驗室(SAIL)的學生與研究人員於 2017 年始創的數字雜誌《Gradient》上。

原文連結:https://thegradient.pub/knocking-on-turings-door-quantum-computing-and-machine-learning/

相關文章