偉大前程與技術難關:量子機器學習該如何走進現實?

naojiti發表於2020-05-29

在我們描述21世紀剛剛過去的第二個十年的技術版圖中,人工智慧(AI)、大資料(Big Data)、雲端計算(Cloud)、物聯網(IoT)是幾個無論如何也繞不開的術語。在闡述科技發展趨勢的文章裡,如果不把這些術語作為開篇,簡直都不好展開論述。

而在下一個十年,在這一長串的革命性技術的名單後面,可能還要再加一個量子計算。正如人工智慧,因為大資料的餵養而使得神經網路演算法得以成熟,因為雲端計算的加持才擁有了充沛的算力,因為和物聯網的融合而使得萬物產生智慧。

那麼,人工智慧與量子計算的交往又能產生怎樣的“劇烈反應”呢?

2017年,圖靈獎得主姚期智教授在一次演講時說:“如果能夠把量子計算和AI放在一起,我們可能做出連大自然都沒有想到的事情。”

這等“敢叫天地換新顏”的技術前景,對於大多數普通人而言可能還略顯遙遠,但量子計算和量子機器學習的技術研究早已在全球多家科研機構和科技巨頭的實驗室中落地開花,可以向外界和技術人員提供基礎的演算法工具和資源,讓公眾可以一睹量子與智慧的神奇力量。

近日,百度飛槳官宣釋出了量子機器學習開發工具Paddle Quantum——量槳,成為國內唯一支援量子機器學習的深度學習平臺。量槳的作用就是提供了一套量子機器學習的工具集,開放給科研人員,進行量子神經網路的搭建測試以及量子人工智慧的研究。

量槳的出現,到底能為量子機器學習帶來多少顯著進展,尚待時間檢驗,但一定程度上推動量子機器學習在我國的普及,為廣大AI和量子計算的研究者提供了一條新的學習途徑。

按捺不住學習熱情的你,一定想到量子計算和人工智慧的技術交匯處,一窺量子機器學習的究竟,來衡量下投身入局的可能吧?

為什麼“量子計算”很配“人工智慧”?

進入正題之前,我們不妨先來簡單瞭解下量子計算的基礎背景,來降低下代入難度。

先來看,量子為什麼能夠計算?

二十世紀,自然界的一個重大物理發現就是量子力學,而量子力學主要的發現是基本粒子有兩種狀態——疊加和糾纏。通俗來理解,疊加,就是量子同時既是這樣又是那樣,一旦被觀察或測量就會變成其中的一個樣子,這就是著名的“測不準”;糾纏,就是兩個成對的量子粒子,即使相隔宇宙兩端,也能發生暗戳戳的神秘互動,這就是大名鼎鼎的“量子糾纏”。

“疊加”決定了量子的平行計算的基礎,“糾纏”決定了量子傳輸的基礎。讓量子的這些特性被用於計算時,就能用來處理非常複雜的資料計算。

我們知道,經典計算的基本單位是位元(Bit),位元只能在0和1兩個狀態之間切換。經典計算只能在0和1的開閤中實現線性計算,只不過現在的計算力非常巨大,一秒鐘可以進行數十億甚至更高的計算。

而量子計算的基本單位的量子位元(Qubit),量子位元因為疊加效應就可以同時具有0和1的特徵。隨著量子位元數量的增加,量子位元的計算能力將會以指數級的方式增加。

也就是,一個量子位元可以同時處於兩個狀態(0 和 1)。因此,兩個相互作用的量子位元可以同時儲存全部4個二進位制值。通常,“n”個量子位元可以同時表示“2的n次方”個經典二進位制值。

我們用一個“玉米田迷宮”的例子來理解經典計算和量子計算的不同:經典計算就如同一個人在玉米田裡尋找出口,這個人會先找一條路走下去,遇到阻礙就返回,再找一條路重新開始,再遇到阻礙就再返回,直到找到出口。而量子計算就如同有了多個分身,可以同時探索玉米迷宮裡的每一條路徑,同時一次就把出口找到。

這樣,量子計算的疊加態以及糾纏態形成的疊加坍縮構成的高平行計算能力,就為人工智慧特別是機器學習所需要的資料處理和演算法訓練提供了一種新的可能。

量子計算和人工智慧也在發生一種相互“糾纏”又密不可分的關係,但這並不意味著量子計算加上機器學習,就可以立刻碰撞出顯著的成果。

量子機器學習仍在“襁褓”之初

量子機器學習(Quantum ML)是一個量子計算和機器學習交叉的的跨學科技術領域,二者的結合可以產生一種互利互惠的結果。

一方面,量子計算最主要的目標之一,就是藉助於量子特性開發高效能的量子機器學習演算法,從而加快或拓寬人工智慧的應用場景。另一方面,量子計算在大規模應用落地之前還有許多非常棘手的科學與工程技術難題有待解決,這需要大量的先進計算工具,特別是AI技術幫助突破量子計算研發瓶頸。

在機器學習和量子計算按照演算法和資料二維劃分下,可以得到四種不同分類——C-C、Q-C、C-Q和Q-Q。C-C就是傳統的機器學習;Q-Q屬於量子計算的開放域;而C-Q主要就是透過機器學習演算法來解決量子物理的問題,比如對量子系統的控制物件建模,對擾動、噪聲等引數特徵的辨識,推動量子計算發展。

而Q-C就是利用量子理論改進機器學習,推動機器學習演算法的量子化。一種方法是透過量子計算把原先經典計算中不可計算的問題變為可計算的, 從而大幅降低機器學習演算法的計算複雜度;一種方法是透過量子計算並行加速的優勢與機器學習的演算法深度結合,催生出全新的量子機器學習演算法模型。

傳統的神經網路只能使用單個網路來儲存許多演算法模式;而量子神經網路,因為量子疊加效應帶來的並行性,可以使用許多網路來儲存許多演算法模式。不過,量子神經網路的實現並不容易,因為最終這些演算法想要真正發揮作用則需量子計算機(處理器)的支援。

據報導,2018 年,義大利帕維亞大學的研究團隊在只有4個量子位元的量子計算機上實現了世界上第一個單層神經網路。

(具有 4 個量子位元的人工神經元的量子電路)

這一模型能夠準確地模擬單個神經元的行為,像這樣的單層模型能夠識別簡單的模式。然而,它還沒有擴充套件到由多層神經元組成的深度神經網路。不過,這至少是在量子硬體上有效訓練量子神經網路而邁出的第一步。

與傳統神經網路相比,量子神經網路具有很多優勢,比如,指數級記憶容量、更快的學習和處理速度、更小的規模以及更高的穩定性和可靠性等。

儘管量子硬體的進度稍顯緩慢,但演算法模型理論可以先行。谷歌的Quantum AI 團隊就在當時已經預先構建出一個可以在量子計算機上訓練的深度神經網路的理論模型。

而到了今年3月,谷歌又宣佈開源一款用於訓練量子模型的機器學習庫 TensorFlow Quantum(簡稱 TFQ)。TFQ 包含了特定量子計算所需的基本結構,例如量子位元、門、電路和測量運算子。使用者指定的量子計算然後可以在模擬或真實硬體上執行。

目前,量子機器學習的發展仍然處於起步階段,當前的一些應用上面可以做到使用量子神經網路來生成一些演奏出全新聲音的新樂器等。

未來量子機器學習的應用前景卻更加令人興奮,比如擁有指數級儲存和檢索能力的量子神經網路可以模擬人類大腦或者模擬黑洞,能夠幫助人類真正探索世界最深邃的本質。這也許才是量子機器學習和量子計算發揮終極價值的場域。

量子機器學習的成長“難關”

量子計算本身就是一項複雜技術,而量子機器學習這一交叉技術的研發難度自然又進一步提高。量子機器學習演算法的成熟自然要得益於軟硬體兩方面的同時提升,而在這兩方現在都仍然還存在一些難關要闖過。

首先,我們要知道,傳統的機器學習語言並不能直接地移植到量子計算上面,而是需要先把當前的機器學習程式碼轉換成使用量子位元的量子態,從而構建出量子神經網路。

這就是所謂的量子機器學習的I/O瓶頸,所謂I/O瓶頸是指,目前大部分量子機器學習演算法或者需要把大規模資料集編碼為量子態,或者只是把問題的解生成在量子態中,因此輸入階段的前處理和資訊提取階段的後處理將耗費大量時間,乃至抵消量子演算法所節省的時間。

(IBM的一個 50 量子位元位計算系統的中心結構)

其次,則是真正意義上的通用量子計算機尚沒有出現,而現在意義上的上千個量子位元的量子計算機在可以良好抗噪聲、解決退相干問題上還存在著一定的問題,也就是還不能達到迪文森佐標準的量子計算機。這意味著能夠支撐量子機器學習演算法得以實際驗證的硬體手段仍然是缺乏的,研究者大多隻能透過量子模擬器的方式來實現多個量子位元的運算。

比如說,此次谷歌TFQ為量子機器學習研究提供了一個內含大約 50~100 量子位元的噪聲中級量子處理器(NISQ)的工具,從而控制 / 建模自然或人工量子系統。基於此,現在TFQ的量子機器學習模型可以處理量子資料模型和混合量子經典模型,幫助開發者能夠改進現有的量子演算法或發現一些新的演算法。

基於軟硬體上面的現實困難,量子機器學習演算法上面的突破還有很長的時間。

此外,在一些計算問題上,量子機器學習的演算法和經典演算法相比是否一定有加速優勢,則仍然存疑。2018年,年僅18歲的華裔學生Ewin Tang受量子推薦演算法的啟發,設計出了一個經典演算法,它能以和量子演算法相近的速度解決推薦問題。這一思路給了研究者以啟示:透過量子演算法思維能促進經典演算法的發展,這也是量子計算研究意義的另一種體現。

儘管目前來說,量子機器學習既沒有像去年穀歌所宣稱的“量子霸權”那樣引人矚目,也不能像人工智慧在現實生活的廣泛應用而成績顯著。但量子機器學習更像是一個面向未來世界的計算產物。

回到幾十年前,量子計算的實現和機器學習的神經網路的實現,都一度被認為是不可能的事情。而這二者竟然都能夠實現,現在還處在了相互結合的交匯點上,已然是人類技術的一次奇遇。

那麼站在當下,一個普通的技術愛好者也可以透過像百度、谷歌這樣的量子計算平臺的開放,就可以親身來進行量子演算法的開發和測試,更不能不說千載難逢、幸運之至。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2695161/,如需轉載,請註明出處,否則將追究法律責任。

相關文章