如流為方,量子為向,中國首個量子機器學習開源框架的誕生始末

naojiti發表於2021-04-24

必須得承認,作為普通人,我對學霸尤其是科學家們的一切都充滿好奇。

既往印象中,科學家們總是深居簡出,對自己的生活也諱莫如深,偶爾出現在公開場合,也是像《生活大爆炸》中的謝耳朵那樣滿口術語,跟佩妮一樣的普通人有著厚厚的次元壁。

直到跟百度研究院的幾位量子計算科學家聊了聊,解鎖了他們的工作密碼,我這才意識到,時代變了,原來搞科研也可以這麼有意思!所謂“遇事不決,量子力學”的量子計算,更不是“玄學”。

量子計算科學家平時究竟在忙些什麼?量子計算能夠對我們的生活有什麼幫助?讓我們從真實的故事出發,嘗試為大家揭祕。

緣起:在企業研究院搞科研是種什麼體驗?

量子計算究竟有什麼用?

想必不少同學都聽過百度的自動駕駛以及最近下場造車的訊息,為了保障乘客安全,自動駕駛車輛要配備大量感測器、鐳射雷達、視覺硬體等等,這對算力和演算法提出了巨大的要求。據測算,全自動駕駛時代,每輛汽車每天產生的資料量高達4000GB。而另一方面,傳統計算所遵循的摩爾定律不斷接近極限。

一邊是指數級增長的算力需求,一邊是擠牙膏式的計算突破,這種矛盾該怎麼解決呢?和傳統計算方式迥然不同的量子計算,被視作下一代計算技術,成為谷歌、IBM、微軟等科技巨頭爭先佈局的科技“制高點”。

說到這裡,也就不難理解,為什麼百度會率先垂範,在2018年成立量子計算研究所了。

那麼,量子計算研究所的同學們,日常工作是什麼呢?是對著黑板苦思冥想那些未解之謎?還是一門心思紮在實驗室從此不問世事?

都不是,其實,即使是像量子計算這樣看似“高深莫測”的技術,百度科學家們的研究思路依舊是直指“落地”二字。

這就不得不提到科技企業最常使用的工作方式OKR了。

如果說百度量子計算研究所最大的“O”,是為百度做好迎接量子計算時代的準備,不斷將量子計算與百度的核心技術和業務相融合。

那麼基於這個目標,也衍生出了一些關鍵成果的“KR”。其中,將量子計算與人工智慧相結合,讓兩大關鍵技術彼此促進、協同進化的“量槳”,就是舉足輕重的一個“KR”。

簡單來說,量槳平臺是為了在人工智慧與量子計算之間搭建一座橋樑,讓科研人員和開發者便捷地開發量子人工智慧應用,同時為量子計算愛好者提供了一條可行的學習途徑。

深度學習就夠前沿了,加上讓全世界最強大腦都為之研精竭慮的量子計算,最終還要以便捷易用的工具來為大眾所用?這難度聽起來不亞於普羅米修斯盜來天火之後再修一座火電廠。

尋路:征服星辰大海從伐木做舟開始

2020年5月,僅僅用了兩個多月的時間,國內首個、也是唯一的量子機器學習開源框架:量槳(Paddle Quantum)就在2020深度學習開發者峰會上與大眾見面了。

落地後的量槳,正如量子計算研究所所長段潤堯所說,確實具備了前文提到的“火種”一般啟用量子深度學習的能力,不僅支援開發者高效搭建與訓練量子神經網路,還提供易用的量子機器學習開發者套件與量子優化、量子化學等前沿量子應用工具集,幫助開發者輕鬆地開展研究。

兩個月,從0到1;不到一年,5次迭代。這種工作效率,令我等凡人只能“respect”起立致敬。

不過,星辰大海的目標從來不是一蹴而就的,最基本的工作往往是從伐木做舟開始,量子計算研究所遇到的第一個問題——由誰來做。

段老師透露了百度量子計算研究所的工作方法,那就是每個專案會交由某個同學來全權負責,但團隊間也會相互協作。比如量子深度學習平臺的開發,就是百度量子計算研究所與百度飛槳團隊一起完成的。

一約既定,萬山無阻,來自百度的兩支科研團隊就這樣登上了“量槳號”的航船,駛向星辰大海的彼方。

啟航:如流為方,量子為向,凝視同一個未來

上傳下達,是困擾所有大公司的問題,藉助OKR管理方式,一切似乎就好辦多了。段老師本人,就成為了整體戰略與個體目標之間承上啟下的連線點。

“在大的百度量子戰略確定下來之後,我會在我們百度的智慧工作平臺‘如流’上,用OKR&週報功能綜合確立一個研究所的OKR,量子計算研究所的團隊同學們則會根據自己的實際情況以及外部環境的挑戰,制定一個OKR初稿和我討論,確保每一個人的OKR是和整體戰略目標相匹配的,且有足夠個人的主觀能動餘地。”

怎麼保證這種共識在執行過程中不會產生偏離?段老師分享了許多團隊對齊資訊的訣竅。

首先自然是打工人們都十分熟悉的——例會。

對於百度量子計算研究所的同學們來說,例會就是在專案執行過程中不斷對齊資訊。如流的OKR系統和週報系統實現了有機關聯,週報可以清晰地體現出每一個“O”(目標)的每一個“KR”(關鍵成果)推進到了什麼程度,以此來開展每週一的工作計劃討論例會。

為了不讓會議陷入冗長和無效,段老師對例會也有著嚴格的要求。比如會議人數保持在8個人以內,超出這個數量往往大家都記不住其他人說了什麼。

除此之外,團隊成員也會在每週五的總結分享例會中,分享一下本週的產出和心得。當然,不是流水賬式地彙報工作,而是講講自己本週最有意思的事情。

比如令段老師印象極為深刻的,是量槳專案負責人王鑫在一次例會中,分享瞭如何將“上、止、正”(追求上進、停下來思考、行正道)的做事理念,用在專案的產出過程中。用20%的時間把能產生80%影響的那部分工作先做出來,獲得更多的資源和反饋以後再往下推進,這樣用同樣的時間可能得到雙倍收益。掌握進與停之間的節奏,或許這就是量槳能夠在短時間內從0到1突破的密碼之一。

另一個團隊對齊資訊的方式,就是每週一次的quantum walk。

每到週三,百度量子計算研究所的成員,包括實習生,都會約定好在中午時間段一起邊散步、邊交流,給所有人一個互相認識、彼此交流的機會,避免全程在各自工位上獨自做事的孤立感。

對於量槳這樣攻關難度大、涉及飛槳和量子計算兩大技術團隊、十多個部門的專案來說,就如同一座航行在海上的大型遠航船舶,是涉及面極廣的系統化工程。負責人王鑫,就是量槳這座航船的船長,兼任“專案經理”。

如何將這麼多人的任務與專案進度捋得清清楚楚、明明白白?

王鑫直言,“最怕就是我認為某個東西能實現,對方認為不能,所以我們對會議的要求其實很簡單,就是能夠對齊某些事情,達成共識並形成to-do。”

令王鑫感觸很深的一次經歷,是用如流開視訊會議對齊專案模組。

“飛槳有十幾個模組,當時會議的組織者就直接線上編輯一個文件,一個一個cue負責人,你覺得OK不OK,OK的話現場填幾月幾號完成,大家協同看那個文件,最後半個小時就把十個部門的協同搞完了,給我的印象太深了。”

當“to-do”達成共識後,就需要面對任務的落實與分配,如流的待辦功能此時便凸顯重要性。首先,會議中的內容將自動生成智慧記錄,便於會後回顧和追蹤。同時,參會人可在會議紀要中撰寫會議任務,並@相關成員,該事項即自動轉為“待辦”同步在每一個負責人的待辦列表中。所有任務的進度,也會在如流的專案管理功能中實時更新,與其他成員共享。

如流作為百度旗下的新一代智慧工作平臺,是百度科學家們日常協作的“效率神器”。而這個王鑫心中的“名場面”,成為了量槳兩個多月順利上線、保質保量按時交付的基本前提。

只有所有水手都錨定同一個方向,量槳這艘航船才能始終在清晰的航道上全速前進。

加速:全速前進的效率引擎

到了這一步,量槳的開發工作已經細化到了每一個人的具體任務,接下來只要擼起袖子加油幹就行了。聽到這裡,關於量子計算研究的硬核工作也就開始了!

王鑫告訴我們,具體的開發過程其實核心就兩步:一是明確思路;二是用程式碼把創意寫出來。

聽起來就像把大象塞進冰箱一樣簡單,但其實在每一步推進時,都會遇到不少協作上的問題:

比如開溝通會時遇到工程師出差、公式沒有白板無法書寫的情況,經常說半天也說不明白。所以百度量子計算團隊的同學現在都是用如流線上會議開會,過程中就可以通過共享螢幕來解決問題——“A和B說了半天,我都講成這樣你怎麼還不理解我,馬上共享螢幕處理一下,大家都看清楚了。”

一位同學在與澳大利亞合作的專案中,就堅持用如流溝通。“對齊合作研發計劃、月度工作彙報、以及用來傳遞較大的專案檔案,都要用到如流的工作流、視訊、共享螢幕等功能。”

聽起來,如流應對協作過程中那些“時間吞噬者”,效果還是很明顯的。但困擾參會者的問題,並沒有到此為止。

“除了要搞定會議室,還需要有人來搞定會議記錄。”據一位百度科學家回憶,以前需要一個人專門來處理。實習生在開會時噼裡啪啦一直在打,還可能跟不上進度。後期聽錄音整理的話,聽一遍一個小時就過去了……這顯然是個必須攻克的效率關卡。

王鑫告訴我們,基於百度的語音技術、自然語言處理技術,如流會自動將會議中的語音發言轉化成文字。“自從有了會議智慧記錄功能,我們開會的時候每次都用。如果一個事情非常重要,會反覆說,或者說得很慢來跟大家確認,如流在識別這些重點、關鍵詞上恰恰可以做得非常好,保證每一次會議都能有結論,形成to-do。”

當然,開發過程中難免還會遇到需要小組或多人溝通的問題。但約定會議時間在大公司是非常費時費力的一件事,對此,王鑫和他的隊友們也有自己的訣竅。

“可以把個人的工作安排加入到如流的‘日程’裡”,提前規劃並新建日程,把要開會的人拉進共同的日程裡。比如寫上K5廊道,就在廊道開個站會,很方便。”

就連跟海外團隊的溝通,他們也會在如流上規劃好時間,直接把日程扔給對方,很方便同步時間。

本以為做量子計算科研的人只是學術能力強,萬萬沒想到,他們對於如何藉助工具提升工作效率、充分利用自己的時間,都這麼有主意。

看來想當學霸,首先必須變身時間管理達人,讓自己不為瑣碎的辦公日常所困。

抵達:巡禮中國量子時代

越是簡單的訴求,越要求工具能夠洞察場景、化繁為簡,“如流”也成為了百度同學完成OKR、推進量槳這類關鍵專案的效率保障。

經過前面的幾個階段迴圈往復,量槳只用了一兩個月的時間就實現了從模擬9個量子位元到23個量子位元的跨越。

這是什麼概念呢?一個量子位元可以同時代表 0 和 1 兩種不同的狀態,操縱1個量子位元等於可以同時操縱2個狀態。從9到23個的受控量子位元位,相當於所能代表的數值從幾百個一下子擴充套件到百萬級別。

算力的增長,意味著可以超前進行一些研究。比如利用人工智慧技術突破量子計算的研發瓶頸;或藉助量子計算的強大算力,加速超大規模深度學習演算法的開發。

當然,通往量子計算的航道上還有許許多多的關卡,量槳的開發只是百度量子計算研究團隊工作中的一部分。

通過與雲端計算的深度融合,百度孵化出了國內首個雲原生量子計算平臺“量易伏”,開發者可以在雲端靈活方便地呼叫量子服務與算力,在量子模擬器或量子計算機上進行量子程式的開發測試等等。

另外,量子計算和經典計算的原理並不相同,想要在硬體層面消除噪聲影響、減少計算時間等,還需要軟體和演算法的協助。

試想一下,開發者先搞一臺量子硬體,再以此為基礎開發軟體,聽起來簡直跟想吃麵包還要自己種小麥一樣麻煩。更優解的方案,自然是去購買“麵粉”,然後按需配比就好。

百度的“量脈”就以此為目標,通過量子脈衝雲端計算服務和開源SDK,開發者無需辛苦學習複雜的量子軟、硬體技術,就能對量子電路進行脈衝層面的控制。

量槳、量脈、量易伏,這三大產品所構成的百度量子平臺,通過大量工具和介面,順利扮演起了中國量子計算時代作業系統的角色。在《Analytics Insight》雜誌公佈的2020全球十大量子計算公司名單,百度的名字也躍然於上。

按百度量子計算研究所的OKR來看,“人人皆可量子”,把量子計算變成隨處可見的基礎設施,更便捷簡易地為產業所用。百度的同學們乘著效率之舟,正一步步朝著最大的目標“O”航行,程式中的每一點寸進、每一個“KR”,都蘊含著功在當下、利在千秋的力量。

或許我們每個普通人的日常工作,並不像百度研究院的同學們那樣時時面臨世界頂級難度的“極限挑戰”,需要應對量槳這樣的重大課題。但不可否認,在工作中追尋自我實現的星辰大海,普通人也同樣熠熠生輝、光彩非凡。

乘智慧之風,破效率之浪,個人的傳奇故事與中國的未來史詩,都將誕生在旅程之中。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2769664/,如需轉載,請註明出處,否則將追究法律責任。

相關文章