龍蜥社群理事長展望作業系統 2022:加速駛向快車道,雲、XPU和開源成“催化劑”

OpenAnolis小助手發表於2022-01-25

編者按:作業系統誕生至今已有數十年的時間,其整個發展演進歷程、後續將如何發展也受到廣泛關注。近日,龍蜥社群理事長馬濤  InfoQ 直播分享,從 承上啟下的作業系統、作業系統的演進路線與趨勢、面向未來的作業系統、如何解決作業系統人才稀缺難題 四個方面詳細解讀了作業系統的 2022。本文轉自 AI 前線,龍蜥社群授權轉發,視訊回放已上線至龍蜥官網(點選閱讀原文即可直達),一起來探討作業系統賽道蘊含著哪些機會與挑戰。


長期以來,我國高科技領域的最大痛點之一正是底層基礎技術領域“缺芯少魂”,其中“魂”就是作業系統,它是資訊化安全體系的基石。不過近年來隨著一批優秀國產作業系統陸續誕生,也讓大家看到了希望的曙光。

展望 2022 年,作業系統賽道將會如何發展,又蘊含著哪些機會與挑戰?1 月 4 日,阿里巴巴集團核心團隊創始人之一、阿里雲智慧作業系統團隊負責人、龍蜥社群理事長馬濤(伯瑜)做客 InfoQ 視訊號,對作業系統的 2022 做了最新的解讀。


承上啟下的作業系統

InfoQ: 作業系統誕生至今已有數十年的時間,您能和我們介紹下作業系統的整個演進歷程嗎?

馬濤: 大家應該都有所瞭解,第一臺電子計算機是在 1946 年出現的,那會兒使用者在和硬體打交道時用的是打孔紙帶。真正具有現代意義的作業系統,是我們常說的 Unix,它是在 1969 年正式誕生的。也是從這個時候開始,慢慢地出現了很多作業系統。今天看到的無論是嵌入式裝置如手錶等,還是超級計算機,使用者在和硬體打交道時都需要用到作業系統。

那麼,作業系統到底起到什麼作用?我認為作業系統的核心作用有兩個: 一是和底層硬體打交道 ,比如 Windows 支援的硬體包括桌上型電腦、筆記本,Linux 支援的硬體是伺服器,Android/iOS 支援的硬體是智慧手機; 二是和應用打交道 ,比如 Linux 伺服器作業系統上層有各種各樣的伺服器軟體,Windows 上層有辦公軟體等等。從這個角度講,作業系統在整個軟體生態裡起到了非常重要的承上啟下作用。

InfoQ: 最近幾年,作業系統並未出現革命性突破,背後的根本原因是什麼?

馬濤: 剛剛提到作業系統最重要的作用就是承上啟下,也就是說,作業系統的發展是脫離不了應用和硬體的。過去十年,雲端計算在深刻地影響著整個世界,無論是作業系統所支援的各種硬體,以及底層基礎設施,還是應用層的大資料、人工智慧等新應用,這些都在影響和推動作業系統的發展。

至於為什麼有聲音認為作業系統多年來沒有出現革命性突破,我的理解是,作業系統本身長期處於底層,它的進展大部分處於潤物細無聲的狀態。比如,隨著雲端計算的發展,作業系統實際上也在快速發展,但是作業系統把上層的應用封裝好了,所以對於上層應用而言,感覺不到太多變化。這也是大家覺得作業系統沒有革命性突破的一個原因。

另一方面,作業系統是一個非常關鍵的技術元件,它的發展是非常漫長的,很多我們熟悉的作業系統都在經歷持續迭代和演進。舉個例子,Linux 作業系統誕生至今已有 30 多年的時間,每年仍有大量的程式碼加入進來。我是在 2006 年開始做作業系統研發的,那會的 Linux 核心版本是 2.6.19,現在 16 年過去,Linux 核心版本已經到了 5.16,這是一個非常快速的演進歷程。

前不久有一項資料統計提到,去年整個 Linux 核心有 7 萬多處修改,並且保持了每兩個月就釋出一個版本的節奏。雖然 Linux 名字一直沒有變,但它的核心已經發生了很大的變化,並且它的研發速度、迭代速度都是非常快的。

InfoQ: 您如何評價國產作業系統近幾年的整體發展?過去一年,國產作業系統在產業生態、軟硬體生態、人才生態的發展情況分別是什麼樣子?

馬濤: 整體而言,最近幾年國產作業系統處在快速發展的階段,生態也在不斷繁榮,包括龍蜥、openEuler、OpenCloudOS 等作業系統開源社群也在不斷髮展、作業系統和開源技術在不斷湧現,這說明大廠對作業系統的重視程度在不斷加大。

我認為現階段這種“百花齊放”以及良性的競爭是非常有必要的。通過這種良性競爭,可以讓整個國產作業系統的發展更加快速,同時也能在國際上樹立起中國在作業系統領域的口碑。此外,隨著大廠對作業系統的投入加大,也可以培養更多作業系統人才,形成更完善的人才培養體系。

以龍蜥社群為例, 在生態方面,龍蜥社群擁有 16 家理事單位以及 80 多家合作單位 ,包括國產作業系統廠商、雲端計算廠商、晶片廠商、應用廠商都在社群裡,大家做到了公正、公平、公開和共贏。

我想強調的一點是,中國作業系統社群已經發展了很多年,不是最近幾年才突然火起來的。但在過去,國內的社群大部分是由獨立的某家廠商來主導,這也就導致它在研發投入上會稍有薄弱。畢竟作業系統需要巨大的研發投入,而通過社群的方式,可以發揮所有廠商的不同能力。比如,阿里雲等雲廠商可以提供大規模運維能力以及穩定效能力,作業系統廠商可以提供線上應用的優化和適配,晶片廠商可以跟硬體進行適配。通過社群的方式形成一種非常合理的分工,最終形成非常好的合力。

我也希望可以有更多的公司、夥伴能夠加入龍蜥社群,一起打造最有競爭力的開源作業系統。


作業系統的演進路線與趨勢

InfoQ: 有網友想請馬濤老師聊一聊,單機裸金屬時代、虛擬化時代、Serverless 時代,作業系統的演進路線與趨勢。

馬濤: 這是個很大的話題,我簡單分享下我的理解。之前,我寫過一篇文章叫做 《什麼是作業系統的雲原生?》,裡面也有提到過作業系統的演進路線。

我們回顧作業系統的發展史可以看到,最早在單機裸金屬時代,使用者要想執行某個應用,需要在自己的虛擬機器上做很多事情。對於那個時期的應用開發者來說,他既是程式設計師,也是系統管理員,還是資料庫管理員、網路管理員。在單機裸金屬時代,作業系統就只是一個純作業系統,使用者需要做很多事情。

至於後來為什麼出現虛擬化時代,主要是雲技術快速發展,雲上 CPU 的能力越來越強,而使用者的應用並沒有相應的水平擴充套件能力。舉個例子,我有 100 個 CPU,但大部分應用程式可能只需要 4-8 個 CPU 就已經執行得非常好了。在這種情況下就出現了虛擬化,通過雲提供的虛擬化技術,把一個包含 100 個 CPU 的機器切成 16 個機器,每個機器包含 6 個 CPU。作業系統在這裡起到的作用,一是為使用者提供了一個虛擬化的方案,把大的 CPU 切成小的 CPU 供使用者使用,二是提供了資源隔離技術,使得這些使用者之間互不干擾。

作業系統和雲的第二次親密接觸源於容器的誕生和發展 。2013 年,Docker 橫空出世,使得應用容器的打包分發變得非常簡單易用。隨後,Kubernetes 等容器編排技術出現,容器生態系統得到了快速普及和發展,容器也迅速成為應用打包分發和開發測試的主流形態,逐漸成為雲端計算的主要執行單元。

2019 年,UC Berkeley (加州大學伯克利分校)預測 Serverless 將會逐漸取代 Serverful 計算,成為雲時代的新計算正規化。隨著雲原生理念的推廣以及各種雲原生技術的不斷髮展,Serverless 計算的趨勢在加速。在這種新場景中,使用者只需要專注於應用和業務邏輯,更多的通用功能、資源和系統能力都下沉到雲,使用者不需要提前規劃容量,不需要運維底層系統,可以真正像用水和電一樣按需使用、按需付費,Serverless 將大幅提升雲的生產效率。

要構建好 Serverless 服務,作業系統一定不能缺席。由於 Serverless 場景下服務邊界的上移,對使用者來說,應用容器或函式程式碼之下的系統就是一個整體,使用者不再感知底層系統的技術棧分層。這個變化給技術垂直整合創造了條件。我們認為,雲原生的作業系統需要進行整體性的全棧優化和重塑,才能為 Serverless 提供更優的底層系統能力,基礎執行環境、資源彈性、高效執行等能力也將因此得到極大的釋放。

InfoQ: 社群有小夥伴提問說,作業系統逐漸雲端化,以後會不會沒有作業系統了,全部被雲端代替?

馬濤: 一個快速的回答就是“不會”。不會沒有作業系統,但它會發生一些變化,比如一些核心元件會發生演進。舉個例子,任何應用執行都需要一定的 CPU 資源、記憶體資源、網路資源以及儲存資源。所以不論應用怎麼變化,我們始終有對這些資源做管理的需求。所以不論產品形態如何,它是不會消失的,只是換了一個地方而已。比如在雲場景中,即便我們看不見形式上的作業系統,它也會真真實實存在。隨著未來萬物互聯以及智慧裝置的出現,作業系統只會越來越多,並且它要處理的內容也會越來越複雜。


面向未來的作業系統

InfoQ: 過去一年 DPU 在作業系統上有了更廣泛的支援,DPU 對作業系統的發展起到什麼作用?是否為作業系統帶來了一些技術挑戰?

馬濤: DPU 以及各種各樣 XPU 的發展,對作業系統帶來很大的技術挑戰。此前,計算能力是隨著 CPU 晶片的處理能力提升而提升的。但從 2020 年開始,摩爾定律逐漸失效,最近幾年,CPU 效能的提升速度也已經非常慢了。這也是為什麼我們在很多領域都開始嘗試各種各樣的定製體系結構,比如 GPU、DPU。像在雲端計算場景,阿里雲的神龍就是面向各種雲場景做的定製,谷歌的 TPU 也是面向類似的場景。

我相信,在未來會有越來越多 XPU 部署在資料中心和裝置上,這帶來的問題是,我們如何更好地讓我們的計算任務執行在一個合適的 XPU 上?對作業系統而言,過去面對的是一個單一的處理器,現在需要演變成支援多個異構處理器的環境。作業系統一是要對跨體系結構提供支援,二是能夠針對不同計算場景發揮硬體能力。過去,我們把不同的任務分配到不同的處理器上,很長一段時間是完全靠研發人員肉眼進行識別、人工分發。未來,作業系統需要提供更加自動化的方式。

InfoQ: 未來的作業系統還有哪些值得關注的技術趨勢?為什麼?

馬濤: 剛剛提到了雲對作業系統產生的影響,以及 XPU 的出現會給作業系統的演進帶來巨大的機會,這裡我想再聊聊記憶體。

過去十年,人工智慧技術在快速發展和應用,特別是深度學習等技術在重塑整個計算機產業。人工智慧需要龐大的資料量來做訓練,而資料儲存在記憶體中,因此需要思考如何改進 CPU 體系結構,打破傳統計算機模型,同時提供一種更加靈活的架構,也就是“解耦”。在記憶體資料的冷熱識別、記憶體故障報警預測方面也可以做更多的協同,減少資料的搬移。

此外,資料安全和隱私同樣值得關注。2021 年,我國頒佈了《資料安全法》,2018 年,歐盟頒佈了 GDPR(資料隱私保護法案),對資料隱私提出了更高的要求。過去,作業系統在資料安全方面做得還是不夠的,一方面受限於硬體的技術,另一方面在記憶體加密以及全棧加密上涉及較少。

最後,我想聊一下開源。當前國內在作業系統開源領域處於蓬勃發展階段,並且大家都慢慢認識到開源對作業系統的重要性。我希望包括 OpenAnolis 龍蜥社群、openEuler、OpenCloudOS 等作業系統開源社群通過良性競爭、互融互通,未來讓作業系統的發展進入快車道,共同促進作業系統發展。

InfoQ: 有網友提問說,微核心目前發展到什麼程度了?龍蜥後續會不會換成微核心?

馬濤: 在作業系統原理裡有兩大派系,一個是單核心派系,一個是微核心派系。單核心以 Linux 為代表,微核心現在也有很多實現。我認為,在很長一段時間內,這兩種核心都會同時存在,因為它們所解決的問題是不一樣的,我們無法通過一個核心解決所有場景。

至於龍蜥作業系統會不會以後用微核心,我只能說在短期內我們不會考慮這個事情。長期來看,隨著整個應用雲原生化,要看應用的變化和發展,畢竟作業系統是為應用服務的。


如何解決作業系統人才稀缺難題?

InfoQ: 對國產作業系統的發展來說,目前比較嚴峻的問題是人才缺口較大,這個問題在 2022 年可以得到改善嗎?對於作業系統人才的培養,最關鍵的是什麼?

馬濤: 人才問題肯定是需要解決的,這個毋庸置疑。我認為在人才問題上,有幾點是可以做的。

  • 第一,當前各種知識、技術大爆發,而作業系統本身的學習門檻又相對偏高,我認為需要做的首先是降低整個作業系統的入門門檻,讓開發者可以更加容易地參與到作業系統研發中。
  • 第二,從教育抓起,去年清華大學組織了一個作業系統設計大賽,龍蜥社群是贊助方之一,我們希望通過這種比賽的方式,讓作業系統教育可以在大學階段就普及開來,另外也可以讓教育界和學術界看到作業系統在工業界是大有可為的。
  • 第三,隨著國內對作業系統的重視程度加大,越來越多的企業在組建自己的作業系統團隊,市場對作業系統人才的需求量增大,也在通過培養提升人才能力。

InfoQ: 您提到作業系統的學習門檻相對偏高,您能和作業系統初學者或有志在這個領域發展的年輕人提供幾條過來人的學習經驗或建議嗎?

馬濤: 我可能會稍微打擊下大家。我認為做作業系統需要具備以下幾點, 第一,要對作業系統感興趣 如果你是因為作業系統處在風口,想賺錢才加入這行,那麼會非常難。因為作業系統學習曲線很陡峭,在前期你很難獲得滿足感。沒有濃厚的興趣,你很難堅持下去。我在 2006 年剛開始接觸作業系統的時候,經常到了廢寢忘食的地步,春節也不出門,天天在家琢磨,我認為這是一件很開心的事情。如果你現在琢磨作業系統也感到開心,那麼你就滿足了興趣這一條要求。

第二,堅持。 還是舉我自己的例子。2010 年,我在和一些國際知名開源作業系統研發人員交流、提交補丁的時候,是需要長期進行各種交流,不停地修改、潤色程式碼,非常耗時,但它也極大地提升了我的作業系統研發能力。

第三,積極參與開源。 如果你想寫一個自己的作業系統還是非常容易的,但現在整個應用生態已經非常完善了,你需要睜開雙眼看世界,積極擁抱開源。在開源社群,你可以向很多高手學習,個人能力的提升速度也會非常快。通過 1+1>2 的模式,快速成長。

InfoQ: 您認為對於作業系統領域的從業者來說,2022 年可能面臨的最大挑戰是什麼?

濤: 我覺得最大的挑戰來自兩方面。第一,作業系統研發是一個需要長期投入的事情,它更像是長跑,考驗的是耐力、持續發展的能力。比如做作業系統開源社群,怎樣壯大社群、實現盈利,怎樣得到開發者的認可,這些都是非常重要的事情,並且也需要時間來考量。可能在最初的一兩年,大家憑著信念、毅力做了下來,但如果整個社群生態沒有很好的發展,社群的參與者沒有從中得到自己合理的回報,那麼這個社群是沒有辦法良性迴圈的。這也是所有開源社群一定會遇到的一個問題。

第二,整體而言,作業系統還是處於快速演進的過程中。比如面對 CentOS 8 停服事件,我們如何讓這些使用者不受到損失,遷移到國產作業系統平臺上,其中會涉及大量瑣碎的工作。對作業系統從業者來說,這是一個非常艱辛的過程,但只要我們堅持下來,未來肯定是光明的。

InfoQ: 站在 2022 年伊始,您能為作業系統從業者們送上一句祝福嗎?

馬濤: 作業系統是資訊產業的基石,它的重要性是毋庸置疑的,對於已經在從事這個行業的同仁來說,我希望我們能夠團結一致、共創未來,這是非常重要的。對於那些希望未來可以進入作業系統行業的同仁來說,我也想說一句,來吧!我們需要更多的新鮮的力量,未來一定是屬於我們的!

—— 完 ——

加入龍蜥社群

加入微信群:新增社群助理-龍蜥社群小龍(微信:openanolis_assis),備註【龍蜥】與你同在;加入釘釘群:掃描下方釘釘群二維碼。歡迎開發者/使用者加入龍蜥社群(OpenAnolis)交流,共同推進龍蜥社群的發展,一起打造一個活躍的、健康的開源作業系統生態!


關於龍蜥社群

龍蜥社群OpenAnolis)是由 企事業單位、高等院校、科研單位、非營利性組織、個人等在自願、平等、開源、協作的基礎上組成的非盈利性開源社群。龍蜥社群成立於 2020 年 9 月,旨在構建一個開源、中立、開放的Linux 上游發行版社群及創新平臺。

龍蜥社群成立的短期目標是開發龍蜥作業系統(Anolis OS)作為 CentOS 停服後的應對方案,構建一個相容國際 Linux 主流廠商的社群發行版。中長期目標是探索打造一個面向未來的作業系統,建立統一的開源作業系統生態,孵化創新開源專案,繁榮開源生態。

目前, 龍蜥OS 8.4 已釋出,支援 X86_64 、Arm64、LoongArch 架構,完善適配飛騰、海光、兆芯、鯤鵬、龍芯等晶片,並提供全棧國密支援。

歡迎加入我們,一起打造面向未來的開源作業系統!



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70004278/viewspace-2853917/,如需轉載,請註明出處,否則將追究法律責任。

相關文章