中國速度之二神山建設(4):全能運維,召之即來,來之即戰

DevOps訂閱號發表於2020-04-01

內容來源:DevOps案例深度研究第4期 – 火神山雷神山 DevOps實踐研究戰隊(本文只展示部分PPT及研究成果,全程影片請移步文末)
本案例內容貢獻者:賴澤薇、張揚、鄧茜芸、韋一、劉德權、候利濤、馮利娟、常相宇、張力、韓豐、陳浩 
IDCF指導老師:王立傑、許舟平、姚冬、徐磊
中國速度之二神山建設(4):全能運維,召之即來,來之即戰
(圖片來源於網路)

一、中國速度,為瀑布站臺


我們看一下火神山雷神山建設的整體過程,它是典型的瀑布模式。主要體現在階段定義清晰、順序序列開展,前期規劃驅動,交接棒式進行,上一個階段的輸出是下一個階段的輸入。由於前期在時間、範圍和成本方面做了強力的約束,那麼在進行中不接受變化,因為變更代價巨大。

在上世紀60年代軟體危機爆發之後,軟體行業繼續找到一種科學體系化的方法來進行軟體開發,最早的瀑布模型就是來自於工業製造和建築建造的模式。


中國速度之二神山建設(4):全能運維,召之即來,來之即戰
但是為什麼在我們的軟體領域,要從起初瀑布模式往敏捷模式演進?因為軟體開發不確定性更多,需要快速應對變化的需求,業界對研發模式方面也在不斷地探索,如何提升效率、提高軟體質量。常見的幾個模型有瀑布、螺旋、迭代、敏捷。
中國速度之二神山建設(4):全能運維,召之即來,來之即戰
其特點主要表現為:


  • 瀑布式開發:順序開展、文件驅動。要求每一個環節的工作儘可能充分討論、論證,減少施工風險,減少返工。
  • 螺旋開發:開始將瀑布開發的模式進行粒度的拆分,將整個開發過程劃分為一個個階段,在每個階段引入風險分析。它是風險驅動的方法體系,在每個階段之前,都必須進行風險評估,使軟體在無法排除重大風險時有機會停止,以減小損失。但螺旋開發更傾向於是增量開發方式,它將整個軟體功能的開發拆分為多個可控的階段,最終的軟體交付還是在最後一步。
  • 迭代式開發:在螺旋開發之上出現了先保證能用,再想辦法讓它好用。不要求每一個階段的任務做的都是做到盡善盡美,而是根據優先順序來交付高價值的功能。以最短的時間構建一個 MVP,交付給客戶之後,再透過客戶或使用者的反饋,逐步進行完善。 
  • Scrum框架:是一個包含增量和迭代的框架。強調固定週期、固定節奏、強調團隊協作,強調質量、強調成果可釋出,能快速被驗證。


那麼我們如何選擇這些模型和框架?
中國速度之二神山建設(4):全能運維,召之即來,來之即戰
其實對於簡單域,我們更推薦瀑布模式。因為需求明確、範圍清晰、週期確定的情況下,瀑布也可以很快。只需要強有力的執行計劃、不斷提升技術,自動化一切,有效的溝通,團隊賦能就可做到快速交付,而無需反覆驗證確認。
但是有個問題是,軟體開發往往是一個繁雜或者複雜的過程,因為需求是不斷變化的。尤其是對於創新型的業務應用,在一開始的時候只是一個商業想法,構建業務應用也是為了快速驗證這個想法是否可行,這是一個不斷假設和驗證的過程。在這樣的場景下,敏捷模式是更合適的。
中國速度之二神山建設(4):全能運維,召之即來,來之即戰
其實我們很多人都忽略了敏捷宣言的最後一句話,往往最後一句話也是最重要的。這句話是“也就是說,儘管右項有其價值,我們更重視左項的價值。” 它想表達的是儘管瀑布價值有其價值,但是我們更重視敏捷開發的價值,這是一種價值觀的取捨。所以很多時候瀑布和敏捷會存在融合。
從火神山雷神山醫院的建設來看,在整體上很多專案不得不以瀑布計劃的方式進行,核心是減小瀑布模型的粒度,採用敏捷開發的優秀實踐方式,提高開發的溝通效率。




二、中國速度,中國質量


從早期豐田的精益生產系統,一直到目前流行的DevOps理論框架,關於專案質量管理的方法論有很多種。在這裡,我將這些歷史的和現存的各種質量管理的核心思想抽象並概括為“質量內建三部曲”,即:
從“做正確的事”,到“正確地做事”,再到“最小的質量成本”。
從專案生命週期的維度,按照質量內建的原則,分別從設計、實施、驗收和運維這四個階段進行質量管理和控制。
中國速度之二神山建設(4):全能運維,召之即來,來之即戰



三、全能運維,召之即來,來之即戰


中國速度之二神山建設(4):全能運維,召之即來,來之即戰
兩座醫院的醫療團隊組建起來了,是不是就可以按部就班開展救治,就萬事大吉了?很顯然並不是,等待醫療團隊來解決的困難還有一大把呢,我們這裡列出了醫療團隊在接手救治的過程中面臨的四個方面的主要困難。


  • 一是業務非常緊急,但是醫院的交付卻談不上多麼完整。多個支援雷神山的醫療團隊在接手病區後發現,等待他們的幾乎都是空空如也的病房。醫護人員要讓病房工作起來,需要自己先動手到各處尋找、搬運、安裝和現場除錯眾多裝置。這就相當於既要當好運維,還得幫開發擦屁股收拾殘局。
  • 二是業務型別全新,但是培訓卻談不上多麼充分。兩家醫院的醫療團隊成員本職專長業務千差萬別,在疫情的緊急要求下,卻都需要在極短時間內完成新冠肺炎診治這項新業務的培訓熟悉,然後立即投入到實際運維工作中。
  • 三是團隊都是臨時組建,投入實際診治工作之前缺乏必要的磨合。由於各個醫療團隊都是來自多個地方的人員臨時組建而成,收治工作過程中的所有配合與協作,都是從零開始,這對所有運維人員的業務素養和團隊配合能力都提出了極高的要求。
  • 四是疫情嚴重,醫護人員本身處在一線,被傳染的風險極高。這就要求全體醫護人員在開展收治工作的過程中,必須千方百計做好充分的自身防護。


火神山和雷神山兩座醫院,在短時間內彙集了來自全國各地的軍隊和地方醫護人員,他們克服重重困難,開足馬力收治新冠肺炎患者,快速將兩座醫院的效能發揮到最大程度,成為了此次重大疫情防控戰鬥的中流砥柱。這些醫護人員面臨的任務艱難程度是前所未有的,但是他們的實際表現卻足以令我們所有人刮目相看。從這個意義上來說,他們絕對稱得上是全能型的運維團隊。
中國速度之二神山建設(4):全能運維,召之即來,來之即戰
東方紅,太陽昇,春天就要來到武漢城。當我們在這裡坐而論道,侃侃而談的時候,前方傳來好訊息,截至目前,火神山和雷神山兩座醫院的醫護團隊,全都是0感染!距離戰役結束雙0感染的目標,我們又近了一步!(注:本文成文時間 2020年3月15日)


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31558019/viewspace-2683922/,如需轉載,請註明出處,否則將追究法律責任。

相關文章