我的運維故事

bh267940發表於2021-03-06

  做了這些年的運維,或多或少有些感悟,有成功時的喜悅,有失敗時的傷感;多多少少有些學習的經驗與工具;分享共勉。

  記得第一份工作崗位的名稱比較奇怪,叫EDP,可能是電子資料處理吧;開始接觸SQL server的資料庫,伺服器用的是IBM AS400。那時候和大多數剛剛畢業的人一樣,跟著前輩進行“傳幫帶”的學習,也就把一些日常的操作告訴你。記得同事問我,會做水晶頭嗎?第一次看到壓線鉗原來長得是這樣,測線儀是這樣用。至今能記得顏色的位置,還保留著這個測線儀。學校裡的那些知識根本不夠用,比較慶幸的是那時候可以google;用的是“網文快捕”做筆記,當然是破解的。同事都是年輕人,抽幾根菸,喝幾次酒就是兄弟了;沒有事情就和他們跑機房、搞弱電、弄弄無盤終端,真的漲了很多見識。新人嘛,哪裡需要去哪裡。那些知識真的太實用了,現在都用的上。

  後來搞起了oracle、AIX,也就是從這裡開始科班出身就顯得比較重要了。正規化、叉樹等等都來了,這些理論使後面的學習輕鬆起來了。看到別人用mindmanager覺得不用收集別人的網頁了,可以開拓真正的自己筆記了。那時候也到chinaunix釋出了幾篇博文,可惜沒有堅持住,或許那些檔案的含金量太少沒有被大家認可,自己也失去了興趣。這段時間我認為是自己提升最快的時候,有環境可以試驗,有個大拿在背後解惑,爽啊;可惜的是錯過了2010年(可能是那年)oracle有個OCM人才培訓計劃,沒有和同事一起參加,2人都過了,後悔終生吶,不就1W多嘛,有機會去考個實用的技能證照。記得那時的領導是個勇於創新的人,帶來我們搞OA、MAIL、安全裝置、甚至ERP,籤採購合同送了很多原廠培訓;現在回想起來,我們部門索取的太多(那些都是真金白銀買的),而帶來的價值沒有顯現出來。這個ERP選型用了一年半時間,大到SAP,小到天心,招標招了2次,確定了一個國內知名軟體;之後專門買了新裝置,建了培訓室、辦公室,組織了專案組專職/兼職人集中辦公;可惜我沒有支援到ERP的驗收。大概在交付前1個月我閃人了,或許當時太沖動了,心裡一直擔心著這個專案會失敗,資料會混亂不堪,我是怕了,當了逃兵。可是後來,這個專案還是一直在用,據說好不錯。想想後悔了,真應該堅持等到erp上線後用一段時間,至少簡歷可以寫寫熟悉ERP管理,而非什麼選型實施了。

  換了工作後,還沒有轉正就到一個新部門,是個網際網路專案;對於一個外援來說真是幸運,如果有想跳槽的朋友,好好考慮,不只是錢的問題。這個只有10人不到的團隊,起初讓我有個創業團隊的感覺,產品規劃、程式碼review、上線部署計劃都是在老大的帶領下全員參與;也就這時候,我知道作為一個it技術人員能知道或者理解產品業務規劃是多麼的重要,首先是溝通無障礙,再者開發設計更貼切,最後的維護反饋更準確。

  前1年多,整個在吃老本,除了賺點經驗值外,技術收穫很少,這可能是個學習到實踐再學習的過程;記得第一年要過年了,隨著業務發展,使用者馬上要過20W了(5W活躍使用者),系統負載已經極限了,那個擔心啊,只有3臺機架server,這個年怎麼過啊,改造、最佳化各種都來,抗了過來,抗壓值直線上升。到我走的時候(對,我又跳了,原因很多,那可是我認真付出的5年),使用者總數1.8億(日活躍2kW),物理機500多,分佈在3個IDC,已經健康穩定很多了。

  能力的提升在後幾年,做管理了,建立了幾個人的團隊;在爆炸式的業務增長面前,精力全投入到了系統整合上了。建議書,可研報告,實施方案一遍一遍的寫,平均一年一期的整合節奏,深深體會到了初稿到終稿的艱辛;不斷引入新技術,快取、分散式、虛擬化、讀寫分離,oracle遷移到mysql,後面就炒各種概念IASS、PASS、SASS、各種雲等等。這段時間我犯了致命的錯誤,走入了假大空的道路,規劃是美好的,往往由於對技術的把握不夠、成熟度、風險等因素導致設計願景被推到下一期建設目標中,到現在資料庫遷移還沒有做成;透過這些大大小小的評審會,知道了高層一般思維模式,尤其在與介面人的接觸中,學習到了很多,逐步建立了自己做事的原則,是的,原則、紅線。其中有兩期比較大的專案,200多臺裝置,從上架到交付,只用20多天;天天是計劃、溝通、協調、核驗的事情,時間緊任務重;有點遺憾是,沒有與網路廠商一起搞,每次都想下一期跟著,導致現在只能做一些普通網路交流與設計,機會不等人,不知道下次有沒有機會了;另外一個技術就缺少一門真正的語言用於運維開發,perl做整合差了一點,所有需要在學習Python,來實現自己的想法。

  接下來就是如何管理這些機器的事情了,有困難找領導,走,找領導去,此時發現我們已經很久沒有溝透過了(他是空中飛人,我不是在機房就是在機房的途中),時間都去哪裡了?平時沒有時間去溝通嗎?記住,有事無事向領導彙報哦。幾次交談,得到了領導對工作的肯定,平臺鮮有故障了,公司的人都忘記運維的存在了,現在還在靠人管理嗎?是啊,維護的價值僅僅在於建設系統,保障系統嗎?從那時起,明白了,需要顯現運維的價值。建設各種系統,監控、部署、知識、論壇等等。但是完成後我沒有絲毫的成就感,而是無力感。應用越來愈多,系統越來越複雜,技術越來越先進,可是還是感覺很累,心累的那種感覺。不知道問題出在哪裡?

  再後來,沒有後來了,隨著第一個隊友離開(上下爭取了很久),我知道這個5年沒有離職記錄的團隊散了,還會有第二個第三個;這裡我也有責任,隊友們被我慣壞了,團隊建設在初期可人治,但後期需進行法治。6個月後某某專案結束,我也離開了;走的問心無愧,對得起任何人。原因太多,多說無益。這個戰鬥過的地方,留下了回憶,也留下了我的遺憾和疑問。

  傷感的話題不說了,我的問題還沒有解決了。心靜下來,這次機會再次眷顧了我,要人有人,要環境有環境,要規模有規模,可謂天時地利與人和,可以完成自己的夙願。這些年下來,技術在退化,不google可能出來不了具體問題了,所以自己定位類似專案經理、架構師的角色,促使團隊與運維中心的共同建成。

  寫累了,後面具體規劃就不贅述了,敬請期待我的部落格吧。

  先框架,再細節;

  提供服務;

  能力輸出;

  以業務角度分析系統狀態;

  資源整合;

  流程控制;

  知識技術共享(顯性);

  團隊建設;

  分析;

  工具不是關鍵,是如何用好工具;

  先闡述問題,再解決問題


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69976869/viewspace-2761548/,如需轉載,請註明出處,否則將追究法律責任。

相關文章