機房搬遷/遷移:整體方案、實施規劃、細則規範等參考 | 週末送資料

twt企業IT社群發表於2021-07-25

機房搬遷整體方案參考

(本文由yujin2010good分享)


搬遷我是專業的,我在公司呆了將近7年,機房從自建機房搬到租用機房,微軟雲搬到AWS,AWS搬到青雲,青雲搬到騰訊雲,現在又在繼續老機房搬到亦莊新機房。

一、目標

機房搬遷整體方案是為了平穩遷移所有業務,在有限的資源和有限的切換時間(甚至秒鐘級別時間內)完成搬遷(銀行、ATM之類的公司不能比,在不提供新資源或者提供基礎幾臺資源的情況下搬遷), 保證機房業務和資料能夠安全、可靠、快速的搬遷。

二、 背景

現今IDC跟10年前IDC不同,第一是數量開始增多,第二是價格下降,第三是很多公司使用公有云替換了IDC,當然也有使用公有云+IDC的公司。總之現在因為需求的不同,各種方案都有。(使用公有云替換自己租IDC的公司,主要考慮自己維護管理機房、採購伺服器、後期維保伺服器等不是專業的,專業的事交給專業的公司幹,將公司的精力集中到公司業務,當然關鍵的還能提升運維效率,如,一個專案立馬上線,如果普通中小企業無備用伺服器的情況下,就需要立即購買,可能會有選型、招標過程,這樣整個採購週期就很長,專案上線可能延遲。如果使用雲幾分鐘就完成任務)。

三、 遷移前的考慮

(其實這裡搬遷到雲上已經包含其中,當然有一些沒法搬遷的後面補充)

1、 機房標準:環境瞭解,機櫃位置瞭解,機房動環系統,pda插口是否滿足需求。

2、 一般租用的機房公司,他們是否給巡檢,是否有基本的上架,梳理線纜服務(實際工作中,上架、拉線、綁線很浪費時間,最後還不是很美觀。)

3、 機房專線進入是否方便,進園區是否收費,機房所在公司是否在收埠費用,埠費用有多貴?

4、 網路如何規劃,需要多少個接入交換機,路由器、防火牆,是否滿足高可用,是使用大二層還是3層網路?是使用基於單個主機冗餘(交換機浪費,但是適用於中小企業),還是基於整個機櫃甚至整排機櫃的冗餘?我們曾經的機房是基於主機冗餘(單臺主機雙網路卡繫結),現在新機房是使用基於機櫃冗餘(允許當機一個機櫃)

如果是公有云:考慮網路規劃、網段、安全組等基礎環境配置,然後考慮專線跟IDC打通。

四、 搬遷團隊(運維人員+開發+業務)

1、 是否僱傭專業搬遷公司,還是自己搬遷+僱傭車。原則上是重要裝置、高階儲存之類的裝置僱傭專業公司進行搬遷,普通x86伺服器,多節點的業務,自己搬遷即可。(可以節省很大的成本)

2、 一般情況下搬遷團隊是由公司運維部門擔任,當然一般搬遷都是公司大事,必須知會各個開發部門領導和產品,甚至開專門的動員會,這樣開發才會配合支援。

五、 原機房注意事項

1、 統計搬遷的資料:機器數量、分別每個機器的u數,分類搬遷。

2、 準備打包箱子、標籤紙、紮帶等

3、 小型機連結線務必輕拔輕放,包裝好。

4、 根據業務型別劃分搬遷次序,分配到責任人,責任人務必包含運維、開發、產品。比如:支付系統、營銷等

5、 識別特殊系統,比如:有停機先後順序的,帶儲存的,掛載有nfs的系統,帶狗的系統,有物理機授權等。

六、 針對每套系統具體方案編寫

1、 按照具體業務列出具體系統中的每個模組,如營銷系統中的優惠券、活動,採銷系統中的訂單、主資料等,越細越好。

2、 按照每套系統的每個模組編寫文件,內容包含原主機ip、部署內容、部署路徑或者目錄、快取ip、資料庫連線ip,zk地址等等,所有詳細資訊均要列出。

3、 與開發溝通編寫api部分模組,具體到呼叫介面和http介面,所有介面都要列出(後期用於驗證)

4、 網路層面許可權檢視,是否有特殊限制,比如分支機構或者分公司是否有許可權訪問。

5、 域名檢視,是否有公網。

6、 注意點:如tomcat是否有使用者限制,最好方式是將tomcat直接打包原路徑解壓。即使是平臺管理也可以這樣操作。

7、 資料庫連線檢視,是否有共用庫的情況,是否有大資料抽數,是否有其他特殊許可權。

七、 具體切換方案

1、 閘道器或者負載均衡按照原配置配置即可,後面切換dns即可。

2、 Web層大部分系統為基於網際網路的多web或者多模組系統,1:1部署即可,按照第六步統計結果進行部署即可。

3、 Redis、mysql、mongodb採用資料同步

4、 Es採用加入叢集同步資料方式,完成後把老機器踢出叢集。

5、 如果有Oracle,採用OGG或者DG同步到新機房,提前配置應用JDBC連結,當資料追平時,重啟應用即可生效。這步說來簡單,實際辦起來可能因為資料大小,或者每天產生的資料過多,會導致效能問題。當然還有一些其他的問題,細節上要注意,多想問題。

6、 最難的就是一些老系統,比如一些win系統,開發走了無人維護,甚至一些系統是購買的商業軟體,但是這個商業軟體公司已經倒閉。這種系統最麻煩,一般採用硬搬,當然要備份相應的資料。

7、 小型機和儲存搬遷也是麻煩事,注意上面拆除小型機,一些連線線要儲存好,儲存這個該買保險買保險。

八、 具體切換

1、 按照上面7個步驟該準備的準備,越細越好。

2、 提前將新環境部署好,只等待dba同步資料,等到資料同步完畢,每套系統按照具體的修改程式碼提交,釋出,連結到新機房的庫。

3、 資料庫檢查連結正常,即可驗證業務。

4、 產品通知業務一起驗證業務。

5、 回顧切換過程中的問題,形成總結文件。

九、 總結

以上幾點均是我在搬遷工作中形成的一些經驗,越細越不容易出問題,一般遷移切換選擇閒時進行,比如晚上或者半夜遷移切換,往往第二天早上因為一個配置疏忽造成業務受影響,所以重要系統,重要配置最好雙人檢核,避免出現事故。

遷移這個活對公司內部成員來說不是功勞苦勞,是應該幹好的,不出現問題是應該的,出現問題就要追責。一入運維深似海,萬年填坑填不平。


機房搬遷實施規劃方案

(本文由liwanqiu2232分享)


一、概述

機房的搬遷,一般都會涉及到伺服器、交換機、路由器等大量的裝置,很多軟體的問題,以及新IP的分配問題等。因而如果不提前進行詳細的規劃,匆匆上馬進行機房伺服器等裝置的搬遷,勢必會造成工作的混亂。所以在搬遷前,一個完整合理的機房搬遷規劃是必需的。

二、託管機房現狀

2.1 機房現網路拓撲圖(略)

2.2 機房現機櫃圖(略)

2.3 描述

由於3臺VMware虛擬化伺服器和一臺儲存的物理位置佔用市級平臺機櫃,收費伺服器外網出口為市級平臺外網出口,防止市級平臺伺服器機櫃有突然變動,或我方伺服器需要搬遷,建議將VMware虛擬化伺服器叢集搬遷至我方機櫃中,其中實體地址不需要做任何改動;收費伺服器外網出口變為我方公網地址,其中物理位置不需要進行改變。

三、託管機房搬遷後情況

3.1 搬遷後拓撲圖(略)

3.2 搬遷後機櫃圖(略)

3.3 描述

將VMware虛擬化平臺叢集併入到我方機櫃中,收費伺服器外網出口(含電信專線)併入到深信服防火牆中。其中VMware機群實體地址沿用原地址,收費伺服器在深信服防火牆中新建現用內網地址,將外網出口地址變更為我方外網地址。網路裝置放置於機櫃後端合理部位。

四、搬遷前準備工作

4.1 系統的檢測及備份

在搬遷以前,我們要針對現有的伺服器裝置進行一次全面的檢測工作,包括:硬體的配置的檢測和軟體資訊的檢測。準備工作要做的充分,這是保證搬遷工作能夠順利進行的首要條件。透過檢測我們不僅可以有效地把一部分隱患排除在搬遷之前,確保在搬遷過程中,機器裝置的故障率降到最低,從而避免在搬遷工程中的計劃外當機時間。

4.2 硬體裝置的檢測

針對伺服器的硬體裝置,我們將詳細的記錄伺服器的硬體配置資訊,在搬遷以前明確硬體配置,具有針對性地準備一些備件,在伺服器菪機的時候能夠及時的修復伺服器,及時的解決由於硬體故障產生的計劃外菪機,避免不必要的當機時間。

4.3 伺服器軟體應用的檢測

針對伺服器的軟體應用,我們同樣也要進行一些常規的檢測,把一些由於軟體問題產生當機時間減少到最低限度。從而使搬遷工作能夠順利進行。

4.4 資料的備份

資料的安全性在每個企業中都是至關重要,資料的丟失,不是以金錢來衡量的,所以資料備份在搬遷過程中顯得尤為重要,即使在搬遷過程中,真正遇到伺服器系統問題時,我們也能夠在最短的時間內解決問題,減少計劃外的當機時間。確保搬遷工作的順利進行這裡資料的備份,包括所有關鍵資料,如:作業系統、應用程式、資料庫、伺服器的配置引數、網路裝置的配置引數等。

4.5 對裝置進行分類統計

目前我們的託管機房設在二層,其中的裝置包括交換機、伺服器、防火牆、儲存裝置等,由於我們搬遷伺服器和儲存裝置,我們對於機房目前涉及的裝置統計表如下:

原有儲存裝置、伺服器確認,確定伺服器的數量,伺服器的型號等,並且在搬動伺服器之前必須有詳細的表格記錄。同時對SAN網路涉及的陣列、交換機也做一個詳細的記錄。

伺服器及儲存等裝置統計表

伺服器名稱 伺服器1埠 伺服器2埠 伺服器3埠 伺服器4埠

SAN交換機埠對照表

伺服器HBA 伺服器1FC1 伺服器1FC2 伺服器2FC1 伺服器2FC2 伺服器3FC1 伺服器3FC2

光纖交換機埠

五、各類裝置的搬遷

伺服器是網路資料的核心。對於伺服器這種整合度和精密度都非常高的計算機裝置,我們在進行安裝和解除安裝部件操作時,一定要格外小心。

5.1 搬遷時需要注意

正確關閉電源

對於一臺已經配置好的伺服器來說,它的關閉和開啟操作很簡單,但如果操作方法不當,有可能對裝置造成不必要的損壞。因此,有必要對伺服器的開機、關機做一詳細介紹。

關機操作:1.關閉作業系統;2.關閉主機電源;3.關閉外設電源 (如磁碟陣列,磁帶庫等);4.關閉其他裝置電源和機櫃電源;5.關閉總電源。

開機操作:1.開啟總電源;2.開啟計算機機櫃電源;3.開啟外部裝置電源(如磁碟陣列,磁帶庫等);4.待外部裝置自檢完成後,最後開啟主機電源。

5.2 搬遷裝置標籤

我們的目標是:掌握原有的網路情況,力求要做到每一條物理,邏輯的線纜,專線都心中有數,所有網路裝置的配置,每個介面都要一清二楚,所有裝置,線纜都要貼標籤,所有介面的配置,說明都要有文字上的說明。在給裝置做標籤時,一般是採用貼裝置銘牌的方式,線纜採用專用的標識環。

最後,對裝置標識完成後,注意做好標識的備份工作,以備裝置重灌時核查。

所有標示,做到一一對應,保證在搬遷過程中能夠準確的找到某一臺機器裝置,保證搬遷的順利進行。

六、裝置重新安裝

6.1、物理安裝

裝置搬運到新的機櫃後,首先確定裝置的放置位置,檢查電源等相關事宜是否做好,最後,進行物理連線。

這裡需要注意:

區域規劃。在裝置安裝時,最好按網路拓撲結構進行區域的規劃,併為以後的擴充套件保留空間和相關介面。

工程師按照安裝方案,根據安裝方案把伺服器上機架。嚴格遵守規範化操作,把伺服器安裝到指定位置。

(1)安裝導軌:安裝工程師把伺服器的導軌安裝到機櫃上的指定位置,以便伺服器上機櫃。

(2)安裝伺服器:安裝工程師把伺服器安裝到機櫃上的指定位置。

(3)安裝電源線:用電源線把伺服器於PDU連線,把電源線捆綁在配線架上。

(4)安裝SWICH:把SWICH固定在機櫃上的指定位置。

(5)連線資料線:連線SWICH到伺服器,連線網路線。

6.2、裝置加電系統核查

裝置物理連線完成後,為裝置加電,測試電源電壓,進行加電後系統的軟硬體檢查。

七、測試

裝置重新安裝後,我們接下來要做的工作是:開啟裝置,檢視資料是否損壞,並進行相關的軟體設定。一般來說,要進行的工作大致包括如下的幾項:

(1)伺服器狀態的恢復,檢視是否出現了資料的丟失或損壞。這裡由於我們之前對系統資料作了備份,所以,一旦出現了這種資料的損壞等,我們應該把搬遷前的資料重新恢復過來。

(2)進行全網裝置連通型的測試

(3)進行應用測試,確保系統的正常執行。包括2個方面:

  • 市級平臺的驗證,確保在搬遷裝置時候,沒有拔錯線和碰到市級平臺的線路

  • 搬遷後的應用測試,確認網路配置沒有問題。

(4)所有的裝置重新啟動,看裝置執行的速度和質量等指標是否達到標準。

(5)驗收並進行相關的日誌記錄。


機房遷移細則規範

(本文由聶奎甲分享)


機房整體遷移是弱電佈線專案中的一個重要環節, 為保證機房裝置能夠安全、可靠、快速的搬遷 ,特制定以下工作步驟、注意事項及需求。

一、 現場瞭解客戶需求,包括以下事項

1、甲方搬遷的目的地,包括瞭解起始地和目的地所在大廈的運輸路徑及貨梯執行時間。

2、搬遷的裝置都有哪些,是否需要專業人員配合。

二、 繪製搬遷前的機房佈局圖

1、 繪製完整的裝置鏈路圖。

三、 IT裝置接線(網路及外設)

1、特殊介面裝置連線線做介面連線線記錄,貼上標籤。

2、伺服器連線線路做標記,尤其是和磁碟櫃串列埠連線的線路,貼上標籤。

四、 製作標籤及貼標籤

1、如有磁碟櫃和可插拔磁碟都需要拔下來貼上上標籤並單獨打包放好。

五、 機房停機操作的順序

1、 待一切就緒後,由甲方將IT裝置停機斷電。

六、 IT裝置的卸櫃

1、所有連線線跟隨原裝置打包入箱。

2、所有卸下來的裝置必須單獨打包做標記(包括螺絲, 軌道)。

七、裝置的裝箱

1、卸下來的所有IT裝置必須用泡沫布包裝。

2輕拿輕放,打包好以後在箱子外面寫上同裝置標籤一樣的標示。

3所有打包裝置必須有一人來清點記錄。

八、IT裝置的搬運

1、搬運時每次跟隨一名工程師,以保裝置在搬運過程中不會發生裝置滑落。

九、IT裝置的裝車及運輸

1、所有裝置搬運到目的地以後清點對應記錄。

十、線路連線(包括裝置電源線)

1、所有裝置安裝好以後,檢查連線線是否連線原有埠。2:確認電源線已連線好,資料線路沒有因為理線造成鬆動或脫落。

十一、IT裝置 加電系統核查

1、確認所有IT裝置連線線正確,並保證裝置的電源連線線已插牢。

2、由對方IT來啟動所有IT裝置。

十二、測試、驗收

一:機房配電到位、機房接地

二:承重問題

三:裝置進機房之前先做保潔、並且門要到位

四:外線進入需和大廈物業洽談埠占用費

五:建議有備用硬碟

六:希望提供新機房機櫃裝置位置圖


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69994525/viewspace-2783128/,如需轉載,請註明出處,否則將追究法律責任。

相關文章