山東機房運維:機房搬遷流程和注意事項
在機房運維過程中,最龐大的工程無外乎就是機房搬遷了,這種傷筋動骨的大動作,我們必須提前做好機房搬遷流程的梳理,提前做好預案。
數據中心搬遷/機房搬遷
一、 1、所有工作時間分為3個階段:搬遷前,搬遷中,搬遷后
搬遷前: 服務器在老機房運行階段,
搬遷中: 老機房停止服務,下架,運輸到新機房階段 搬遷后:服務器運送到新機房,
2、整個搬遷過程需考慮如下幾個方面: 機柜空間,網絡,硬件設備、操作系統、數據完整性,基礎服務,項目應用,搬遷流程 ,
機柜空間: 新舊機房機柜空間大小不同,需提前安排好服務器放置位置,
網絡: 老機房有4個網段,需全部正確切換到新機房,并對應上服務器所需網段,線上內網環境應保證不用任何改動,所有服務器上線后網絡自然接通,
硬件設備: 交換機、路由器、服務器硬件本身,存儲設備,應保證正常啟動,防止配置丟失導致啟動后重新配置等問題,
操作系統: 需提前做好檢測,防止操作系統不能啟動,
數據完整性: 需要保證數據完整,防止誤操作、物理損壞等造成數據丟失,
基礎服務: vpn,文件服務器等影響全局的基礎服務,需保證可以首先并正確啟動,
項目應用: 需保證項目按照相應順序以此正常啟動,主要要確保數據庫,緩存,消息隊列等基礎服務先啟動后,再啟動項目,
搬遷流程: 整個搬遷流程應責任到每個人,明確責任,盡量簡化人為操作,防止人為造成損失。
二、 搬遷前準備工作
1、 老機房工作
去老機房統計所有設備型號,U數 統計并確認所有機柜外網段使用情況 統計網絡設備位置信息,使用情況等保證硬件設備標簽完整、正確、識別性高,
根據上述信息,對所有硬件設備新增標簽,注明搬遷責任人、網卡使用情況、新機房機柜號等內容,便于搬遷時高效無誤的工作。
2、 新機房工作
運維所有員工逐次到新機房熟悉地形,防止因不熟悉地形,忙中出錯 所有機柜提前做好網線、電源線的準備工作,內網外網用不同顏色成品線區分,做到易識別。
臨時交換機上架,測試網絡連通性 測試每根網線連通性,每根電線連通性,保證上架時不是這些基礎小問題延誤工作 機柜貼標示,再次注明機柜同服務器關系,避免上架時混亂。
3、 遠程工作
統計所有nfs掛載情況,提前做好啟動自動掛載,
做好數據庫備份方案,各個項目主庫不能啟動應急方案 做好文件備份方案,提前備份nfs上項目文件,
做好基礎服務替代方案,配置好替換路由器等,防止線上路由器損壞,
所有應用、系統做好關停腳本 所有應用、系統做好啟動腳本 測試腳本使用效果,保證可靠性。
三、 搬遷過程中
1、 老機房
提前到機房,每個人確認負責服務器器,并熟悉位置,
確認每項前期準備工作是否已經到位,
凌晨一點,按照關閉順序,每個人登陸負責服務器執行關停腳本,關停所負責服務器,
通知機房技術人員,切換網絡到新機房,并由負責人測試新機房網絡連通效果,確保新機房網絡正常,
正常關閉并斷電后,下架服務器按照順序搬到樓下運輸車上。
2、 運輸過程中
數據庫服務器采用防震泡沫纏繞后裝車,
每個人負責自己的服務器不受大的震動,防止由于大震動導致服務器故障,不能啟動,
到新機房樓下,按照先后順序,依次進入新機房,原則上數據庫服務器和基礎服務服務器先進機房。
3、 搬遷到新機房后
每個人按照事先標識好的標簽上面的內容上架,接通網絡,接通電源 首先保證所有數據庫啟動,并檢查主從狀態等 剩余服務器確認電源、網絡都插好后,加電啟動
所有服務器啟動后,觀察機柜電流表是否有超電現象,
有超電現象的機柜和無超電現象服務器調換位置,進行電力平衡,
每個人登陸自己負責服務器,執行啟動腳本,依次啟動虛機,項目應用等 測試訪問情況,
訪問沒有問題以后,給測試人員打電話,走功能測試流程 通過后,結束等待訪問量上升后無問題,離開。