6.4 災難恢復運行維護服務過程要求
6.4 災難恢復運行維護服務過程要求
6.4.1 災難恢復運行維護服務內容
災難恢復運行維護服務包括日常運行維護服務和應急與災難恢復運行維護服務。
6.4.2 日常運行維護服務過程要求
6.4.2.1 日常運行維護服務內容
日常運行維護服務包括災難恢復系統的物理巡檢服務、健康檢查服務、監控服務、災難恢復信息系統資產管理服務、基準管理服務、數據驗證服務、系統驗證服務、桌面演練服務、模擬切換演練服務、真實切換演練服務和預案維護服務。
6.4.2.2 災難恢復系統的物理巡檢服務過程要求
物理巡檢服務是檢查承載災難恢復系統運行的物理設備狀態,包括各類指示燈、告警燈等,發現設備異常立即通知服務需求方,并協調設備廠商及時解決。物理巡檢服務過程要求如下:
a) 服務提供方應按照既定的巡檢頻率,在明確巡檢范圍和工作內容的前提下對物理設備進行巡檢;
b) 服務提供方應建立巡檢排班制度,確保各時段均有巡檢人員;
c) 巡檢人員應按標準的巡檢表做好巡檢記錄;
6.4.2.3 災難恢復系統健康檢查服務過程要求
為及時發現災難恢復系統的系統錯誤,應定期對災難恢復系統進行健康檢查,確保系統的性能和容量滿足災難恢復系統的運行要求。系統健康檢查的服務過程要求如下:
a) 服務提供方應按照既定的頻率定期對系統進行健康檢查;
b) 在服務需求方的授權下,服務提供方應按照服務需求方分配的系統管理員賬號登錄系統進行健康檢查;
c) 服務提供方應針對不同的系統制定標準的系統檢查表,并在檢查過程中應做好記錄,檢查結束后應向服務需求方提交系統檢查報告;
6.4.2.4 系統監控服務過程要求
通過系統監控平臺對災難恢復系統的運行狀態進行監控,及時發現災難恢復系統運行過程中存在的性能和容量問題,系統監控服務過程要求如下:
a) 服務提供方應使用監控工具發現系統的安全性事件,收集并處理來自不同系統的事件和報警信息;
b) 服務提供方應通過對災難恢復系統資源的監控,盡早發現系統資源的容量瓶頸或者潛在問題;
c) 服務提供方應依據監控平臺的功能對災難恢復中心的信息系統的性能進行實時監控,及時發現潛在的系統性能問題;
6.4.2.5 信息系統資產管理服務過程要求
建立生產中心與災難恢復中心統一的資產配置庫,確保資產標識的規范性和唯一性、資產維護的有效性和資產變更的及時性,信息技術資產管理服務過程要求如下:
a) 服務提供方應協助服務需求方梳理災難恢復中心的信息技術資產,建立資產配置庫;
b) 服務提供方應及時響應生產中的資產變更,同步更新災難恢復中心的資產配置;
6.4.2.6 基準管理服務過程要求
為確保災難恢復系統能夠在災難發生時接管生產系統運行,應建立生產中心與災難恢復中心的資源配置基準,并進行維護,確保兩端基準的一致性和完整性。基準管理服務過程要求如下:
a) 服務提供方應依據信息系統的類型和用途,配合用戶梳理各類信息系統的軟硬件配置信息,并建立標準規范的基準文件;
b) 服務提供方應協助服務需求方建立基準維護策略,定期進行基準核對,保證災難恢復系統與生產系統的基準的一致性;
c) 服務提供方應如實、準確、完整地基準變更記錄,詳細記錄變更內容;
6.4.2.7 數據驗證服務過程要求
為確保生產系統與災難恢復系統業務數據的一致性、完整性和可用性,應定期進行數據驗證工作。數據驗證服務過程要求如下:
a) 服務提供方應依據數據復制/備份技術要求,制定數據驗證方案,包括數據驗證策略、驗證工具、驗證周期和驗證標準;
6.4.2.8 系統驗證服務過程要求
為確保災難恢復系統能接管生產系統運行,應定期進行系統驗證工作。系統驗證服務過程要求如下:
a) 服務提供方應制定詳細的系統驗證方案,明確驗證范圍、驗證計劃、驗證環境、驗證方法和驗證標準等;
6.4.2.9 桌面演練服務過程要求
為確保服務需求方的相關人員了解災難恢復預案的內容和職責,應通過桌面推演的方式對預案中的災難恢復流程進行培訓和演練。桌面演練服務過程要求如下:
a) 服務提供方應基于災難恢復預案,編寫桌面演練文檔,包括:桌面演練方案、演練培訓材料、演練流程控制表、演練流程及責任機制、演練職責說明等;
b) 服務提供方應委派災難恢復方面的專家作為桌面推演的主持人,控制演練的流程,指導演練工作開展;
c) 服務提供方應委派專人對桌面演練過程進行全程記錄,并進行分析和評估;
6.4.2.10 模擬切換演練服務過程要求
為確保信息系統切換技術滿足災難恢復預案要求和應用系統的災難恢復指標,應通過模擬切換演練的方式對預案中的災難恢復技術進行驗證。模擬切換演練服務過程要求如下:
a) 服務提供方應基于災難恢復預案,制定詳細的模擬切換演練方案,包括切換步驟、系統切換技術、數據復制技術、業務驗證方式等;
b) 服務提供方應協助服務需求方準備演練數據,并在演練結束后刪除演練數據;
c) 服務提供方應依據服務需求方業務部門的業務驗證案例及相關要求,進行業務驗證;
6.4.2.11 真實切換演練服務過程要求
在桌面演練和模擬切換演練的基礎上,基于特定的災難場景,按照場景預案中的流程要求,進行真實切換演練,真實切換演練時將服務需求方的部分或全部應用系統切換到災難恢復中心運行一段時間,驗證災難恢復系統是否可以接替生產系統運行,然后再將災難恢復系統回切到生產系統,并退回到切換前的狀態。真實切換演練服務過程要求如下:
a) 服務提供方應基于災難恢復預案,編制真實切換演練文檔,包括演練的場景分析、災備環境分析、演練計劃、演練流程、演練組織管理、演練技術方案、演練操作手冊等;
b) 服務提供方應在真實切換演練前對參演人員進行動員和培訓,確保演練人員明確各自職責和整個演練流程;
c) 服務提供方應協助服務需求方對災難恢復系統的運行狀態和資源進行確認,保證災難恢復系統能繼續支撐業務系統運行;
6.4.2.12 預案維護服務過程要求
針對演練發現預案中的問題以及系統變更對預案修訂的要求,需要對預案進行及時修訂和完善,采用生命周期管理方法進行預案維護工作,預案維護服務過程要求如下:
a) 服務提供方應協助服務需求方建立災難恢復預案管理制度和流程,對預案的開發、版本控制、修訂、審批、頒發、歸檔、廢止、銷毀進行全過程規范化管理;
6.4.3 應急與災難恢復服務過程要求
6.4.3.1 應急與災難恢復服務內容
應急與災難恢復服務是在災難發生時,服務提供方按照預定的應急流程,并在接到服務需求方的切換指令后接管啟用災難恢復系統,并接管生產系統運行,并當生產系統修復后,進行災難回切,恢復到災難發生前的狀態的全部服務活動。
6.4.3.2 突發事件的發現與初始響應服務過程要求
服務提供方應依據GB/T 20985.1規定的事件管理要求對突發事件進行管理,事件發現和初始響應的主要目標是及時發現危害信息系統正常運行的突發事件,及時評估、判斷和確定突發事件性質和級別,并根據預定策略啟動日常事件處理流程或應急響應預案,及時進行搶修和搶救工作,使事件影響降到最低。突發事件的發現與初始響應服務過程要求如下:
a) 服務提供方應協助服務需求方根據突發事件的影響范圍、持續時間和事件性質等因素判斷災難事件的等級,并按照不同等級的通知流程及時上報;
b) 服務提供方應按照場景預案的要求,對災難事件進行初始響應;
6.4.3.3 災難恢復啟動服務過程要求
服務提供方在災難恢復啟動服務過程中應提供以下服務:
a) 服務提供方應提供災難恢復中心數據驗證和系統驗證服務;
b) 服務提供方應通知服務需求方協調相關業務部門進行業務數據備份,避免操作過程中造成業務數據丟失或損壞;
c) 服務提供方應對各類災備技術等進行驗證,避免災難恢復過程出現技術缺陷;
d) 服務提供方應檢查災難恢復中心的廣域網線路連通性和端口流量;
e) 對于檢查和驗證過程中發現的問題應及時上報;
6.4.3.4 災難恢復切換實施服務過程要求
服務提供方在災難恢復系統切換實施服務過程中應提供以下服務:
a) 服務提供方應按照恢復預案或實施方案中的流程和步驟實施災難恢復操作;
b) 服務提供方應委派專人實施災難恢復,確保實施過程中的故障得到及時解決;
c) 當災難恢復啟動失敗,并需要回退流程時,服務提供方應先組織業務部門進行回退的業務驗證,確保業務已回退到系統實施前的狀態,再進行系統回退操作,回退操作完成后編寫系統回退實施總結報告,詳細描述系統回退手段和回退結果;
6.4.3.5 災難恢復系統回切與生產系統重續運行服務過程要求
服務提供方在災難恢復系統回切與生產系統重續運行服務過程中應提供以下服務:
a) 服務提供方應在災難恢復數據與生產數據一致的前提下,組織相關廠商完成系統回切工作;
b) 服務提供方應驗證系統回切后的數據一致性和完整性;
c) 服務提供方應啟動生產系統,并重新建立數據復制/備份環境;
6.4.3.6 災難恢復工作總結服務過程要求
服務提供方在災難恢復工作總結服務過程中應提供以下服務:
a) 服務提供方應整理并歸檔災難恢復過程記錄,客觀、務實地編寫災難恢復總結報告;
6.4.4 災難恢復能力持續改進服務過程要求
為確保服務需求方的災難恢復能力得到不斷提升,服務提供方應在運行維護服務過程中為服務需求方提供災難恢復服務能力評估,并能依據服務需求方的信息系統和信息技術架構變化進行定期評估,以確保服務需求方的災難恢復系統得以持續改進,災難恢復能力持續改進服務過程要求如下:
a) 服務提供方應每年對服務需求方的災難恢復系統進行能力評估,找出技術和管理的脆弱點,并提出改進建議;
b) 服務提供方應按照生命周期法對災難恢復系統規劃設計、建設實施和運行維護各個階段進行評估,發現問題,并提出解決方案;
c) 服務提供方應建立規范標準的評估模型和指標體系,并依據信息系統的災難恢復需求建立評估基線,對現有災難恢復系統進行差距評估;
GB/T 36957-2018 信息安全技術 災難恢復服務要求
推薦文章: