政府網站異地容災方案
發(fā)布時間:2020-11-02 來源: 實習報告 點擊:
政府 網站 異地容 災
方案建議書
日期 (Date):
2012.07.01 版本 (Version):
V.01
版權聲明
XXX 有限公司是一家提供全面網 XXX 全解決方案的咨詢與服務為主的高科技企業(yè),為中國廣大的行業(yè)用戶提供具有國際標準(如 ISO17799、ISO15408,SSE-CMM,BS7799 等)的網 XXX 全全面解決方案及咨詢服務,并向客戶提供全面安全解決方案中所需的各項安全工具,及提供安全解決方案管理所需的管理決策平臺、安全咨詢、教育培訓以及卓越的售后服務。
XXX 有限公司保留此文檔的所有電子、紙張類文件資料和相關軟件等的所有版權。任何單位和個人未經許可不得復制、轉載或用于任何商業(yè)目的。
一、前言 ............................................................................................................................................................ - 4 -
政府安全運營保障解決方案背景 ..................................................................................................................... - 4 -
政府網站重要性 ......................................................................................................................................... - 4 -
政府網站特點 ............................................................................................................................................. - 4 -
當前政府網站面臨的挑戰(zhàn) ......................................................................................................................... - 4 -
二、需求分析 ..................................................................................................................................................... - 6 -
三、業(yè)務連續(xù)性/容災系統(tǒng)概述 ....................................................................................................................... - 6 -
3.1 業(yè)務連續(xù)性/容災系統(tǒng)概述 ................................................................................................................ - 6 -
3.2 業(yè)務連續(xù)性/容災的重要意義 ............................................................................................................ - 6 -
四、異地容災系統(tǒng)設計方案 ............................................................................................................................. - 7 -
4.1 設計思想 .............................................................................................................................................. - 7 -
4.2 設計目標 .............................................................................................................................................. - 7 -
4.3 設計原則 .............................................................................................................................................. - 7 -
4.4 設計優(yōu)勢 .............................................................................................................................................. - 8 -
4.4.1 自運營 IDC 數據中心 ............................................................................................................... - 8 -
4.4.2 ‘操作系統(tǒng)+應用+數據‘的完全保護 .......................................................................................... - 9 -
4.4.3 易于恢復測試 ......................................................................................................................... - 10 -
4.4.4 快速故障切換 ......................................................................................................................... - 10 -
4.4.5 災備架構 ................................................................................................................................. - 11 -
4.4.6 DNS 智能解析服務 .................................................................................................................. - 12 -
五、災備系統(tǒng)管理 ........................................................................................................................................... - 12 -
5.1 組織人員進行管理 ............................................................................................................................ - 12 -
5.2 定期檢查災備數據復制情況 ............................................................................................................. - 12 -
5.3 定期檢查生產中心備份情況 ............................................................................................................ - 12 -
5.4 數據恢復管理 .................................................................................................................................... - 12 -
5.5 數據恢復的周期性演練制度 ............................................................................................................ - 13 -
六、項目售后服務體系 ................................................................................................................................... - 15 -
6.1 總體目標 ............................................................................................................................................ - 15 -
6.2 運行維護計劃 .................................................................................................................................... - 15 -
6.3 責任及承諾 ........................................................................................................................................ - 16 -
七、項目預算 ................................................................................................................................................... - 17 -
一、 前言
政府安全運營保障解決方案背景
政府網站重要性
《中華人民共和國政府信息公開條例》(以下簡稱“條例”)正式頒布,并將于 2008 年 5 月 1 日起施行,該條例對深化行政管理體制改革,推進政務公開等工作將產生深遠的影響。
為加強政府網站建設,面向社會公眾宣傳政府網站功能,切實提高網站服務的實用性,國務院信息化工作辦公室于 2007 年 8 月起在全國范圍內開展政府網站“百件實事網上辦”活動。
政府網站已成為政府電子政務對外服務窗口和發(fā)展的主要趨勢,有利于各種信息和資源的整合,為政府與社會公眾之間加強聯(lián)系和溝通的有效載體。越來越多的政府職能部門已經開始利用網絡的優(yōu)勢,在網上對政府事務進行更高效的管理,從而使政府工作可以更快速、更便捷、更有效地開展。
? 政府網站是權威的具有公信力的信息發(fā)布窗口 ? 政府網站是提高執(zhí)政能力的重要體現(xiàn) ? 政府網站是電子政務績效水平的展示窗口
政府網站特點
? 網站中有大量的時政新聞、政策法規(guī)、新聞圖片等信息,內容權威。
? 網站訪問隨著時事事件的發(fā)生,忽高忽低,為網站運行維護帶來難題。
? 同時政府為進一步規(guī)范政府網站建設、運行和管理,增強政府網站的服務功能,推進政務公開、提高行政效率,網站中也普遍加入例如民意反饋、民意征集、意見建議等在線互動的功能,在線服務的速度難以保證。
? 隨著互聯(lián)網的發(fā)展,越來越多的政府類網站都應用了視音頻內容的在線直播、點播,能夠及時的將民眾關心的各種新聞事件直觀的傳遞給網民,同時流媒體的內容也加重了網站的帶寬和設備負載。
當前政府網站面臨的挑戰(zhàn)
隨著電子政務向縱深發(fā)展,我國政務網站服務性增強,特色鮮明,因而得到了廣大網民響應,越來越多網民通過網絡了解國家的政策、地方的法規(guī),通過網絡向政府、部委反映自己的想法、困難等多方面內容,亦使得各個階層的領導能夠直接聽到百姓的聲音,想百姓所想,做百姓真正關心的事情。并且隨著基礎網絡改善,多種電子政務的得到廣泛應用,如:政務信息上網、公共信息服務、在線查詢檢索服務、個人企業(yè)網上辦事、互動交流等,使得工作效率大幅度提高。
無法預知的IT硬件設備的損壞、斷電、火災、自然災害、恐怖襲擊等,造成數據丟失或業(yè)務的
突然中斷;
系統(tǒng)人員誤操作造成意外宕機或關鍵數據丟失,無法避免;
手段頻多的黑客攻擊、病毒入侵、垃圾郵件、網絡與系統(tǒng)的漏洞,造成網絡癱瘓、系統(tǒng)崩潰。
由此可見,保證政府門戶網站的業(yè)務連續(xù)運營性,已成為在建設 IT 基礎架構中首先要考慮的問題。與此同時,我們需要考慮建立和加強業(yè)務恢復計劃,以便在發(fā)生系統(tǒng)災難后能夠從容應對風險。
本項目計劃既著眼于提出合適的解決方案,藉以最大化消弭政府網站宕機故障的業(yè)務風險、保障核心業(yè)務的正常運行、創(chuàng)造更高的商業(yè)價值。
二 、 需求分析
政府網站要對來自不同 ISP 來源的用戶訪問以及自身網站構架達到的要求:
對來自不同運營商的客戶訪問速度都要保證更加快速、穩(wěn)定、不間斷的提供服務
需保證自身網站與存儲系統(tǒng)的高可用性,保證數據7X24小時的連續(xù)訪問, 一旦發(fā)生自然或者人為的災難等導致數據丟失或者業(yè)務中斷時,能夠快速、及時地恢復數據,保證業(yè)務的連續(xù)運行
因故障事件延宕修護,網站系統(tǒng)無法訪問,導致政府聲譽的影響降到最低。
基于法律法規(guī)或業(yè)務策略,需建立重要系統(tǒng)的異地災備中心。
三 、 業(yè)務連續(xù)性/ / 容災系統(tǒng)概述
3 3 .1 業(yè)務連續(xù)性/ / 容災系統(tǒng)概述
由于各類政府網上辦事系統(tǒng)高度依賴于網站,并會因網站的各種突發(fā)問題而對政府網站及相關業(yè)務系統(tǒng)產生很大影響,這些問題包括了系統(tǒng)檢修和升級帶來長時間的系統(tǒng)停機等原因。所以對于災備系統(tǒng)的建設工作成為基礎架構規(guī)劃必不可少的一部分。
(圖):各種故障對網絡影響比例以及處理方法實例圖
3 3 .2 業(yè)務連續(xù)性/ / 容災的重要意義
在突發(fā)性災難面前,政府網站的確是非常脆弱的。當越來越多的網民習慣利用網絡進行事務性操作時,任何關鍵信息系統(tǒng)運轉的中斷或者數據的丟失都將導致不可估量的損失與形象影響。
災備建設為政府網站帶來的收益:
提高災難應對能力;
減少災難或事故導致的社會性影響與經濟損失
減少災難對政府業(yè)務的影響
滿足國家法規(guī)如等級保護的信息安全相關要求
四 、 異地 容災系統(tǒng) 設計方案
4 4 .1
設計思想
異地災備方案設計之設計思想,
基于現(xiàn)狀;全面研究現(xiàn)有網絡架構不改變現(xiàn)有網絡架構的基礎上實現(xiàn)。
統(tǒng)一設計:深入研究網絡現(xiàn)狀和未來發(fā)展,搭建穩(wěn)定、可靠、可擴展的災備系統(tǒng),避免重復建設。
關注業(yè)務:災備方案的根本目標在于為業(yè)務的高效運行服務,因此,災備方案在設計時,要時刻研究業(yè)務部署特點、業(yè)務運行特點、業(yè)務發(fā)展特點,要考慮到未來業(yè)務的部署和發(fā)展。
引領前沿:設計方案要保持在技術前沿,盡量使用目前成熟、高效的產品,解決方案,保持一次建設長久使用。
4 4 .2 設計目標
異地容災方案設計之遵循目標:
多點災備,避免原網站單點故障時導致業(yè)務中斷 實現(xiàn)高可用。
利用XXX金橋IDC機房雙線接入之優(yōu)勢實現(xiàn)來自不同地域、運營商的用戶(電信,網通等)訪問最快的接入點,避免單一網絡延遲。
災備中心可作為網站的訪問負載中心分支從而減輕服務器的負載,加快服務器的響應時間。
4.3 設計原則
異地容災方案設計之遵循原則
實用性:針對當前網絡現(xiàn)狀、硬件條件、維護人員技術水平等,提出實用的網站災備解決方案;
可靠性:災備的對象是承載關鍵行業(yè)業(yè)務的網絡,要滿足生產網絡的可靠性要求,要滿足長時間運行特殊要求;
規(guī)范性:基于國際標準、成熟技術、以及行業(yè)網絡管理規(guī)范,做到規(guī)范、標準,盡量避免個性化的手段;
兼容性:兼顧網絡設備現(xiàn)狀,IDC機房的接口現(xiàn)狀,盡可能兼容當前的設備、接口、平臺;
可維護性:盡量考慮運維現(xiàn)狀,采用主流產品,易于安裝和管理,減少復雜程度,減少維護工作,適應行業(yè)運維現(xiàn)狀;
可擴展性:立足現(xiàn)有狀況,著眼未來發(fā)展。系統(tǒng)采用分層設計和模塊化設計,便于系統(tǒng)升級和
擴展, 便于未來新增業(yè)務擴展;
先進性:采用先進技術,符合未來發(fā)展的技術,采用開放式的體系結構。統(tǒng)一設計,隨時擴容。
4.4 設計優(yōu)勢
4.4.1 1
自運營 C IDC 數據中心
上海XXX金橋IDC機房位于浦東新區(qū)寧橋路825號裕安工業(yè)園,建筑面積約8000平方米。
雙線電信運營商的各種數據業(yè)務,提供聯(lián)通BGP精品網絡帶寬+電信帶寬,保障用戶托管系統(tǒng)的訪問性能。
四星級數據中心,采用雙路市電接入,保障沖足、可靠的電力供應。
具備7*24小時電信級技術保障和專業(yè)服務,是企事業(yè)單位建設數據中心或災備中心的上佳選擇
(圖):系統(tǒng)非正常工作對各個行業(yè)的影響圖
4.4.2
‘ 操作系統(tǒng)+ + 應用+ + 數據 ‘ 的完全保護
。▓D):災備虛擬化服務器圖
可為服務器提供從操作系統(tǒng)到應用程序與數據的完全保護,可避免因手動重建系統(tǒng)、安裝配置應用、恢復導入數據造成的困擾 - -
傳統(tǒng)數據備份熱備方案
- -
上海 XXX 災備中心服務方案
? 專注于數據備份? ? 專注于‘系統(tǒng)+應用+數據的’環(huán)境備份 ?? 成本從低到高,有多種備份方案? ? 可實現(xiàn)物理服務器與虛擬機之間雙向備份 ?? 成本低的數據備份不可接管應用? ? 可實現(xiàn)一對多的接管應用?? 備份后的數據不易測試? ? 成本中等偏低?? 系統(tǒng)再建費時、費錢? ? 硬件無關性恢復,備份的數據容易測試?
4.4.3 易于恢 復測試
故障轉移測試與原站點隔離,可自由操作,無需擔心發(fā)生沖突或影響生產環(huán)境的完整性,將其應用于專用快速驗證恢復計劃,也可以在這種一次性的快照上進行應用系統(tǒng)參數調整測試,軟件升級測試等,無需耗費大量時間 (圖):使用災備中心的用戶遠程訪問圖
4.4.4 快速故障切換
當保護的服務器發(fā)生故障,將自動啟用備用的虛擬主機快速恢復與接管業(yè)務,保障業(yè)務連續(xù)性。收到通過電子郵件、移動設備或基于控制臺的發(fā)出的故障警報時,自動快速恢復業(yè)務。
4.4.5 災備架構
在具備本地或遠程應用服務器的全環(huán)境備份保護的基礎上,對應用服務器以最短時間提供應急接管服務,以保障被保護服務器上的應用能夠連續(xù)對外提供服務。
(圖):異地災備應用流程圖
(圖):災備方式數據圖
S 4.4.6 DNS 智能解析服務
本方案設計的另一特點是基于網站域名的自動解析服務(DNS 智能解析服務)。當網站源站訪問實效時,DNS 智能解析服務系統(tǒng)自動返回異地災備機房的備用網站 IP 給網站訪客,避免訪問中斷。
利用 DNS 智能解析服務,可設置網站域名對應數個解析 IP,除了適用于架構在雙線機房的網站外,更適合異地災備方案的部署實施。
? DNS 智能解析服務的部署條件:
將現(xiàn)有域名注冊商上的 nameserver 配置指向第三方 DNS 智能解析服務商的 Name Server域名,生效時間為 1-2 天,切換期間不會影響用戶的正常使用。
? DNS 智能解析服務相對于 CDN 服務的優(yōu)勢 1) CDN 服務要求對網站結構進行圖文及程序分離設計,現(xiàn)有網站將面臨網站重新調整應用結構問題。
2) CDN 網絡屬于流量計費服務方式,對網站運營支出費用的管理較不可控。
五、 災備系統(tǒng)管理
5.1 組織人員進行管理
項目實施中以及完成后,XXX 將組織 IDC 人員 7X24 小時對災備系統(tǒng)進行技術支持,以確保災備系統(tǒng)的不間斷正常運行 2 5.2 定期檢查災備數據復制情況
生產系統(tǒng)與災備系統(tǒng)采用實時復制對數據進行同步,為了保證數據的正常復制,我們需要指一名人員定時對復制狀態(tài)進行監(jiān)測并做下記錄。有異常時應即時向上級領導報告。
5 5 .3
定期檢查生產中心備份情況
災備系統(tǒng)與生產系統(tǒng)的數據備份缺一不可,所以為了避免數據發(fā)生邏輯性錯誤時需要恢復生產中心數據。將指定專業(yè)人員為管理備份工作。
5.4 數據恢復管理
容災系統(tǒng)恢復的操作直接影響到實際的應用。如果進行了不正確的恢復操作可能會造成可怕的后果。因此,恢復操作應嚴格按一定的操作程序進行恢復
故障確認
在進行恢復之前首先應該確認造成故障的原因。故障的原因非常多,應該分清是操作系統(tǒng)的故障還是數據庫的故障。如果是數據庫的故障,不同的數據庫應采用不同的故障分析方法,有時可以使用數據庫提供的故障診斷工具進行故障分析。這些工作應由相應的管理者如系統(tǒng)管理員或數據庫管理員負責進行,在完成故障分析后確認需要進行恢復操作時,由相應的管理者提交書面的故障分析報告。
制定恢復計劃 備份系統(tǒng)管理員在收到故障分析報告后應與相應管理者一起制定詳細的恢復計劃,包括恢復的內容、恢復的時間、恢復的操作步驟、恢復對應用造成的影響等,最后形成一個書面的恢復計劃。備份系統(tǒng)管理者應將故障分析報告與恢復計劃一起提交到相應的主管領導審批。主管領導應確認恢復對生產造成的影響,在批準執(zhí)行恢復前應以相應方式與有關部門進行溝通和通知有關部門進行恢復前的準備工作。
恢復操作 ? 在進行實際的恢復前,備份系統(tǒng)管理者與相應管理者應再次確認恢復計劃的可行性及造成的后果。確認無誤后進入到實際的恢復操作。
? 在進行恢復前,還應該做的一件事情是對現(xiàn)有的內容作相應的備份。以防止在恢復的過程中發(fā)生更進一步的錯誤。這可能是由于恢復計劃制定得不合理造成的,也可能是操作失誤造成的。
? 進行恢復操作時應將每一步的執(zhí)行過程記錄下來,以備后用。
恢復后的操作 ? 完成恢復后應測試恢復的結果。在完成恢復結果測試成功后,對恢復后的系統(tǒng)進行相應的備份。
? 最后,將執(zhí)行恢復操作的管理者、恢復操作的時間、過程、完成的狀況等形成書面報告,報有關領導進行審批。
? 有關領導確認恢復完成后,通知相應部門恢復有關的應用。
? 審批后的恢復報告應與故障分析報告、恢復計劃、恢復操作報告一起進行存檔。
5 5 .5
數據恢復的周期性演練制度
為了防止數據發(fā)生故障后能及時恢復生產,我們將做好詳細的災難恢復計劃,同時還將定期進行災難演練。每過一段時間,在災備中心應進行一次災難演習。以熟練災難恢復的操作過程,并檢驗所生成的數據與生產中心是否一致。一個完整的災備演練主要包括:操作系統(tǒng)、數據庫、應用、網絡四個部分。
災備演練是驗證災難發(fā)生時,業(yè)務系統(tǒng)能否有效聯(lián)動切換的極為重要的手段。沒有災備的演練計劃和手段,往往無法預知災難發(fā)生時生產中心和災備中心的數據一致性,也無法預知災備中心是否具有了業(yè)務接管的一切必要條件。以往,由于一些企業(yè)采用的容災技術實現(xiàn)不具有災備演練的技術手段,出現(xiàn)了一些企業(yè)在故障發(fā)生時,仍然無法啟動后援系統(tǒng)進行業(yè)務接管的現(xiàn)象,這些企業(yè)不得不仍然采用傳統(tǒng)
的備份恢復方式進行耗時的數據恢復,不僅出現(xiàn)了大量的數據丟失,而且動輒數十小時的業(yè)務停頓,也使得災備系統(tǒng)的設計者狼狽不堪。
因此,選擇有效災備技術手段的同時,決不能忽略災備演練技術手段的提供,在具有多種技術手段的基礎上,制定災備系統(tǒng)的演練和測試計劃。災備的演練計劃有以下幾種方式:
計劃性測試/ / 演練
災難恢復計劃要求建立業(yè)務連續(xù)性管理團隊,不僅涉及 IT 部門,而且關聯(lián)眾多業(yè)務部門,為減少演練對于生產的影響,可以將恢復計劃細化到很小的單位或者模塊,逐個應用進行接管驗證。當模塊都成功通過測試后,測試的范圍可以擴充到更多的模塊。
突發(fā)演練
在災備系統(tǒng)全面完成并且制定了全面的恢復計劃后,可以在進行了一定備份的情況下安排突發(fā)性的測試。當然,業(yè)務連續(xù)人員會需要確保業(yè)務不會因為突發(fā)性測試造成不可接受的損失和業(yè)務中斷。
演練對于提高團隊的恢復經驗和協(xié)作能力以及確保災難恢復計劃的可行性是至關重要的。所有的演練結果都要進行評估、記錄,并且生成到容災流程里。
容災建設的要素還有很多,全面考慮業(yè)務連續(xù)性體系的每一個方面,抓住最為重要的環(huán)節(jié),進行深入而細致的研究,就能夠使有限的資金發(fā)揮更大的能量,達到事半功倍的效果。
六 、項目售后服務體系
提供快速、有效的技術支持和運行維護服務,是保證系統(tǒng)持續(xù)正常運行的保證,也是本項目建設成功的基礎。XXX 將根據國家及行業(yè)有關規(guī)范標準,制定全面有效的運行維護方案,從人員、規(guī)章制度等各個方面做好相應的安排,并詳細提出持續(xù)服務保障計劃、故障響應計劃。
6.1 總體目標
我們?yōu)楸卷椖恐贫ǖ南到y(tǒng)運行維護方案的總體目標是:
? 我們?yōu)楸卷椖刻峁┍娭竞瓦_、本地化的分層一體化服務,保證系統(tǒng)的正常、穩(wěn)定、高速、不間斷地運行; ? 依賴眾志和達深厚的技術基礎對系統(tǒng)進行定期和不定期的巡查和檢測,使其永遠保持最佳運行狀態(tài); ? 秉承“客戶至上”的立業(yè)原則,實時解決用戶在系統(tǒng)使用中出現(xiàn)的問題; ? 實時響應,“點對點服務” 6 6 .2
運行維護計劃
運行維護是一項長期的工作,為了確保系統(tǒng)能夠安全、穩(wěn)定地運行,我們應在原項目實施組支持服務小組的基礎上,合作雙方聯(lián)合建立專業(yè)的運行維護小組,成立項目技術支持與服務中心,為項目提供全面的現(xiàn)場運行維護服務。
XXXIDC 機房擁有多名資深的技術工程師對項目提供 7X24 小時不間斷服務將全力保證業(yè)務的不間斷運行 我們負責對容災進行例行檢查,從系統(tǒng)驗收完畢起每季度至少檢查一次,安裝相關的最新系統(tǒng)補丁和升級文件,并對有關問題進行處理 當存儲系統(tǒng)出現(xiàn)系統(tǒng)錯誤等問題時,我們將及時派工程師前往響應; 工程師定期會做的工作有:
備份系統(tǒng)是否運行正常
系統(tǒng)災備
數據庫的災備
數據庫的恢復
系統(tǒng)性能調整
對系統(tǒng)發(fā)生的故障在第一時間進行排除并提交故障報告。
系統(tǒng)運作檢測
優(yōu)化服務器與客戶機的設置
運行維護工作文檔的管理 6.3 責任及承諾
提供固定的售后服務和投訴渠道:固定電話熱線、移動電話熱線、傳真熱線、電子郵箱,設定專人為本項目提供緊急維護服務;
派高級工程師專人對本系統(tǒng)進行定期巡檢,提供系統(tǒng)運行情況報告,巡檢與系統(tǒng)運行報告由業(yè)主指定負責人審閱簽字;
提供多層次、全方位的技術業(yè)務咨詢和培訓活動。
系統(tǒng)軟、硬件設備出現(xiàn)問題或故障時,我公司承諾現(xiàn)場實時響應,根據合同規(guī)定進行更換和維修。
及時提供系統(tǒng)軟硬件升級的信息,并提供現(xiàn)場升級技術支持服務;
定期檢測系統(tǒng),系統(tǒng)性能優(yōu)化服務。
七 、項目預算
序號 產品 描述 價格/年 1 專線租用 租用2兆專線鏈路用于災備中心機房與網站主站點之間的數據備份與同步 24000(年費)+3000(安裝調試設備費用)
2 服務平臺租用 前臺 Web 服務器:CPU
inter® 2.40GHZ
2G 內存 80G 磁盤空間 后臺數據庫:CPU
inter® 2.40GHZ
12G 內存 300G 磁盤空間 55000(包含托管費用和設備本身)
3 提供 VPN 防火墻、交換機設備租用 25000(包含托管費用和設備本身)
4 數據遷移服務 將原主站操作系統(tǒng)、網站應用程序與應用數據以無縫方式遷移至備份中心 3000 5 運維服務 備份測試、變更管理、服務器運行性能與帶寬監(jiān)控、緊急響應、災備演練服務 48000 6 IDC 資源租用 提供 8
個 IP,與
30
兆獨享帶寬租用服務 72000 7 DNS 智能解析 提供網站故障時,域名訪問自動切換服務 8800 合計(一年) 238800 元
熱點文章閱讀