1.概述
如今信息化手段已經(jīng)滲透到各行各業(yè),成為管理、運作不可或缺的一部分,各行業(yè)和部門的信息系統(tǒng)以及電子政務(wù)系統(tǒng)已經(jīng)成為國家的重要基礎(chǔ)設(shè)施。在享受信息化在各方面帶來的便利的同時,其潛在的在安全性和可靠性等方面的負面影響也同樣值得關(guān)注。
電網(wǎng)企業(yè)作為關(guān)系國家能源安全和國家經(jīng)濟命脈的重要骨干企業(yè),在信息化方面的依賴程度日漸提高。集中式信息系統(tǒng)為電網(wǎng)企業(yè)帶來一體化操作平臺和便捷的業(yè)務(wù)管理等一系列好處,但樣高度集中的平臺也增加了其日常運營的風(fēng)險,一旦系統(tǒng)由于自然災(zāi)難或不可預(yù)見的意外事件出現(xiàn)問題,將導(dǎo)致整個電網(wǎng)企業(yè)業(yè)務(wù)的全面癱瘓,造成難以估量的損失。因此,在集中式系統(tǒng)遭受打擊之后,如何快速恢復(fù)正常狀態(tài)以保障正常生產(chǎn)生活成為了當前企業(yè)面臨的重要挑戰(zhàn)。
2.容災(zāi)備份的相關(guān)概念
容災(zāi)備份是指采用某種機制對企業(yè)的各類業(yè)務(wù)信息進行完整的備份,在災(zāi)難發(fā)生之后受到損壞的系統(tǒng)平臺能夠迅速進行重建并恢復(fù)到進行備份時的狀態(tài),從最大限度上保障企業(yè)各種業(yè)務(wù)的正常運轉(zhuǎn)。
容災(zāi)備份技術(shù)是在節(jié)點層面上進行操作,能夠保障整個節(jié)點的性能恢復(fù)。從對系統(tǒng)的保護程度上看,容災(zāi)可以分為如下3大類:
1)數(shù)據(jù)級容災(zāi):數(shù)據(jù)級容災(zāi)本質(zhì)上就是數(shù)據(jù)的遠程備份,具體來說是在異地建立一個或多個容災(zāi)中心,將待備份的數(shù)據(jù)存儲到容災(zāi)中心,并定期對備份數(shù)據(jù)進行更新以保證數(shù)據(jù)恢復(fù)時能獲得最新的數(shù)據(jù)。這種容災(zāi)方式機制簡單且易于實現(xiàn),但數(shù)據(jù)恢復(fù)時間相對較長。
2)應(yīng)用級容災(zāi):應(yīng)用級容災(zāi)建立在數(shù)據(jù)級之上,是將本地的應(yīng)用系統(tǒng)的鏡像運行在異地容災(zāi)中心。它通過實時的、連續(xù)的復(fù)制來確保應(yīng)用系統(tǒng)的及時同步,這樣可以保證關(guān)鍵應(yīng)用在允許的時間范圍內(nèi)恢復(fù)運行。災(zāi)難發(fā)生之后,容災(zāi)中心的最新的應(yīng)用能夠直接遷移到本地,用戶幾乎感覺不到災(zāi)難帶來的損失。
3)業(yè)務(wù)級容災(zāi):這是建立在業(yè)務(wù)層面上的災(zāi)備方式,它的對象包括IT方面的所有技術(shù)和維持IT架構(gòu)的其他設(shè)施,甚至包括了業(yè)務(wù)辦公所需的基礎(chǔ)設(shè)備(如電話、辦公地點)。業(yè)務(wù)級容災(zāi)能夠保證在災(zāi)難發(fā)生之后,迅速重新建立一套與原先配置一樣的工作場所,以維持正常的業(yè)務(wù)活動。
3.集中式信息系統(tǒng)災(zāi)備實施及關(guān)鍵技術(shù)
電網(wǎng)企業(yè)集中式信息系統(tǒng)災(zāi)備的實施是對企業(yè)系統(tǒng)安全性和可靠性的重要保障,其設(shè)計和實施的效果將對整個信息系統(tǒng)產(chǎn)生巨大的影響。下面對電網(wǎng)企業(yè)信息系統(tǒng)災(zāi)備項目的實施方案和關(guān)鍵技術(shù)進行詳細分析。
3.1 綜合管理系統(tǒng)優(yōu)化整合
集中式信息系統(tǒng)強調(diào)對應(yīng)用、平臺的集中式管理,將原先分散的應(yīng)用系統(tǒng)集成到一個統(tǒng)一的硬件環(huán)境下,實現(xiàn)信息化軟硬件資源的優(yōu)化整合。整合之后不僅能夠加強系統(tǒng)的集約化、一體化管理,也能夠降低系統(tǒng)容災(zāi)備份的難度,為數(shù)據(jù)集災(zāi)備的實施提供基礎(chǔ)和保障。
3.1.1 綜合管理系統(tǒng)的整合架構(gòu)
針對電網(wǎng)企業(yè)信息系統(tǒng)的特點,設(shè)計出了綜合管理系統(tǒng)軟硬件優(yōu)化整合的目標架構(gòu),如圖1所示。
圖1 綜合管理系統(tǒng)整合架構(gòu)
如上圖所示,整合的過程主要是利用企業(yè)現(xiàn)有服務(wù)器,安裝VMWare ESX3.5虛擬機軟件并構(gòu)建HA,以實現(xiàn)虛擬服務(wù)器池,然后將綜合管理系統(tǒng)的各應(yīng)用逐步遷移其上,以提升目前應(yīng)用的穩(wěn)定性和設(shè)備利用效率,實現(xiàn)綜合管理系統(tǒng)整合目標。
3.1.2 系統(tǒng)整合風(fēng)險分析
系統(tǒng)整合的過程中隨時可能出現(xiàn)各種意外狀況,因此有必要在整合方案實施前對各種可能的狀況進行分析并進行預(yù)案。經(jīng)過對整合過程的分析,可得出該綜合信息管理系統(tǒng)整合方案實施過程中可能出現(xiàn)的風(fēng)險狀況及應(yīng)對方案。
1) 在生產(chǎn)系統(tǒng)割接到目標系統(tǒng)環(huán)境過程中,目標系統(tǒng)可能會發(fā)生問題時,需要回切到原有系統(tǒng)。應(yīng)對方案:保持原有生產(chǎn)系統(tǒng)環(huán)境在可用狀態(tài),如果之前先需要拆除部分原生產(chǎn)系統(tǒng)的,需要找環(huán)境先建立一套可用的系統(tǒng)做回切準備。回切工作主要集中在網(wǎng)絡(luò)切換。
2) 在原生產(chǎn)系統(tǒng)中改造數(shù)據(jù)庫整合過程中,可能會出現(xiàn)覆蓋原生產(chǎn)系統(tǒng)數(shù)據(jù)的風(fēng)險。應(yīng)對方案:在任何數(shù)據(jù)庫改造工作之前,需要確保數(shù)據(jù)庫服務(wù)器上的數(shù)據(jù)庫數(shù)據(jù)已經(jīng)備份。此外,在數(shù)據(jù)導(dǎo)入之前,需要檢驗數(shù)據(jù)的用戶名、模式名稱是否有重名的問題。
3) 在目標應(yīng)用服務(wù)器上部署應(yīng)用包時,可能會出現(xiàn)被部署的應(yīng)用不是當前生產(chǎn)上運行的最新版本。應(yīng)對方案:在目標應(yīng)用服務(wù)器部署應(yīng)用包之前,需要和應(yīng)用開發(fā)商及維護人員確認當前被部署的應(yīng)用包與生產(chǎn)系統(tǒng)運行的應(yīng)用包的版本一致。
3.1.3 整合回退應(yīng)急措施
在綜合系統(tǒng)整合實施過程中,尤其是各子系統(tǒng)上線割接時,如果測試環(huán)境無法使用并在停機窗口間無法找出問題,需要在各相關(guān)人員的配合下啟用應(yīng)急預(yù)案進行回退操作。回退操作主要針對三個方面進行——中間件整合回退、數(shù)據(jù)庫整合回退和數(shù)據(jù)庫數(shù)據(jù)不完整回退。
在遷移各應(yīng)用系統(tǒng)中間件應(yīng)用過程中,如果在遷移截止時間之前未能按照預(yù)期實現(xiàn)當前的操作目標,則需要執(zhí)行回退計劃。中間件整合回退的關(guān)鍵是在實施前對應(yīng)用進行備份。備份時首先向應(yīng)用軟件開發(fā)商確認各應(yīng)用系統(tǒng)的應(yīng)用軟件包及其版本與兼容性,再停機備份各應(yīng)用系統(tǒng)的應(yīng)用文件目錄。
數(shù)據(jù)庫整合之前同樣需要先對原有的數(shù)據(jù)庫進行備份。在數(shù)據(jù)庫整合過程中,如果在整合截止時間之前沒有按照預(yù)期實現(xiàn)當前操作目標,則需要進行數(shù)據(jù)庫回退操作。另外,如果在校驗過程中發(fā)現(xiàn)遷移的數(shù)據(jù)庫對象或數(shù)據(jù)不完整,則需要刪除相應(yīng)的用戶及其對象,重新進行用戶創(chuàng)建及數(shù)據(jù)庫導(dǎo)入。
數(shù)據(jù)庫遷移的過程中可能會不完整的現(xiàn)象,因此在遷移前需對原始數(shù)據(jù)進行備份并確認備份數(shù)據(jù)是可用的。測試人員驗收數(shù)據(jù)庫完整性過程中發(fā)現(xiàn)數(shù)據(jù)丟失時,需要導(dǎo)入原始應(yīng)用中的數(shù)據(jù)庫備份數(shù)據(jù)以恢復(fù)生產(chǎn)。
3.2 SAN存儲優(yōu)化整合
SAN(Storage Area Network)是一個集中式管理的高速存儲網(wǎng)絡(luò)c7,由多供應(yīng)商存儲系統(tǒng)、存儲管理軟件、應(yīng)用程序服務(wù)器和網(wǎng)絡(luò)硬件組成。對SAN的存儲優(yōu)化整合是電網(wǎng)企業(yè)軟硬件資源優(yōu)化整合工作的重要部分。
3.2.1 SAN存儲系統(tǒng)目標架構(gòu)
SAN存儲系統(tǒng)大體上由SAN服務(wù)器、SAN存儲和SAN互連三部分構(gòu)成。服務(wù)器是整個SAN方案的前提,而存儲基礎(chǔ)結(jié)構(gòu)是所有信息活動的基礎(chǔ),SAN互連解決的是服務(wù)器和存儲之間的連接問題。SAN存儲系統(tǒng)目標架構(gòu)如圖2所示。
圖2 SAN存儲系統(tǒng)目標架構(gòu)
3.2.2 SAN網(wǎng)絡(luò)目標架構(gòu)
SAN存儲系統(tǒng)架構(gòu)的中間層有核心和邊緣兩種SAN交換機,其原因是系統(tǒng)采用了核心一邊緣架構(gòu)的二級部署模式。為了能夠提供高的安全和擴展性,有利于集中管理和維護,可以將核心交換機連接存儲設(shè)備,包括磁盤和磁帶庫設(shè)備,同時將邊緣交換機連接服務(wù)器。詳細的網(wǎng)絡(luò)架構(gòu)如圖3。
圖3 SAN存儲網(wǎng)絡(luò)架構(gòu)
3.3數(shù)據(jù)級容災(zāi)
數(shù)據(jù)級容災(zāi)是災(zāi)備方案中相對比較容易實施的一種,也是應(yīng)用級、業(yè)務(wù)級容災(zāi)方案的基礎(chǔ),因此數(shù)據(jù)級容災(zāi)的實施情況對后續(xù)災(zāi)備的開展有著重要作用。數(shù)據(jù)級容災(zāi)的目標是建立多個異地的容災(zāi)中心,對各單位的信息系統(tǒng)數(shù)據(jù)進行集中備份,為后續(xù)額容災(zāi)措施打下基礎(chǔ)。
3.3.1數(shù)據(jù)級容災(zāi)方案總體設(shè)計
基于對國網(wǎng)災(zāi)備總體框架的分析與討論,綜合考慮電網(wǎng)企業(yè)現(xiàn)有系統(tǒng)框架后,制定出的電網(wǎng)企業(yè)數(shù)據(jù)級容災(zāi)的設(shè)計方案如下:
1)生產(chǎn)中心在ERP及管控、營銷、生產(chǎn)管理和一體化平臺中的結(jié)構(gòu)化數(shù)據(jù)主機上部署Oracle GcldenGate數(shù)據(jù)庫復(fù)制客戶端,以實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)到容災(zāi)中心的復(fù)制發(fā)起。
2)除使用Oracle GcldenGate進行復(fù)制的數(shù)據(jù)庫外,其他的結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)都通過HP XP24000進行存儲復(fù)制,存儲在非XP24000中的中低端存儲需要先虛擬化到XP24000中,再進行遠程復(fù)制傳輸?shù)疆惖貫?zāi)備中心的虛擬化平臺。
3)在容災(zāi)中心建立相應(yīng)的數(shù)據(jù)庫主機群、存儲池用來處理和存放企業(yè)的生產(chǎn)數(shù)據(jù)。
3.3.2數(shù)據(jù)級容災(zāi)策略設(shè)計
數(shù)據(jù)級容災(zāi)措施可向核心應(yīng)用、一體化平臺和綜合管理平臺應(yīng)用系統(tǒng)提供異地數(shù)據(jù)級容災(zāi)保護,因此容災(zāi)中心能夠在一定范圍內(nèi)提供數(shù)據(jù)保護和數(shù)據(jù)恢復(fù)能力。在容災(zāi)數(shù)據(jù)復(fù)制方面,同樣需要采取一定的策略進行保障。首先應(yīng)該在對現(xiàn)有生產(chǎn)影響最小的情況下對數(shù)據(jù)進行完整的、一致性的遷移。同時,遷移前應(yīng)對數(shù)據(jù)進行精簡以節(jié)省遷移時間、磁盤空間和傳輸帶寬。另外,災(zāi)備中心處理能力的保障對數(shù)據(jù)級容災(zāi)至關(guān)重要。災(zāi)備中心處理能力設(shè)計策略應(yīng)著重考慮如下三點:
1)容災(zāi)中心的處理能力將優(yōu)先考慮滿足數(shù)據(jù)級容災(zāi)復(fù)制的最低需求,其中數(shù)據(jù)庫復(fù)制主機按照2CPU , 8G內(nèi)存進行配置,驗證區(qū)主機按照典型網(wǎng)省的典型系統(tǒng)主機進行配置。
2)容災(zāi)中心數(shù)據(jù)按照不同層級存儲。
3)現(xiàn)有生產(chǎn)中心業(yè)務(wù)系統(tǒng)與災(zāi)備中心相關(guān)災(zāi)備系統(tǒng)的的設(shè)備類型和操作系統(tǒng)版本應(yīng)保持一致。
3.3.3數(shù)據(jù)級容災(zāi)災(zāi)難恢復(fù)場景設(shè)計
國網(wǎng)集中式容災(zāi)系統(tǒng)建設(shè)具有可行性、先進性又具有經(jīng)濟性等特點。但是,容災(zāi)系統(tǒng)的建立并不能解決所有問題。容災(zāi)系統(tǒng)是面向一定的風(fēng)險場景,容災(zāi)具有其適應(yīng)性與局限,不是所有問題均能夠通過容災(zāi)解決。正確的定位容災(zāi)系統(tǒng),有利于信息系統(tǒng)的建設(shè)與管理,利于業(yè)務(wù)系統(tǒng)的持續(xù)運行。適用于數(shù)據(jù)級容災(zāi)的場景如表1所示。
表1 數(shù)據(jù)級容災(zāi)適用場景
不支持的場景如表2中所示。
表2 數(shù)據(jù)級容不災(zāi)適用的場景
4.結(jié)束語
電網(wǎng)企業(yè)信息系統(tǒng)及業(yè)務(wù)數(shù)據(jù)的安全直接影響到國民經(jīng)濟的正常運行,其安全保障和災(zāi)難恢復(fù)工作已經(jīng)引起了國家和企業(yè)的重大關(guān)注。該文對電網(wǎng)企業(yè)信息系統(tǒng)災(zāi)備過程中的關(guān)鍵技術(shù)進行了分析介紹,具體包括綜合管理系統(tǒng)優(yōu)化整合、SAN存儲系統(tǒng)優(yōu)化整合以及數(shù)據(jù)級容災(zāi),同時還對災(zāi)備實施中的突發(fā)狀況進行了預(yù)案分析。由于數(shù)據(jù)級容災(zāi)備份是應(yīng)用級和業(yè)務(wù)級容災(zāi)備份的基礎(chǔ),實施的效果將對后兩者產(chǎn)生直接作用,因此本文著重對數(shù)據(jù)級容災(zāi)方面進行了較全面的分析。該文介紹的若干個災(zāi)備關(guān)鍵技術(shù)在電網(wǎng)企業(yè)實際的容備項目中得到了成功的實施并取得了預(yù)期的效果。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.lukmueng.com/
本文標題:電網(wǎng)企業(yè)信息系統(tǒng)容災(zāi)備份關(guān)鍵技術(shù)研究
本文網(wǎng)址:http://m.lukmueng.com/html/consultation/10839511010.html