隨著信息化建設(shè)進(jìn)程的加快,各單位在信息化建設(shè)方面取得了很大發(fā)展。目前,筆者所在單位在綜合業(yè)務(wù)管理系統(tǒng)、日常辦公、財(cái)務(wù)管理、人事管理、標(biāo)準(zhǔn)信息化、電子監(jiān)察、檔案管理、固定資產(chǎn)管理以及各科研生產(chǎn)管理等諸多方面全面使用信息系統(tǒng)。特別是近幾年來(lái),業(yè)務(wù)系統(tǒng)的信息化發(fā)展迅速,導(dǎo)致信息系統(tǒng)的數(shù)據(jù)量迅速增長(zhǎng),業(yè)務(wù)數(shù)據(jù)的重要程度日益增加,任何重要信息的丟失都將會(huì)給業(yè)務(wù)管理帶來(lái)難以估計(jì)的損失和影響。因此,如何保證核心業(yè)務(wù)系統(tǒng)及必要輔助系統(tǒng)的業(yè)務(wù)連續(xù)性和數(shù)據(jù)的安全性,如何對(duì)現(xiàn)有信息系統(tǒng)進(jìn)行災(zāi)難備份建設(shè),成為單位信息系統(tǒng)當(dāng)前迫切需要解決的兩大課題。結(jié)合科研和實(shí)際信息化工作的需要開展了數(shù)據(jù)容災(zāi)的研究建設(shè)工作。
目前在用的存儲(chǔ)系統(tǒng)中往往包含F(xiàn)CSAN和IPSAN,備份要兼顧FCSAN和IPSAN的特點(diǎn)和應(yīng)用要求。筆者單位的核心業(yè)務(wù)系統(tǒng)等重要系統(tǒng)使用的是FCSAN存儲(chǔ)網(wǎng)絡(luò),而轄區(qū)內(nèi)下屬各分支機(jī)構(gòu)的相關(guān)應(yīng)用使用的是IPSAN存儲(chǔ)網(wǎng)絡(luò),但FC-SAN和IP-SAN這兩種存儲(chǔ)網(wǎng)絡(luò)因物理介質(zhì)和傳輸協(xié)議的不同導(dǎo)致信息孤島現(xiàn)象,為了實(shí)現(xiàn)對(duì)現(xiàn)有信息化系統(tǒng)數(shù)據(jù)容災(zāi),研究設(shè)計(jì)基于FCSAN和IPSAN兩種存儲(chǔ)網(wǎng)絡(luò)融合存儲(chǔ)系統(tǒng)的數(shù)據(jù)容災(zāi),研究融合存儲(chǔ)環(huán)境下的數(shù)據(jù)備份機(jī)制,提高融合存儲(chǔ)系統(tǒng)中數(shù)據(jù)的可用性。
1.基于融合存儲(chǔ)系統(tǒng)的容災(zāi)體系結(jié)構(gòu)
傳統(tǒng)的SAN是采用FC或者IP連接方式進(jìn)行網(wǎng)絡(luò)存儲(chǔ),其連接方式單一,各有優(yōu)缺點(diǎn)。顯然,采用FC連接方式的SAN數(shù)據(jù)傳輸速度快,但是價(jià)格昂貴并且傳輸距離較短,而采用IP連接方式的SAN雖然可擴(kuò)展性和傳輸距離都較好,但是數(shù)據(jù)傳輸速度的瓶頸并沒有得到很好的解決。因此,借助于融合存儲(chǔ)平臺(tái)就能較好解決這一問(wèn)題。
融合存儲(chǔ)平臺(tái)解決IP-SAN和FC-SAN的互聯(lián)互通融合性問(wèn)題,可以讓存儲(chǔ)服務(wù)器通過(guò)IP、FC等不同連接方式將不同的遠(yuǎn)程存儲(chǔ)資源映射到自身,進(jìn)行統(tǒng)一虛擬化,并通過(guò)IP、FC等不同連接方式對(duì)外提供塊級(jí)存儲(chǔ)服務(wù),并且可以在不中斷服務(wù)的情況下動(dòng)態(tài)地對(duì)統(tǒng)一虛擬化存儲(chǔ)資源進(jìn)行配置與管理。
基于ATCA的融合存儲(chǔ)平臺(tái)主要分為三個(gè)層次:上層為文件或應(yīng)用服務(wù)器,即需要使用存儲(chǔ)系統(tǒng)的服務(wù)器。上層不同連接通道的服務(wù)器也通過(guò)各自的連接方式連接到中層存儲(chǔ)服務(wù)器。用戶通過(guò)上層的應(yīng)用戶服務(wù)器獲取存儲(chǔ)空間和數(shù)據(jù)。
中層為ATCA融合存儲(chǔ)服務(wù)器。ATCA存儲(chǔ)服務(wù)器上裝有對(duì)不同連接通道的硬件支持,例如FCHBA、以太網(wǎng)卡等。上層和底層不同的存儲(chǔ)設(shè)備可以在硬件上通過(guò)各自的連接方式連接到中層存儲(chǔ)服務(wù)器。這一層也稱為統(tǒng)一存儲(chǔ)層。底層為存儲(chǔ)設(shè)備層。這層中的設(shè)備可以是任意塊級(jí)存儲(chǔ)設(shè)備,例如FC磁盤、FC磁盤陣列、iSCSI磁盤;也可以是塊級(jí)存儲(chǔ)服務(wù)器,甚至是另一個(gè)存儲(chǔ)區(qū)域網(wǎng)系統(tǒng)。圖1為系統(tǒng)整體架構(gòu)圖。
圖1 系統(tǒng)整體架構(gòu)圖
上層與中層以及中層與底層之間通過(guò)SCSI協(xié)議進(jìn)行數(shù)據(jù)訪問(wèn),它們之間是塊級(jí)數(shù)據(jù)傳輸,所采用的數(shù)據(jù)傳輸協(xié)議為FCP、iSCSI等不同連接的主流協(xié)議。在對(duì)數(shù)據(jù)訪問(wèn)的支持上使用統(tǒng)一處理模塊進(jìn)行處理。
底層的存儲(chǔ)空間映射到中層實(shí)現(xiàn)存儲(chǔ)虛擬化,并劃分邏輯單元;中層將劃分好的邏輯單元映射給應(yīng)用服務(wù)器。底層對(duì)上層是透明的。
2.基于融合存儲(chǔ)系統(tǒng)的容災(zāi)實(shí)現(xiàn)
融合式智能容災(zāi)存儲(chǔ)系統(tǒng)的拓?fù)浣Y(jié)構(gòu)圖如圖2所示,系統(tǒng)設(shè)計(jì)為一個(gè)兩點(diǎn)互相災(zāi)備的容災(zāi)存儲(chǔ)系統(tǒng)。此處融合是主要指iSCSI和FC的融合,既包括存儲(chǔ)池的融合,又包括應(yīng)用服務(wù)器的融合,因?yàn)镕C協(xié)議的限制,以及傳輸距離有限,F(xiàn)C鏈路的故障檢測(cè)檢測(cè)與應(yīng)用遷移是很困難的,所以本文僅考慮iSCSI鏈路的故障檢測(cè)技術(shù)的研究。
圖2 拓?fù)浣Y(jié)構(gòu)圖
實(shí)現(xiàn)容災(zāi)策略核心首先要能準(zhǔn)確檢測(cè)到錯(cuò)誤,然后根據(jù)檢測(cè)到的錯(cuò)誤才能做出相應(yīng)的處理。在實(shí)現(xiàn)過(guò)程中,主要研究的存儲(chǔ)容災(zāi)系統(tǒng)的故障有融合存儲(chǔ)控制器層的故障與存儲(chǔ)池層的故障兩類,具體分類如表1所示。
表1 故障具體分類
依據(jù)故障分類及檢測(cè)技術(shù)可知,故障A、B由客戶端檢測(cè)發(fā)現(xiàn),故障C、D由數(shù)據(jù)復(fù)制功能檢測(cè),因此故障C、D對(duì)于客戶端的影響在于發(fā)生故障A或B時(shí)客戶端能否切換到異地融合存儲(chǔ)控制器繼續(xù)正常運(yùn)行,此情況由異地融合存儲(chǔ)控制器根據(jù)是否發(fā)生故障C、D來(lái)決定客戶端是否能正常切換。表中所列出的四個(gè)故障可能有多個(gè)故障同時(shí)發(fā)生的幾率,但多個(gè)故障同時(shí)發(fā)生不影響對(duì)單個(gè)故障處理的策略,因?yàn)閷?duì)單個(gè)故障的處理策略考慮了其他故障對(duì)其造成的影響。例如,對(duì)于故障A和故障B,在客戶端看來(lái)的現(xiàn)象都是本地融合存儲(chǔ)控制器不可用,因此客戶端采取相同的策略,即客戶端切換到異地融合存儲(chǔ)控制器。當(dāng)本地融合存儲(chǔ)控制器恢復(fù)后,客戶端再將存儲(chǔ)服務(wù)回切到本地融合存儲(chǔ)控制器。
同樣,對(duì)于故障C與故障D,在融合存儲(chǔ)控制器看來(lái)的現(xiàn)象都是存儲(chǔ)設(shè)備不可用,因此融合存儲(chǔ)控制器采取相同的策略來(lái)處理,若是本地存儲(chǔ)池失效,由于數(shù)據(jù)復(fù)制功能的存在,客戶端可繼續(xù)對(duì)遠(yuǎn)程存儲(chǔ)池進(jìn)行I/O操作,并記錄日志,當(dāng)本地存儲(chǔ)池恢復(fù)正常時(shí),通過(guò)日志同步故障期間產(chǎn)生的更新數(shù)據(jù);若異地的鏡像卷失效,則反過(guò)來(lái)處理(此功能由數(shù)據(jù)復(fù)制實(shí)現(xiàn))。故障C、D與客戶端沒有直接的關(guān)系,因此對(duì)客戶端來(lái)說(shuō)是透明的,不需進(jìn)行處理。
2.2 故障檢測(cè)與應(yīng)用遷移的實(shí)現(xiàn)
基于融合存儲(chǔ)的容災(zāi)存儲(chǔ)系統(tǒng)主要分為存儲(chǔ)管理、數(shù)據(jù)復(fù)制、故障檢測(cè)與應(yīng)用遷移及存儲(chǔ)安全管理四個(gè)部分,四個(gè)部分有機(jī)地結(jié)合在一起形成一個(gè)完整的容災(zāi)存儲(chǔ)系統(tǒng)。存儲(chǔ)管理負(fù)責(zé)系統(tǒng)的統(tǒng)一管理、調(diào)度工作,包括管理存儲(chǔ)設(shè)備、管理邏輯卷、管理用戶等;數(shù)據(jù)復(fù)制則負(fù)責(zé)存儲(chǔ)池間數(shù)據(jù)的同步或異步的復(fù)制,實(shí)現(xiàn)數(shù)據(jù)的備份;故障檢測(cè)與應(yīng)用遷移負(fù)責(zé)檢測(cè)系統(tǒng)的故障,一旦發(fā)生故障則做出相應(yīng)的處理,保證系統(tǒng)的高可用性;存儲(chǔ)安全管理則負(fù)責(zé)用戶認(rèn)證、訪問(wèn)控制以及數(shù)據(jù)靜態(tài)加解密等安全策略。
要使得基于融合存儲(chǔ)的容災(zāi)存儲(chǔ)系統(tǒng)是一個(gè)高可靠、高可用的系統(tǒng),就需要在故障檢測(cè)時(shí)有短的檢測(cè)時(shí)間和高的檢測(cè)精確性。然而短的檢測(cè)時(shí)間與高檢測(cè)精確性通常并不能同時(shí)兼得,例如Bertier的檢測(cè)方法比Chen具有更短的檢測(cè)時(shí)間,檢測(cè)精確性卻要低一些。在容災(zāi)存儲(chǔ)系統(tǒng)中更加重要的是檢測(cè)的精確性,因?yàn)橐坏┌l(fā)生誤判就會(huì)引起不必要的處理。因此在容災(zāi)存儲(chǔ)系統(tǒng)中,為了保證高的精確性,可以折中地考慮適當(dāng)犧牲檢測(cè)時(shí)間。
對(duì)于存儲(chǔ)池層的故障交由容災(zāi)存儲(chǔ)系統(tǒng)的數(shù)據(jù)復(fù)制部分處理,因?yàn)檫@里只需處理存儲(chǔ)控制器層的故障。同樣,故障檢測(cè)器分為被檢測(cè)端和檢測(cè)端,將其分別稱為FDp和FDq,F(xiàn)Dp定時(shí)向FDq發(fā)送心跳信息,F(xiàn)Dq根據(jù)心跳信息是否超時(shí)來(lái)判斷被檢測(cè)的節(jié)點(diǎn)是否發(fā)生故障。在容災(zāi)存儲(chǔ)系統(tǒng)中,由應(yīng)用服務(wù)器檢測(cè)存儲(chǔ)控制器的故障,因此在存儲(chǔ)控制器上部署故障檢測(cè)器被檢測(cè)端FDp,在應(yīng)用服務(wù)器上部署故障檢測(cè)器檢測(cè)端FDq。故障檢測(cè)策略的部署如圖3所示。
圖3 故障檢測(cè)策略部署圖
2.3 測(cè)試及分析
應(yīng)用遷移的功能支持FTP、數(shù)據(jù)庫(kù),流媒體等典型應(yīng)用,這里測(cè)試采用Oracle作為應(yīng)用服務(wù),Oracle采用版本為Oracle10g,安裝在WindowsServer2008環(huán)境的iSCSI服務(wù)器上。針對(duì)Oracle應(yīng)用的測(cè)試,開發(fā)了一個(gè)向Oracle數(shù)據(jù)庫(kù)的表中批量寫入數(shù)據(jù)的測(cè)試程序Oclient。
測(cè)試的過(guò)程如下:
(1)啟動(dòng)故障檢測(cè)與應(yīng)用遷移Windows版本程序HBclient,程序?qū)?huì)自動(dòng)連接本地存儲(chǔ)控制器,手動(dòng)對(duì)連接上來(lái)的磁盤進(jìn)行格式化。
(2)啟動(dòng)OracleDBCA,創(chuàng)建一個(gè)數(shù)據(jù)庫(kù),并將數(shù)據(jù)庫(kù)文件存放于上一步格式化的磁盤上。新建一個(gè)表空間、用戶,以及兩個(gè)測(cè)試用的表Ttable1,Ttable2。
(3)通過(guò)批量寫數(shù)據(jù)工具Oclient遠(yuǎn)程連接Oracle應(yīng)用服務(wù)器,并向表Ttable1中寫入5000條記錄。
(4)重啟本地存儲(chǔ)控制器,模擬本地存儲(chǔ)控制器故障,Oracle應(yīng)用服務(wù)器會(huì)切換到遠(yuǎn)程存儲(chǔ)控制器。
(5)通過(guò)Oclient再次連接Oracle應(yīng)用服務(wù)器,查看Ttable1的記錄,并向Ttable2中寫入10000條記錄,寫入完成后查看Ttable2表中的記錄,可以發(fā)現(xiàn)表Ttable2中存在10000條數(shù)據(jù)。
(6)待本地存儲(chǔ)控制器重啟完成后,進(jìn)行應(yīng)用回切,應(yīng)用服務(wù)器成功回切到本地存儲(chǔ)控制器。回切完成后再次通過(guò)Oclient查看Ttable2中的記錄,可以發(fā)現(xiàn)Ttable2中存在10000條數(shù)據(jù)。通過(guò)測(cè)試的過(guò)程可以看出,Oracle應(yīng)用可以正常地切換到遠(yuǎn)程并進(jìn)行數(shù)據(jù)的讀寫,然后也可以正常地進(jìn)行數(shù)據(jù)回切并進(jìn)行數(shù)據(jù)的讀寫。應(yīng)用遷移功能正常。應(yīng)用遷移的性能的主要衡量指標(biāo)是遷移時(shí)應(yīng)用的中斷時(shí)間,中斷的時(shí)間越短,性能越好,零中斷時(shí)間的無(wú)縫遷移則是性能最好的。
應(yīng)用遷移的中斷時(shí)間主要取決于故障的檢測(cè)時(shí)間和遠(yuǎn)程存儲(chǔ)控制器對(duì)服務(wù)切換請(qǐng)求的處理時(shí)間以及接管存儲(chǔ)服務(wù)的時(shí)間開銷。可知應(yīng)用遷移中斷時(shí)間(記為Tim):
Tim=Tfd+Tconnect+Tload+Tclient
其中Tfd表示故障檢測(cè)的檢測(cè)時(shí)間,Tclient表示客戶端重新連接存儲(chǔ)控制器的時(shí)間,Tconnect表示儲(chǔ)控制器連接存儲(chǔ)設(shè)備的時(shí)間,Tload表示存儲(chǔ)控制器加載存儲(chǔ)至存儲(chǔ)服務(wù)接口的時(shí)間,Tconnect,Tservice都很短,相對(duì)于故障檢測(cè)時(shí)間可以忽略,故障檢測(cè)的時(shí)間則會(huì)根據(jù)不同的網(wǎng)絡(luò)狀況發(fā)生變化。
應(yīng)用回切時(shí)間主要取決于數(shù)據(jù)恢復(fù)的時(shí)間以及重新連接的時(shí)間開銷。存儲(chǔ)服務(wù)切換回切時(shí)間(記為Tib):
Tib=Trecovery+Tclient
其中Trecovery是指進(jìn)行數(shù)據(jù)恢復(fù)的時(shí)間,Tclient的含義同前面,Trecovery取決于需要恢復(fù)的數(shù)據(jù)量的大小,由故障發(fā)生期間的數(shù)據(jù)更新量決定。應(yīng)用回切時(shí)間主要取決于數(shù)據(jù)恢復(fù)的時(shí)間以及重新連接的時(shí)間開銷。存儲(chǔ)服務(wù)切換回切流程通過(guò)多次的測(cè)試并選取典型值,并進(jìn)行計(jì)算遷移時(shí)間與回切時(shí)間記錄后可以得出,在沒有數(shù)據(jù)恢復(fù)的情況下應(yīng)用回切的中斷時(shí)間基本相同,都在3秒左右,而有100MB的數(shù)據(jù)和370MB的數(shù)據(jù)需要恢復(fù)時(shí)應(yīng)用回切的中斷時(shí)間則會(huì)增加很多。
3.結(jié)語(yǔ)
通過(guò)基于融合存儲(chǔ)系統(tǒng)的數(shù)據(jù)容災(zāi)的應(yīng)用研究,可實(shí)現(xiàn)支持異構(gòu)存儲(chǔ)架構(gòu)的核心存儲(chǔ)交換平臺(tái),構(gòu)成模塊化、可擴(kuò)展、可動(dòng)態(tài)存儲(chǔ)分區(qū)的網(wǎng)絡(luò)存儲(chǔ)體系,輔以全方位的具備遠(yuǎn)程數(shù)據(jù)鏡像、數(shù)據(jù)快照與恢復(fù)、廣域高可用服務(wù)診斷與接管等功能的存儲(chǔ)容災(zāi)手段,為檢驗(yàn)檢疫數(shù)據(jù)中心及各類信息系統(tǒng)提供統(tǒng)一的、滿足服務(wù)質(zhì)量要求的容災(zāi)網(wǎng)絡(luò)存儲(chǔ)服務(wù)。但容災(zāi)存儲(chǔ)系統(tǒng)在商業(yè)領(lǐng)域有著廣泛的應(yīng)用歷史和前景,目前,我們研發(fā)的系統(tǒng)原型,雖然理論上能夠滿足用戶的指標(biāo)要求,但是,距離真實(shí)上線應(yīng)用還有一段距離,系統(tǒng)的穩(wěn)定性及技術(shù)風(fēng)險(xiǎn)還存在,但對(duì)于指導(dǎo)研究新型的備份系統(tǒng)研究上有一定的應(yīng)用價(jià)值和指導(dǎo)意義。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://m.lukmueng.com/
本文標(biāo)題:基于融合存儲(chǔ)系統(tǒng)的數(shù)據(jù)容災(zāi)
本文網(wǎng)址:http://m.lukmueng.com/html/support/11121514047.html