項目背景:
金保工程是利用先進的信息技術(shù),以中央、省、市三級網(wǎng)絡(luò)為依托,涵蓋縣、鄉(xiāng)等基層機構(gòu),支持勞動和社會保障業(yè)務(wù)經(jīng)辦、公共服務(wù)、公基金監(jiān)管和宏觀決策等核心應(yīng)用,覆蓋全國的統(tǒng)一的勞動和社會保障電子政務(wù)工程。
信息技術(shù)的快速發(fā)展和社會信息化建設(shè)力度的不斷增強,對信息數(shù)據(jù)的完整性和系統(tǒng)運行的持續(xù)性提出了更為嚴格的要求。信息數(shù)據(jù)海量增長、信息系統(tǒng)支撐的業(yè)務(wù)高度集中和信息存儲網(wǎng)絡(luò)化不但使得信息數(shù)據(jù)的重要性日益凸顯,同時也加大了各類風(fēng)險的發(fā)生概率和信息資產(chǎn)的脆弱程度。一旦遭受水災(zāi)、火災(zāi)、地震、戰(zhàn)爭、恐怖襲擊等大型災(zāi)難,正常社會秩序受到?jīng)_擊,各種矛盾和沖突必將產(chǎn)生,后果嚴重,比如經(jīng)濟損失、社會動蕩、政府失效等。對于公眾機構(gòu),如何在威脅面前保護信息化的資產(chǎn),提供不間斷的政府服務(wù)是當(dāng)局者需認真考慮的問題。近幾年,隨著我國金保信息化工作的深入開展,主要核心業(yè)務(wù)系統(tǒng)已經(jīng)逐漸實現(xiàn)省級集中。如何保障省級數(shù)據(jù)中心持續(xù)、穩(wěn)定運行已經(jīng)引起高度關(guān)注,容災(zāi)備份建設(shè)已經(jīng)成為當(dāng)前金保信息化的重點工作之一。
系統(tǒng)現(xiàn)狀分析
金保工程--公積金業(yè)務(wù)系統(tǒng)是利用先進的信息技術(shù),以中央、省、市三級網(wǎng)絡(luò)為依托,涵蓋縣、鄉(xiāng)等基層機構(gòu),支持勞動和社會保障業(yè)務(wù)經(jīng)辦、公共服務(wù)、基金監(jiān)管和宏觀決策等核心應(yīng)用,覆蓋全國的統(tǒng)一的勞動和社會保障電子政務(wù)工程。
肇慶市的公積金系統(tǒng)運行在兩臺IBMAIX小型機上,兩臺IBM小型機組建成IBMDB2負載均衡式集群,后端連接IBMDS5020專業(yè)級磁盤陣列,磁盤共配置16塊600GBSAS磁盤,通過8G的光纖主機通道連入上層冗余FC交換機,IBMAIX小型機應(yīng)用服務(wù)器使用WEBLOGIC中間件。
在數(shù)據(jù)離線保護上采用IBMTSM連接IBM物理磁帶庫實現(xiàn)數(shù)據(jù)的離線保存。
為保障肇慶市金保系統(tǒng)持續(xù)穩(wěn)定運行,有效地保護重要的業(yè)務(wù)數(shù)據(jù),提高信息系統(tǒng)應(yīng)對災(zāi)難和風(fēng)險的能力,化解數(shù)據(jù)集中帶來的數(shù)據(jù)安全風(fēng)險和業(yè)務(wù)運行風(fēng)險,本方案將在肇慶市建設(shè)兩套統(tǒng)一的異地災(zāi)備中心。
針對公積金業(yè)務(wù)系統(tǒng)可能存在的風(fēng)險因素,通過對公積金業(yè)務(wù)系統(tǒng)過去十年來主要停機事故的故障調(diào)研分析,公積金業(yè)務(wù)系統(tǒng)主要災(zāi)難類型分布比例,如下圖所示:
在上圖各項主要災(zāi)難類型中,數(shù)據(jù)庫故障、軟件故障、應(yīng)用故障、網(wǎng)絡(luò)等技術(shù)類故障導(dǎo)致的風(fēng)險成為公積金業(yè)務(wù)系統(tǒng)的首要抵御目標,而自然災(zāi)害、社會動亂和恐怖活動等大型災(zāi)難類型盡管發(fā)生概率很低,但鑒于其對正常運營和社會影響范圍極大。因此也是金保系統(tǒng)需要重點防范的災(zāi)難風(fēng)險類型。
從災(zāi)難發(fā)生的可控度分析,90%的災(zāi)難通過完備的事前災(zāi)難預(yù)防和完善的容災(zāi)項目實施,都能得到有效控制,10%的事件由于導(dǎo)致災(zāi)難發(fā)生的主觀性、低概率和非預(yù)見性,成為整個系統(tǒng)內(nèi)數(shù)據(jù)安全和業(yè)務(wù)保障的不可控因素。因此,在災(zāi)備中心的規(guī)劃和建設(shè)過程中,應(yīng)在全面分析考慮災(zāi)難類型基礎(chǔ)上,加強對各類災(zāi)難風(fēng)險的針對性防范工作。
面臨挑戰(zhàn)
一、信息系統(tǒng)的可靠性需要從主機,網(wǎng)絡(luò),存儲多個層面綜合保障?,F(xiàn)有的公積金管理系統(tǒng)在業(yè)務(wù)層借助于兩臺IBMAIX平臺集群來實現(xiàn)業(yè)務(wù)的不停機運行;在鏈路上借助于冗余FC交換機來實現(xiàn)訪問路徑的切換和接管,F(xiàn)C交換機后端通過8G的光纖主機通道連接后端的IBMDS5020光纖存儲,IBMAIX、FC交換機和IBMDS5020形成了典型的SAN網(wǎng)絡(luò)。公積金應(yīng)用層業(yè)務(wù)系統(tǒng)和鏈路已實現(xiàn)一對一冗余,可實現(xiàn)自動的故障轉(zhuǎn)移,但后端只有一臺IBMDS5020,在線生產(chǎn)數(shù)據(jù)只有一份,一旦IBMDS5020出現(xiàn)軟件或硬件故障時極有可能導(dǎo)致公積金數(shù)據(jù)不完整甚至是數(shù)據(jù)丟失。
二、現(xiàn)有的公積金管理中心的核心數(shù)據(jù)存入IBMDS5020在線存儲,借助于IBMTSM災(zāi)備平臺將數(shù)據(jù)定時的歸檔至IBM磁帶庫中,一旦公積金數(shù)據(jù)遭到病毒破壞或人為誤操作時,需要花費大量的時間從IBM磁帶庫中恢復(fù)數(shù)據(jù),IBMDS5020中的數(shù)據(jù)類型屬結(jié)構(gòu)化數(shù)據(jù)(DB2),結(jié)構(gòu)化數(shù)據(jù)表與表之間聯(lián)系緊密,從IBM磁帶庫中恢復(fù)的數(shù)據(jù)是否能用將很難叛定。
三、公積金管理中心現(xiàn)有的IBMTSM災(zāi)備方式采用定時備份,一量數(shù)據(jù)遭到邏輯故障時,RPO難以保障,直接將丟失公積金數(shù)據(jù)。
四、現(xiàn)有的公積金管理系統(tǒng)缺乏對數(shù)據(jù)安全備份、恢復(fù)、應(yīng)急事件處理等工作的規(guī)范和規(guī)章制度,缺少緊急事件應(yīng)急響應(yīng)預(yù)案,缺乏演練和面對緊急事件時缺乏經(jīng)驗;
解決方案
肇慶市公積金管理中心解決方案拓撲:
該規(guī)劃方案立足于肇慶市公積金管理中心信息系統(tǒng)基礎(chǔ)架構(gòu)規(guī)劃與實踐,著眼于公積金管理中心數(shù)據(jù)安全、存儲級容災(zāi)和數(shù)據(jù)級異地容災(zāi)三大主題,本方案按照功能實現(xiàn),將整個規(guī)劃方案分成三大模塊模塊:
數(shù)據(jù)存儲層
數(shù)據(jù)安全是肇慶市公積金管理中心的方案設(shè)計基礎(chǔ),磁盤陣列直接承載著數(shù)據(jù)不丟失的安全,在本方案中利舊現(xiàn)有的IBMDS5020磁盤陣列,在不改變現(xiàn)有FC-SAN網(wǎng)絡(luò)架構(gòu)及應(yīng)用環(huán)境的情況下,以旁路方式增加一臺InfortrendDS3016高性能磁盤陣列和InfortrendSMA容錯存儲引擎為肇慶市公積金管理中心打造核心數(shù)據(jù)集中存儲、存儲級HA整合方案。
借助于InfortrendDS3016專業(yè)級磁盤陣列來保障數(shù)據(jù)安全,通過InfortrendDS3016存儲系統(tǒng)實現(xiàn)公積金業(yè)務(wù)數(shù)據(jù)的統(tǒng)一存儲,InfortrendDS3016是Infortrend針對核心業(yè)務(wù)系統(tǒng)推出的企業(yè)級FC-SAN/IP-SAN存儲系統(tǒng),它融入了8Gb光纖/1GISCSI、硬件級校驗芯片、CacheSafe、全冗余控制器設(shè)計等優(yōu)勢技術(shù),借助于這些優(yōu)勢技術(shù)為肇慶市公積金管理中心核心業(yè)務(wù)數(shù)據(jù)中心提供高可靠、高性能的數(shù)據(jù)存儲服務(wù)。
u存儲容錯---InfortrendSMA存儲級容錯引擎
信息系統(tǒng)的可靠性需要從主機,網(wǎng)絡(luò),存儲多個層面綜合保障。傳統(tǒng)的解決方案中,通過全冗余SAN交換機配置解決鏈路和網(wǎng)絡(luò)層的可靠性問題;通過集群軟件保障業(yè)務(wù)層的可靠性和業(yè)務(wù)連續(xù);在存儲的容錯上,本期采用InfortrendSMA存儲容錯網(wǎng)關(guān)來實現(xiàn)存儲級容災(zāi)。針對存儲系統(tǒng)的單點故障,InfortrendSMA容錯存儲系統(tǒng)正是迎合市場需求,為消除存儲設(shè)備單點故障打造的全新解決方案。InfortrendSMA實現(xiàn)了存儲級的HA,它可管理后端磁盤陣列系統(tǒng),并能夠在兩套存儲間自動進行持續(xù)數(shù)據(jù)復(fù)制,實現(xiàn)存儲鏡像及數(shù)據(jù)的實時同步。
在肇慶市公積金管理中心數(shù)據(jù)中心機房部署一套InfortrendSMA存儲容災(zāi)設(shè)備,InfortrendSMA存儲容錯模塊通過存儲引擎和統(tǒng)一的LUN分別管理兩套獨立的IBMDS5020和InfortrendDS3016存儲系統(tǒng),兩套存儲系統(tǒng)的存儲空間經(jīng)FC通道MAP給InfortrendSMA容錯引擎。實現(xiàn)任何一端存儲故障或SMA引擎故障都將實現(xiàn)‘秒’級切換和自動接管。
故障模擬:
當(dāng)一臺IBMDS5020存儲系統(tǒng)出現(xiàn)軟件或硬件故障時,另一套InfortrendDS3016鏡像存儲作為主存儲將直接對外提供服務(wù),兩套存儲間的切換時間完全基于秒級自動完成,對公積金應(yīng)用來講完全透明,沒有任何停機或延時情況出現(xiàn)。
待IBMDS5020故障存儲設(shè)備維修完畢,InfortrendSMA將通過反向同步技術(shù)將數(shù)據(jù)從InfortrendDS3016自動回滾數(shù)據(jù)至IBMDS5020存儲,以此實現(xiàn)兩臺存儲數(shù)據(jù)同步狀態(tài)。InfortrendSMA高可用存儲使數(shù)據(jù)實現(xiàn)多重在線保險,業(yè)務(wù)連續(xù)性有了切實保障。
在應(yīng)對公積金業(yè)務(wù)系統(tǒng)讀取訪問時,InfortrendSMA將需要處理的IO自動的分發(fā)給后臺的IBM和Infortrend兩組MIRROR存儲,兩份數(shù)據(jù)同時讀取,讀取性能呈一倍提升。
對于上層公積金應(yīng)用服務(wù)器和數(shù)據(jù)庫等業(yè)務(wù)系統(tǒng)而言,后端的IBM和Infortrend兩臺存儲系統(tǒng)列表現(xiàn)為一個具有冗余路徑的標準SCSI存儲卷,可基于該卷部署卷管理及雙機系統(tǒng),在主存儲節(jié)點完全癱瘓時,部署在IBMAIX服務(wù)器上的多路徑程序會自動將數(shù)據(jù)訪問路徑導(dǎo)向備用存儲節(jié)點,從而保障業(yè)務(wù)系統(tǒng)可持續(xù)訪問存儲設(shè)備。
通過InfortrendSMA解決方案的部署,主機、網(wǎng)絡(luò)和存儲之間構(gòu)成了端到端的全冗余配置,即使主存儲完全癱瘓,也不會影響前端業(yè)務(wù),實現(xiàn)了最大的業(yè)務(wù)連續(xù)性保障。
數(shù)據(jù)級異地容災(zāi)
當(dāng)硬件問題、配置改變、應(yīng)用程序故障、病毒攻擊或是惡意黑客攻擊,都可以使企業(yè)的服務(wù)器癱瘓。那么至關(guān)重要的問題是在業(yè)務(wù)受到影響之前有多少時間來恢復(fù)數(shù)據(jù)與應(yīng)用程序,傳統(tǒng)的方法可能需要幾個小時到幾天來恢復(fù)服務(wù)器。
新增一臺DELLR420機架式服務(wù)器,在DELLR420服務(wù)器上部署CommVault備份軟件,在需要保護的IBMAIX服務(wù)器上安裝CommVault備份軟件代理客戶端,通過代理客戶端與備份服務(wù)器建立連接。
在CommVault的備份服務(wù)器上設(shè)定針對AIX中DB2要保護的數(shù)據(jù)和應(yīng)用制定保護策略,可選擇定時或?qū)崟r的方式將數(shù)據(jù)備份至DELLR420中,當(dāng)業(yè)務(wù)數(shù)據(jù)出現(xiàn)邏輯故障時,可利用備份的數(shù)據(jù)副本對數(shù)據(jù)進行快速恢復(fù)。
數(shù)據(jù)異地級容災(zāi)以本地容災(zāi)為基礎(chǔ),借助于公積金管理中心的DELLR420備份服務(wù)器中的介質(zhì)同步代理技術(shù)實時的將本地數(shù)據(jù)容災(zāi)至異地。在數(shù)據(jù)異地容災(zāi)平臺上,可根據(jù)兩地間鏈路的帶寬和每天平均增量數(shù)據(jù)的大小來選擇調(diào)整數(shù)據(jù)壓縮率或去重技術(shù)的啟動。
客戶收益
通過建立完整的備份系統(tǒng),為肇慶市公積金管理平臺提供一個領(lǐng)先的備份與恢復(fù)及服務(wù)整合方案,將為用戶帶來如下的利益:
1.風(fēng)險最小化-通過采用高可用性容災(zāi)技術(shù)和完善的人員組織建設(shè)和培訓(xùn),以及周密的流程設(shè)計和測試演練,建立起一套可行的災(zāi)難恢復(fù)流程,最大限度的降低突發(fā)性災(zāi)難對您關(guān)鍵業(yè)務(wù)環(huán)境的影響。
2.投資回報最大化-Infortrend公司高可用性項目管理專家豐富的知識和經(jīng)驗,結(jié)合廣泛驗證的方法和設(shè)計技術(shù)將大大縮短實現(xiàn)容災(zāi)方案的時間,降低方案實施過程中對現(xiàn)有業(yè)務(wù)系統(tǒng)的影響。
3.改善性能-通過全面而客戶化的系統(tǒng)配置和災(zāi)難恢復(fù)流程文檔以及有針對性的知識移交過程,確保您的IT支持人員能在方案實施結(jié)束后對整個容災(zāi)系統(tǒng)進行有效管理。
4.增加靈活性-Infortrend公司還提供后期的關(guān)鍵業(yè)務(wù)容災(zāi)系統(tǒng)的支持服務(wù),提供包括快速響應(yīng),及時修復(fù)等針對容災(zāi)設(shè)備的支持,還可以提供定期的容災(zāi)系統(tǒng)評估和災(zāi)難恢復(fù)演習(xí)的服務(wù),確??蛻舻娜轂?zāi)系統(tǒng)可以隨時待命,并且恢復(fù)流程切實可行。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。