随着近几年集群安(ān)全问题频发,“如何保证集群系统安(ān)全及业務(wù)连续性”成為(wèi)了IT系统运行中(zhōng)广受关注的问题。往期“Geeki说”和大家分(fēn)享了奥工(gōng)自研OGCR的监控告警防护和堡垒机对集群服務(wù)器的整體(tǐ)保护,那么本期就让我们目光转向“集群数据安(ān)全”,和大家聊一项非常有(yǒu)效的数据灾备应对方式——存储双活。
為(wèi)了应对数据安(ān)全风险,“不把数据放在同一个存储里”——存储双活解决方案应时而生。所谓“存储双活”是指主备两个存储都能(néng)够被读写访问,当源端故障,备端能(néng)够及时接管业務(wù)的阵列方式。这种方式使得信息在同一数据中(zhōng)心内部存储与存储之间实现共享、共取或移动,从而将各种不同的存储系统联合成為(wèi)单一资源,节约资源的同时保障数据安(ān)全。 存储双活具(jù)體(tǐ)来说还分(fēn)為(wèi)存储网关双活、Active-Passive 双活和Active-Active 双活。存储网关双活可(kě)以在对磁盘阵列虚拟化接管后,再实现双活。Active-Passive 双活即所谓的“伪”双活,仅读写一台存储能(néng)够做故障切换。Active-Active 双活即“真”双活,双活的两个存储可(kě)同时被主机并发读写访问,实现“双读双写”。 在存储双活方案的制定过程中(zhōng),需要全方位的考虑,才能(néng)兼顾集群的效率与效益。从软硬件的支持、客户业務(wù)需求的分(fēn)析到数据的迁移、系统的管理(lǐ)与优化……每一个环节都不能(néng)忽视。 近期,奥工(gōng)小(xiǎo)分(fēn)队又(yòu)来“任務(wù)”了!由于单位的特殊性,客户对技(jì )术安(ān)全性要求极高,在安(ān)全与成本综合考虑下,我们最终决定為(wèi)其提供國(guó)产(chǎn)的华為(wèi)HyperMetro存储双活解决方案。下面,就让我们根据现场实际操作(zuò)环境来详细聊聊华為(wèi)的HyperMetro存储双活解决方案。 1 ● 组网说明 采用(yòng)两台新(xīn)存储设备构建為(wèi)双活存储系统(不增加安(ān)装(zhuāng)任何其他(tā)软件),如下图。当其中(zhōng)一台存储发生故障时,可(kě)由另一台存储实时接管业務(wù),实现RPO、RTO為(wèi)0。同时采用(yòng)双活组网保证业務(wù)的连续性,当一台存储发生故障,另外一台存储直接接管。当存储整體(tǐ)出现故障,虚拟化平台、业務(wù)应用(yòng)宕机后,能(néng)够快速进行恢复,最大提高业務(wù)连续性和应用(yòng)移动性。 2 ● 存储配置过程 本次解决方案中(zhōng)配置了2台带有(yǒu)双活软件的高端存储,每台配置2块960GB SSD,7块10TB NL SAS 硬盘。配置raid1 作(zuò)為(wèi)高速缓存用(yòng)于加速,6块10TB NLSAS,配置4+2的raid6用(yòng)于数据存储,再配置1 块10TB NL SAS 用(yòng)作(zuò)热备盘。 在存储双活之前首先要配置存储(两台存储配置要完全相同),我们本次选择的存储配置流程跟市面上大多(duō)数产(chǎn)品配置流程大抵类似,这里只做简单介绍不具(jù)體(tǐ)说明了:首先配置硬盘域,不同硬盘域之间业務(wù)互相隔离,然后再硬盘域中(zhōng)创建存储池,再创建LUN(本项目只需要在一台存储上创建LUN即可(kě))。 3 ● 存储双活配置过程 在正式配置存储双活之前有(yǒu)一系列的准备工(gōng)作(zuò),首先需要安(ān)装(zhuāng)并配置多(duō)路径软件、配置复制网络、配置仲裁网络,然后下载安(ān)装(zhuāng)包,解压执行命令一键安(ān)装(zhuāng)双活软件,再打开仲裁软件的CLI页(yè)面,配置仲裁服務(wù)器的业務(wù)IP地址,最后才开始配置存储双活。 接下来的所有(yǒu)步骤都是在存储端进行配置。首先需要添加鉴权用(yòng)户,然后增加遠(yuǎn)端设备(即另外一台存储),再配置双活域(双活域是遠(yuǎn)端设备、仲裁服務(wù)器与本端设备的集合。通过双活域,我们可(kě)以判断出不同的本端设备、遠(yuǎn)端设备及仲裁服務(wù)器之间的双活关系。)接着创建双活LUN和LUN pair,最后配置映射即可(kě)。 面对客户核心业務(wù)7*24小(xiǎo)时不间断运行和数据安(ān)全保护的需求,需要我们在“高效”与“安(ān)全”中(zhōng)间寻求一个平衡,双活架构就是一个不错的选择,能(néng)够很(hěn)好的保护业務(wù)系统的高可(kě)靠性与可(kě)伸缩性。 本期分(fēn)享就此结束啦,下一期将迎来Geeki说本年度的收官之作(zuò),别错过呀! —END—
OGSP(Ongineer Service Platform)是奥工(gōng)科(kē)技(jì )自主研发的一款面向终端计算用(yòng)户的、安(ān)全、可(kě)进化的密集计算服務(wù)平台。
OGSP秉承云原生设计理(lǐ)念,搭建密集计算场景中(zhōng)基础侧、平台侧、应用(yòng)侧的生态服務(wù)架构,谋求基础侧的稳定、健康、可(kě)扩展性;平台侧的高效、动态、易用(yòng)性;应用(yòng)侧的专业、交互、场景化。将服務(wù)产(chǎn)品化、产(chǎn)品场景化,為(wèi)用(yòng)户提供基于实际生产(chǎn)场景的一站式密集计算服務(wù)。
hwclould@ongineer.cn
南京市雨花(huā)台區(qū)锦绣街(jiē)绿地之窗C4栋326室
025-86738812
版权所有(yǒu) ©南京奥工(gōng)信息科(kē)技(jì )有(yǒu)限公(gōng)司 京ICP证000000号
技(jì )术支持:网站建设