奥工(gōng)自研OGSP是一款為(wèi)HPC&BigData&AI三大领域客户提供融合计算一站式服務(wù)的融合计算服務(wù)门户。今年年初,OGSP2.0版本正式上線(xiàn),在2.0和3.0跨越之间,奥工(gōng)研发部巧妙地进行了稳定而平缓的过渡——OGSP2.5版本应运而生。
前不久,OGSP2.5在“2020秋季超算技(jì )术服務(wù)研讨会”上进行了简单展示与介绍。与2.0版本相比,在其基础上进行了功能(néng)细化、交互优化、架构调整,页(yè)面美化。近日,奥工(gōng)小(xiǎo)分(fēn)队将為(wèi)客户进行OGSP的系统升级与维护,本篇就让我们一起来看看2.5版本的升级过程是怎样的吧!
01/背景介绍
本次升级的客户集群相对比较大、计算资源多(duō)、尤其是集群用(yòng)户数量多(duō)——集群设计用(yòng)户迁移数据量达到1000+。
与此同时,本次升级的版本之间跨度大。由于各个集群实际需求与安(ān)装(zhuāng)时间点不同,所以目前服務(wù)的30+ 客户中(zhōng)安(ān)装(zhuāng)版本不一。本次服務(wù)的客户是奥工(gōng)小(xiǎo)分(fēn)队的老客户了,可(kě)以说是“第一个吃螃蟹的人”。基于对1.0版本的认可(kě),客户集群一直在使用(yòng)OGSP并且為(wèi)我们产(chǎn)品升级提出了很(hěn)多(duō)宝贵意见。奥工(gōng)小(xiǎo)分(fēn)队实时关注客户需求,本次直接从1.0升级到2.5。
本次升级是2.5发布以来首次跨版本升级,升级迁移跨度较大,产(chǎn)品架构改动多(duō)。通过本次升级,客户集群运维品质(zhì)和日常管理(lǐ)效率都将得到显著提升。
02/前期准备
升级前准备工(gōng)作(zuò)的重要性不言而喻,OGSP2.5的升级前期准备包括了数据准备和对接信息准备。由于集群庞大、数据多(duō)且零散,数据准备步骤需要花(huā)费大量的人力和时间。奥工(gōng)小(xiǎo)分(fēn)队需要将OGSP1.0数据库中(zhōng)所有(yǒu)的用(yòng)户和用(yòng)户组数据导出EXCEL,并提取其中(zhōng)相关数据按照2.5版本进行整理(lǐ)。除了用(yòng)户数据,还需要在OGSP1.0页(yè)面上查看对应的财務(wù)数据、明确相关财務(wù)数据在1.0版本的相关页(yè)面上。
然后准备相应的对接信息,根据集群环境获取到mgt节点的主机名(míng),并根据超算集群中(zhōng)部署的文(wén)件系统信息整理(lǐ)出文(wén)件系统挂载点、文(wén)件系统类型及目录结构等。
03/中(zhōng)期部署
OGSP具(jù)有(yǒu)了很(hěn)强的移植能(néng)力和兼容性,并在一次次版本升级中(zhōng)被不断增强优化。之前和大家提到的docker部署在2.5升级过程中(zhōng)也被贯彻执行了,只需要将打包好的2.5docker镜像包导入到mgt节点即可(kě):
然后,就可(kě)以到浏览器端访问ogsp2.5的页(yè)面了。在页(yè)面上,我们还需要对前期准备的对接信息进行2.5的一些设置,设置完OGSP2.5即可(kě)正常使用(yòng)。
04/数据迁移
前期准备的数据在这里就派上用(yòng)场了,数据迁移可(kě)以分(fēn)為(wèi)用(yòng)户数据与财務(wù)数据。用(yòng)户数据迁移首先通过数据库将OGSP2.5相关用(yòng)户数据进行备份,然后将前期准备的用(yòng)户数据迁移excel通过OGSP2.5页(yè)面(用(yòng)户管理(lǐ))直接导入。
财務(wù)数据迁移,需要先在OGSP1.0页(yè)面上查看到的各个用(yòng)户的财務(wù)数据,然后按顺序手动录入到OGSP2.5的充值扣费中(zhōng),如下:
05/计费核算
在以上步骤都完成后,最后需要对整个数据进行核算,确保数据的准确无误,更要确保“迁移后的数据”和“客户提供的数据”以及“OGSP1.0系统的数据”三方一致。
OGSP2.5升级“简单”且“复杂”,“简单”在于其本身是的优秀的移植能(néng)力和兼容性,“复杂”便在于集群越大整體(tǐ)工(gōng)作(zuò)量越大,像本次集群用(yòng)户数多(duō)达1000+,数据的整理(lǐ)与迁移涉及到的工(gōng)作(zuò)量也是非常可(kě)观的。
OGSP2.5作(zuò)為(wèi)2.0和3.0的衔接,在功能(néng)呈现上不会有(yǒu)“翻天覆地”的变化,奥工(gōng)研发团队秉承着“小(xiǎo)变动,大不同”的原则,在看似变动不大的2.5版本上集中(zhōng)力量优化用(yòng)户感受,让客户真实感受到我们在不断努力,不断“想客户所想”的提升集群效率。
OGSP(Ongineer Service Platform)是奥工(gōng)科(kē)技(jì )自主研发的一款面向终端计算用(yòng)户的、安(ān)全、可(kě)进化的密集计算服務(wù)平台。
OGSP秉承云原生设计理(lǐ)念,搭建密集计算场景中(zhōng)基础侧、平台侧、应用(yòng)侧的生态服務(wù)架构,谋求基础侧的稳定、健康、可(kě)扩展性;平台侧的高效、动态、易用(yòng)性;应用(yòng)侧的专业、交互、场景化。将服務(wù)产(chǎn)品化、产(chǎn)品场景化,為(wèi)用(yòng)户提供基于实际生产(chǎn)场景的一站式密集计算服務(wù)。
hwclould@ongineer.cn
南京市雨花(huā)台區(qū)锦绣街(jiē)绿地之窗C4栋326室
025-86738812
版权所有(yǒu) ©南京奥工(gōng)信息科(kē)技(jì )有(yǒu)限公(gōng)司 京ICP证000000号
技(jì )术支持:网站建设