谈到CPU架构,脑海中(zhōng)必然浮现出以X86為(wèi)代表的复杂指令集CISC和以ARM為(wèi)代表的精(jīng)简指令集RISC。顾名(míng)思义,相对于复杂指令集,RISC更“精(jīng)简”,同时拥有(yǒu)多(duō)線(xiàn)程、并发能(néng)力强、高吞吐的显著优势,如今软件是否能(néng)够兼容ARM架构成了考量条件之一,服務(wù)应用(yòng)迁移至配备RISC微处理(lǐ)器的ARM云平台成為(wèi)了大势所趋。
奥工(gōng)科(kē)技(jì )融合计算服務(wù)门户OGSP凭借其优秀的移植能(néng)力和兼容性,率先完成了华為(wèi)云鲲鹏云的兼容性认证,奥工(gōng)服務(wù)小(xiǎo)分(fēn)队更与华為(wèi)携手于南京搭建了首个全ARM环境的超算平台——ARM(鲲鹏)超算联合实验室,并安(ān)装(zhuāng)部署了已实现兼容的OGSP保障集群高效运维管理(lǐ)。本篇就让我们看看当OGSP遇上鲲鹏ARM会碰撞出什么样的火花(huā)吧!
X86架构自诞生已有(yǒu)三十年,随着“云+AI+5G”快速发展,X86架构功耗大、通用(yòng)寄存器数量少、计算机硬件利用(yòng)率低等不足愈发明显。ARM架构凭借着“低功耗”的显著优势宛如“异军突起”,乘着高速推进的算力巨轮,在移动互联网盛行的当下开始了大规模使用(yòng)。ARM这一优势对于规模庞大的超算中(zhōng)心来说,可(kě)以日积月累地降低耗能(néng)费用(yòng),从而大大减少用(yòng)户对集群的开支费用(yòng),话句话是就是“省钱”。既然省钱,何乐而不為(wèi)呢(ne)?
自去年一月,华為(wèi)宣布推出业界最高性能(néng)ARM-based处理(lǐ)器-鲲鹏920(Kunpeng920),以及基于鲲鹏920的TaiShan服務(wù)器、华為(wèi)云服務(wù),充分(fēn)发挥ARM架构在多(duō)核、高效能(néng)等方面的优势,从硬件、基础软件和应用(yòng)三个层面构建ARM生态环境,并积极融入全球ARM生态中(zhōng),致力于共同推进ARM进阶為(wèi)下一代计算机平台。奥工(gōng)科(kē)技(jì )作(zuò)為(wèi)专业的融合计算服務(wù)提供商(shāng),自研服務(wù)产(chǎn)品适配X86、 X86&XARM、ARM等各类架构是产(chǎn)品研发的基本要求之一,更是我们提供专业全栈服務(wù)至关重要的保障。
X86上的软件如果想要适配迁移上ARM并不简单,需要处理(lǐ)好指令集上的差异,才能(néng)使得原来运行在x86架构下的程序能(néng)够平稳运行于ARM平台,一般需要进行以下几步:
OGSP在开发初期,就被赋予了很(hěn)强的移植能(néng)力和兼容性。前期的迁移分(fēn)析发现OGSP架构是前后台分(fēn)离,和常用(yòng)的mariadb数据库 redis中(zhōng)间件一起组成,由于mariadb数据库 redis中(zhōng)间件已经做好了ARM通用(yòng)的容器镜像,因此可(kě)以直接使用(yòng)。而前后台的编码主要是解释型语言,其JDK、PVM已经把上层的一些跟指令集相关的东西屏蔽掉了,加上使用(yòng)容器化部署,只需要把源码在ARM环境上重新(xīn)构建出docker 镜像即可(kě)。镜像做好后,测试工(gōng)程师会针对功能(néng)、性能(néng)在进行ARM环境验证,最终优化性能(néng)完成迁移适配工(gōng)作(zuò)。
适配完成后,产(chǎn)品部对OGSP进行了全面的适配性能(néng)测试,结果表明OGSP部署在ARM环境上的web服務(wù)器响应时间相对更快,同时验证了OGSP能(néng)够应对不同业務(wù)场景时所使用(yòng)基于鲲鹏云的性能(néng)需求,因此获得华為(wèi)鲲鹏和TaiShan的兼容性认证证书。
2019年,奥工(gōng)科(kē)技(jì )加入鲲鹏凌云伙伴计划,紧接着又(yòu)于今年加入了鲲鹏展翅伙伴计划,自研的OGSP更是首批通过了鲲鹏和TaiShan的双重认证,成為(wèi)了既兼容华為(wèi)云鲲鹏云,又(yòu)兼容TaiShan系统服務(wù)器的综合性运营服務(wù)门户。
作(zuò)為(wèi)江苏鲲鹏计算产(chǎn)业联盟成员和华為(wèi)鲲鹏深度合作(zuò)伙伴,除了让自研的OGSP第一时间通过兼容性认证,奥工(gōng)服務(wù)小(xiǎo)分(fēn)队更是率先测试了Lustre在ARM平台上运行的可(kě)行性和可(kě)靠性,大量测试数据和多(duō)年的搭建经验确保了奥工(gōng)小(xiǎo)分(fēn)队具(jù)备搭建ARM平台的能(néng)力。今年年初,华為(wèi)携手奥工(gōng)科(kē)技(jì )于南京江北共同搭建了江苏第一个全ARM环境的超算平台,同时这也是全國(guó)第一个教育行业的全ARM超算平台。
虽然OGSP已经完成了鲲鹏适配,在ARM服務(wù)器上部署运行没完全问题的,但面对这样一个“全ARM”环境还是第一次。想要管理(lǐ)好这样的全ARM集群,自然需要再下点功夫。在原本适配的基础上,还需要对安(ān)装(zhuāng)在集群节点中(zhōng)代理(lǐ)程序再次进行适配,代理(lǐ)程序是解释性语言,可(kě)以源码直接运行。通过测试,代理(lǐ)程序也可(kě)直接在ARM环境上运行,而且由于其显著的优点,代理(lǐ)程序的处理(lǐ)数据能(néng)力相比x86环境提高大约了22%!至此,OGSP可(kě)以在X86环境、X86&ARM异构环境以及全ARM环境应用(yòng)自如。
(实验室OGSP界面展示)
最后要说的是,ARM(鲲鹏)超算联合实验室全部采用(yòng)华為(wèi)TaiShan鲲鹏服務(wù)器,由奥工(gōng)专业团队负责搭建维护,助力各大高校师生将更多(duō)应用(yòng)迁移至ARM平台,着力培养具(jù)备华為(wèi)鲲鹏产(chǎn)业发展所需基于鲲鹏生态的软件适配、迁移、软件开发、解决方案孵化等技(jì )术能(néng)力的高校人才。
OGSP(Ongineer Service Platform)是奥工(gōng)科(kē)技(jì )自主研发的一款面向终端计算用(yòng)户的、安(ān)全、可(kě)进化的密集计算服務(wù)平台。
OGSP秉承云原生设计理(lǐ)念,搭建密集计算场景中(zhōng)基础侧、平台侧、应用(yòng)侧的生态服務(wù)架构,谋求基础侧的稳定、健康、可(kě)扩展性;平台侧的高效、动态、易用(yòng)性;应用(yòng)侧的专业、交互、场景化。将服務(wù)产(chǎn)品化、产(chǎn)品场景化,為(wèi)用(yòng)户提供基于实际生产(chǎn)场景的一站式密集计算服務(wù)。
hwclould@ongineer.cn
南京市雨花(huā)台區(qū)锦绣街(jiē)绿地之窗C4栋326室
025-86738812
版权所有(yǒu) ©南京奥工(gōng)信息科(kē)技(jì )有(yǒu)限公(gōng)司 京ICP证000000号
技(jì )术支持:网站建设