近年来,高校信息化建设突飞猛进,随之而来的运维和管理挑战也逐渐凸显,并愈发受到业界关注。为助力中南大学智算平台解决传统人力运维管理难题,浪潮信息以自研ISPIM平台为核心,为其量身打造了自动化运维解决方案,从而使运维效率大幅度提升。
中南大学智算平台作为一个硬件先进、功能齐全、资源丰富,面向全校师生提供高性能计算服务的开放性公共服务基础设施,拥有高达上千台各种类型的计算服务器,在满足科研人员大量计算资源需求的同时,大量集中部署的计算服务器集群对管理和运维人员提出了新的挑战。基于传统运维模式既无法实现对计算集群快速而精准的有效运维,也造成了运维人力资源的沉重负担。对此,浪潮信息提出了以自研ISPIM(Inspur Physical Infrastructure Manager)浪潮信息物理基础设施管理平台为核心的自动化运维解决方案。
在方案设计过程中,浪潮信息研发工程师通过实地考察、调研并与中南大学HPC平台管理和技术人员进行多次反复的交流、沟通和分析、研究,最终决定以“1+1+N高可用模式”,在5台服务器上部署ISPIM系统,主动采集频率为45min,监控指标可达150W+,覆盖智算平台内的所有设备。得益于浪潮信息ISPIM平台丰富、强大的功能,在部署浪潮信息的自动化运维解决方案后,中南大学智算平台不仅大大减轻了运维负担,算力的管控也更加集中化、智能化;同时,运维人员还能够通过浪潮信息ISPIM平台随时随地监控整个平台的运行状态,实现能耗可查、可管、可控。另外,由于ISPIM平台故障报警能够以秒级的速度精准定位,中南大学智算平台的高效有序运转从而得到了进一步的保障。
在各行业领域数字化智慧化转型不断加快的情况下,大型企业或组织未来对大规模计算服务集群的需求还将持续增长,面对与之相伴的运维压力,浪潮信息将充分发挥自身技术产品等优势,一如既往地为用户提供全面综合IT运维管理解决方案。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。