高性能计算机统一资源管理系统的设计与实现
    点此下载全文
引用本文:沈瑜,李娟,常飚,孙婧.高性能计算机统一资源管理系统的设计与实现[J].计算技术与自动化,2014,(1):83-90
摘要点击次数: 1168
全文下载次数: 73
作者单位
沈瑜,李娟,常飚,孙婧 (国家气象信息中心 高性能计算室北京100081) 
中文摘要:高性能计算是气象业务及科研应用的重要的基础平台,中国气象局(CMA)近年来相继引进多套高性能计算机系统用以提高气象服务和研发能力。随着用户和应用的增加,如何有效管理高性能系统资源成为一个重要课题。本文详解介绍CMA高性能计算机系统统一资源管理平台的设计和实现,该系统可以对多套异构的高性能计算机系统进行统一的资源精细化统计分析和计费管理,通过该平台,系统管理员动态掌握系统的运行和资源使用情况,并据此调整系统资源分配调度策略,从而更合理高效的利用系统资源,有效提高系统运行效益。
中文关键词:高性能计算机系统  CPU利用率  计算资源  作业管理软件  资源账务信息库
 
Design and Implementation of the Uniform Resource Management System of HPC
Abstract:High performance computing is an important basic platform for meteorological operations and developments. China Meteorological Administration (CMA) has introduced several sets of HPC system to improve meteorological services and R&D capabilities.With the increase of users and applications, how to manage the HPC resources effectively has become an important subject.This article described the design and implementation ofthe unified resource management platform for CMA HPC systems, through the platform, the systemadministrators can dynamic grasp system resource usage, and adjust resource scheduling policy better, for a more rational and efficient use of system resources.
keywords:HPC system  CPU utilization  computing resource  job management software  resource accounting information DB
查看全文   查看/发表评论   下载pdf阅读器