摘要:对于多种技术和高性能计算 (HPC) 数据中心,管理当前复杂的集群环境需要大量时间而且开销极大。随着数据中心规模的发展,管理多个集群也成为一项挑战。 |
对于虚拟机来说,应首先通过PCM适配器KVM管理程序主机进行添加与配置。接下来,在基于KVM集群定义的集群实例创建完成之后,管理程序即可开始进行虚拟机托管。可以通过门户对设备进行添加、删除、启动/关闭以及SHH指定。举例来说,通过Resources Cockpit中的Machines标签,可以看到一套包含所有物理及虚拟资源的列表以及KVM管理程序主机(如图2所示)。这里还提供用于各类管理任务的对应菜单。如果该设备为虚拟设备,用户还可以打开其远程控制台。
图3
集群管理
在Clusters主标签的cockpit中,可以查看集群对象并执行管理任务,例如开启/关闭集群、删除过期或者作废的集群、从活动集群中添加或者移除设备。如图3所示,还可以查看集群的配置状态、各集群到期关闭并将资源返还资源池的具体时间,此外,管理员可以对用户的集群进行实例化。
HPC集群自助服务
管理员可以创建并管理集群定义,定义的起效方式与模板类似,用户需要在对集群进行实例化时选择合适的定义。要创建一套集群定义,用户需要在Cluster Designer窗口中点击Cluster Definition链接(如图4所示)并选择New。通过ClusterDesigner可以对集群进行多种定义,例如为定义指定名称、用户以及部署变量 ,调节政策,集群过期选项等。
在Cluster Designer当中,可以指定一个或多个与集群相适应的层(例如LSF Master层或者LSF Compute层)。每个层定义都拥有与以下内容相关的属性:
主机名称
每层设备数据(例如一套LSF集群中只能容纳一台主控主机)
操作系统类型
IP分配
服务器选择政策
管理员/root密码生成
图4