IBM Platform LSF(Load Sharing Facility)产品系列是强大的工作负载管理平台,用于要求苛刻的分布式关键业务型 HPC 环境。
IBM Platform LSF 拥有一系列可选附加组件,旨在帮助其实现工作负载管理、进而提升用户生产效率。
IBM Platform Application Center 提供一套可自定制化 Web 界面,帮助用户管理作业并分析集群资源利用状况。它还提供一套易用性出色的使用界面,能够在无需编程的前提下实现作业提交。用户可以查看作业状态及作业结果,对作业进行操作(例如挂起或恢复),并对作业输入、输出及错误文件实现可视化。
IBM Platform Application Center 还提供一套信息仪表板,其中包含大量细节信息——例如集群健康状况以及集群性能统计结果,还包括每台主机的资源使用情况报告。大家可以创建一套机架配置方案以代表当前环境,并通过 rackconfig 命令将设备分配至合适的机架。
最大支持能力: IBM Platform Application Center 能够支持的最大机架尺寸为42U(不可配置)。
该软件提供多种最为常用的应用程序模板,能够通过定制及发布实现解决方案的快速创建。除此之外,用户还可以针对具体需求创建属于自己的模板,从而使作业提交更简便、更快速、错误率更低。
该产品提供一系列内置集群分析报告功能。这些报告涵盖集群改进过程中所涉及的各种常见类型。用户也可以通过Web界面创建自定义报告以满足特定需求。
IBM Platform Application Center 还可以与 IBM Platform License Scheduler(简称LS)与 IBM Platform Process Manager(简称PPM)相集成。这种集成化方案能够帮助用户以可视化方式掌握整个集群的许可使用情况。大家可以通过一套Web界面对作业流程执行以及触发流程进行监控;也就是说,大家能够以集中化方式控制LSF集群的全局状态。

随着集群规模及工作负载的不断增长,集群管理员需要更为强大的工具以完成集群管理及监控任务,从而确定有可能对性能产生负面影响的各类问题。此外,管理员们还需要一款能够追踪集群各方面状态、同时又无需通过多种来源进行集群信息收集的工具。
IBM Platform RTM 通过为 IBM Platform LSF 环境提供一套综合性工作负载监控、报告以及管理工具以解决上述问题:
- 提供指向集群内工作负载与主机具体信息的访问途径;
- 允许用户创建警告及多种图形类型;
免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删