项目介绍 国家超级计算中心IT4Innovations是捷克共和国VŠB—— 奥斯特拉瓦技术大学(VŠB-TUO) 中的一个研究机构,由欧盟运作项目“创新研究与开发”资助。">
2025年11月14日
配天机器人2025年11月14日
TE2025年11月14日
西门子2025年11月14日
新时达2025年11月14日
蔡司工业
2025年11月13日
埃尔森
2025年11月10日
BBS
2025年11月07日
劳易测
2025年11月06日
和利时
2025年11月14日
威图
2025年11月14日
TE
2025年11月14日
KUKA
2025年11月14日
先导智能
2025年11月14日
TDK

项目介绍
国家超级计算中心IT4Innovations是捷克共和国VŠB—— 奥斯特拉瓦技术大学(VŠB-TUO) 中的一个研究机构,由欧盟运作项目“创新研究与开发”资助。来自捷克共和国 各大主要科研机构的数以百计的研究人员在利用该中心进行计算工作。自2011年起, IT4Innovations便加入了享负盛名的欧洲PRACE超级计算中心网络,为来自欧洲其他国家 的研究人员提供计算资源。
挑战
IT4I 国家超级计算中心正在建造一台独一无二的超级计算机,用以支持该中心的用户所 进行的前沿计算研究。这台超级计算机由两部分构成:一部分是从 2013 年 6 月投入运行的 集群计算机系统 Anselm,另一部分是将于 2015 年初投入运行的更大规模的集群计算机系 统,后者有望跻身于全世界超级计算机一百强榜单。Anselm系统现已是捷克最大的集群计 算机系统,它作为DECI TIER-1 系统,是PRACE的一部分。有关这些系统的详细信息, 请访问 。
IT4I 国家超级计算中心主要有六个研究方向,分别使用计算流体动力学(CFD)和有限 元分析/有限元法 (FEA/FEM) 等方法处理多种计算问题,包括实时交通分析/管理、洪水建 模/预测、空气污染建模/预防、分子动力学仿真和新材料建模等。
面对形形色色的用户和应用,IT4I 意识到他们需要为超级计算中心用户提供一种可靠、 高性能的作业负载管理产品。在采购过程中,IT4I 要求提供高级作业调度程序和资源管理器 以及高级应用分析工具。在硬件供应商 Bull 的投标中,捆绑了满足这些要求的产品。
在采购过程中对于作业负载管理器设定的标准是:较高的计算资源效率和利用率;稳健的批量作业和交互作业运行;支持使用GPU/协处理器卡进行节点调度;支持作业依赖性和 作业阵列;确保操作的容错性和高可用性;具有用于调度与作业执行的静态和动态资源,包括软件许可证等外部动态资源;支持资源预留;支持回填;可向用户通知作业生命周期事件; 可对用户/用户组和资源进行限制或定额配给;拥有记录完备的高质量 API,支持 C 和 Python 等常见编程语言;以及许多其它特定技术要求。
“无疑我们需要一款高质量的调度程序——所有的超级计算中心都需要这样的程序,因 为确保资源利用率达到最高是计算中心成功的关键,”计算中心主任Martin Palkovič说道。 “当你投入如此多的时间、资源和精力来打造一个超级计算系统来支持数以百计的用户需求 时,就应当确保作业负载管理系统可靠无误,能够提供你需要的性能。”
解决方案
IT4I国家超级计算中心使用PBS Professional管理其新型Bull超级计算机,该超级计算机由200多位计划用户所共享。PBS Professional易于实施和使用,具有极高的可靠性,这些都是使其脱颖而出的关键优势。该中心还采用了PBS Analytics,并计划随着集 群机使用规模的扩大,对更多的产品进行考察评估。
为满足调度程序的严格采购要求,Bull的专家对很多商用开源产品进行了评估,最后决定推荐Altair PBS Professional®作为作业负 载管理器。
“要实现高质量大规模的作业负载管理,PBS Professional 是极佳的选择,”Bull 的 ISV 联盟主任 Olivier David 说道,“我们将 PBS Professional 和 bullx 超级计算机套装紧密集成,配以经过优化的 bullxMPI,可保证用户应用在 bullx 超级计算机上的高效利用。Bull 和 Altair 两家公司长期以来都为 HPC 市场呈献了很多广受赞誉的解决方案,这次联袂为客户提供的解决方案不但彰显了高性能和高稳健性, 而且适用于规模庞大的配置。”
IT4I 超级计算服务部总监 Branislav Jansík 对该决策进行了肯定,他说:“我们有很多选择,但是 PBS Professional 提供的解决方 案是最为先进成熟的方案之一,我们很高兴 Bull 选择在其产品中使用这款调度程序。”
Jansík 补充道:“我们已经能够熟练使用 PBS Professional 对我们在大学的 HPC 集群进行作业调度。不过,由于我们现在运作的 系统的规模巨大,我们想要重新开始,让供应商提供的新系统能够搭载他们能想到的最好的调度程序。令人高兴的是,PBS 依然脱颖而 出。”
凭借以往使用 PBS Professional 的经验,IT4Innovations 超级计算服务部的专家为所需的新调度程序定义了功能标准。Branislav Jansík解释说:“PBS Professional 在功能性上设定了一个高标准,我们选用的调度程序在功能上至少不能逊于此标准。”
最终,由于 PBS Professional 易于实施和使用,供应商决定选择 PBS Professional。“PBS Professional 易于安装和使用,而且它 能满足我们全部的功能要求,”Branislav Jansík 说道,“现在我们的用户可以完全依靠这套作业负载管理系统,而我们可以充满自信地 应对系统规模的扩张。”
目前,该中心的所有研究人员都使用 PBS Professional 来分配和利用 Anselm 超级计算机的计算资源,Anselm是Bull提供的一款x86 集群计算机,运算速度峰值约为94万亿次浮点运算/秒。
PBS Professional 由 Bull 以预安装的形式提供,所以中心的用户可以迅速开始工作。IT4I 能够在项目初期阶段分析用户和运行需求, 然后根据用户的需要对该产品轻松地实施定制。
“有了PBS Professional,我们可以快速创建插件和序言/结语脚本,确保最佳资源使用率,增强安全性以符合规范要求,并使计算 节点在作业使用后仍保持原始、一致的状态,”IT4I 超级计算服务部副总监兼高级管理员Filip Staněk说道。“为满足客户需求,我们需要完成高度复杂的定制工作,而 PBS Professional 让这些变得易如反掌。”
IT4I 国家超级计算中心还实施了 PBS Analytics,该软件随解决方案进行预安装,用于用户分析和报告。“对于每个超级计算中心来说,有必要准确掌握用户和项目所消耗的分配资源并相应地收取费用。PBS Analytics 提供的高级分析和报告功能可让我们更好地了解资源使用细节和项目未来的负载,”Martin Palkovič说道。
结论
用 IT4I 国家超级计算中心管理员的话来说,选择 PBS Professional 最大的好处在于操作人员能够迅速轻松地适应和使用这款程序。 “用户可以很快熟悉并上手使用 PBS Professional,”Filip Staněk 说道,“我们清楚,是 Altair 让我们有机会获得一流的支持服务,而这也是PBS Professional 与 SLURM 或 Torqueover 等开源替代产品相比所具有的独特优势。”
目前,在 IT4I 国家超级计算中心的用户中,有超过 100 名活跃用户只通过 PBS Professional 这一种途径分配和使用集群计算资源。Anselm 集群上每天都要安装新的应用程序,所以该中心计划对 Altair 的其它技术进行评估,以备未来扩展之用。
PBS Professional 运行的大部分应用程序均为用户编写的代码,或是像 OpenFOAM、ParaView 和 Octave 这样的开源软件。但系 统中现已部署了ANSYS、EnSight、LS-DYNA、MATLAB 和COMSOL等商用软件。除此之外,该中心还计划部署VASP、Wien2K等 其它软件。
该中心主管Martin Palkovič说道:“我们确信PBS Professional就是我们超级计算系统的正确选择。”