最近,亚马逊云服务(AWS)推出了一项全新的高性能计算(HPC)管理服务,旨在让企业更方便地使用超级计算机。这个新服务叫做 AWS 并行计算服务,主要是为了消除企业在使用高性能计算集群时的障碍,特别是那些对内部系统管理员要求较高的传统模式。

机房 数据中心 (2)服务器

图源备注:图片由AI生成,图片授权服务商Midjourney

AWS 的高级计算与仿真总监 Ian Colle 在接受采访时表示,许多现有的工作负载其实是可以利用高性能计算资源的,但由于人们对 HPC 的理解,许多企业认为只有大型公司或实验室才需要或者能够使用这些资源。因此,很多企业在考虑是否使用 HPC 集群时常常犹豫不决。

然而,随着 AWS 推出这一新服务,Colle 认为,企业会发现其实获取 HPC 集群的门槛已经大大降低。现在,他们只需要一个 AWS 账号,就能轻松进行各种实验,测试不同的工作负载是否能够在大规模计算中获得优势。这种简化的方式,让实验变得更加灵活和高效。

AWS 并行计算服务允许用户设置和管理亚马逊弹性计算云(EC2)实例的集群。之前,AWS 提供的 HPC 集群服务要求客户自行雇佣系统管理员来维护网络,而新的服务则利用开源的 HPC 工作负载管理工具 Slurm,来帮助客户轻松管理集群。

现在,用户可以在 AWS 上使用相同的管理工具和软件开发工具包,无需重新设计现有的工作流程,甚至可以直接连接任何 API。这对于需要在大规模下运行科学和工程工作负载的企业来说,无疑是一个极大的便利。

新服务将在美国的俄亥俄州、北弗吉尼亚州和俄勒冈州等地区首先推出,随后会扩展到欧洲和亚太地区。一些早期使用该服务的客户已经展示了 HPC 集群的广泛应用,包括德国的 Marvel Fusion 公司和澳大利亚的 Ronin 公司。

随着越来越多的公司开始意识到 HPC 的重要性,HPC 即服务的需求不断增长。云服务提供商如 AWS、谷歌和微软 Azure 等,都在加紧推出 HPC 相关服务,以满足企业的需求。这种趋势不仅能减少对大型超级计算机的等待时间,还能让更多企业体验到高性能计算的价值。

划重点:

🌟 AWS 推出 HPC 并行计算服务,降低企业获取超级计算资源的门槛。  

🚀 新服务使用 Slurm 管理集群,简化系统维护,支持现有工作流程无缝迁移。  

📈 HPC 服务需求增长,云计算供应商正加紧布局,推动技术创新与科学发现。