入门 AWS PCS - AWS PCS

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门 AWS PCS

这是一个创建简单集群的教程,你可以用它来试用 AWS PCS。下图显示了集群的设计。

教程集群的架构图:这两个计算节点组是您的 AWS 账户 资源,它们连接到在服务拥有的服务器中运行的 Slurm 集群控制器。 AWS 账户两个计算节点组中的EC2实例都连接到 Amazon EFS 和 Amazon for Lustre 中的共享存储。FSx

集群设计教程包含以下关键组件:

  • A VPC 和符合AWS PCS网络要求的子网

  • Amazon EFS 文件系统,将用作共享的主目录。

  • Amazon FSx for Lustre 文件系统,它提供共享的高性能目录。

  • 一个 AWS PCS集群,它提供 Slurm 控制器。

  • 2 个计算节点组。

    • login节点组,它提供对系统的基于 shell 的交互式访问。

    • compute-1节点组提供弹性伸缩实例来运行作业。

  • 1 个向compute-1节点组中的EC2实例发送任务的队列。

集群需要其他 AWS 资源,例如安全组、IAM角色和EC2启动模板,这些资源未显示在图表中。