AWS使用的服务AWS ParallelCluster - AWS ParallelCluster

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

AWS使用的服务AWS ParallelCluster

使用以下Amazon Web SAWS ervices () 服务AWS ParallelCluster。

Amazon API Gateway

Amazon API Gateway 是一项AWS服务,用于创建、发布、维护、监控和保护任意规模的 REST、HTTP 和 WebSocket API

AWS ParallelCluster使用 API Gateway 来托管AWS ParallelCluster API。

有关的更多信息AWS Batch,请参阅 https://aws.amazon.com/api-gateway/https://docs.aws.amazon.com/apigateway/

AWS Batch

AWS Batch是一项AWS托管作业调度器服务。它动态配置AWS Batch集群中计算资源的最佳数量和类型(例如,CPU 或内存优化实例)。这些资源是根据批处理任务的特定要求(包括批量要求)配置的。使用AWS Batch,您无需安装或管理其他批处理计算软件或服务器集群即可有效地运行作业。

AWS Batch 仅适用于 AWS Batch 集群。

有关的更多信息AWS Batch,请参阅 https://aws.amazon.com/batch/https://docs.aws.amazon.com/batch/

AWS CloudFormation

AWS CloudFormation是一项提供通用语言的 infrastructure-as-code 服务,用于在您的云环境中对第三方应用程序资源进行建模AWS和配置。它是使用的主要服务AWS ParallelCluster。中的每个集群都表示AWS ParallelCluster为一个堆栈,每个集群所需的所有资源都在AWS ParallelClusterAWS CloudFormation模板中定义。在大多数情况下,AWS ParallelClusterCLI 命令直接对应于AWS CloudFormation堆栈命令,例如创建、更新和删除命令。在集群内启动的实例对集群启动地的AWS CloudFormation终端节点进行AWS 区域 HTTPS 调用。

有关的更多信息AWS CloudFormation,请参阅 https://aws.amazon.com/cloudformation/https://docs.aws.amazon.com/cloudformation/

亚马逊 CloudWatch

Amazon CloudWatch (CloudWatch) 是一项监控和可观察性服务,为您提供数据和可操作的洞察。这些见解可用于监控您的应用程序、响应性能变化和服务异常以及优化资源利用率。中AWS ParallelCluster, CloudWatch 用于仪表板,用于监视和记录 Docker 镜像构建步骤和AWS Batch作业输出。

在AWS ParallelCluster版本 2.10.0 之前 CloudWatch ,仅用于集AWS Batch群。

有关的更多信息 CloudWatch,请参阅 https://aws.amazon.com/cloudwatch/https://docs.aws.amazon.com/cloudwatch/

亚马逊 CloudWatch 活动

Amazon CloudWatch Events(CloudWatch Events)提供几乎实时的系统事件流,这些事件描述 Amazon Web Services (AWS) 资源中的更改。通过使用可快速设置的简单规则,您可以匹配事件并将事件路由到一个或多个目标函数或流。在中AWS ParallelCluster, CloudWatch 事件用于作AWS Batch业。

有关 CloudWatch 活动的更多信息,请参阅 https://docs.aws.amazon.com/Amazon CloudWatch /latest/events/

亚马逊 CloudWatch 日志

亚马逊 CloudWatch 日CloudWatch 志(日志)是亚马逊的核心功能之一 CloudWatch。您可以使用它来监视、存储、查看和搜索日志文件中使用的许多组件AWS ParallelCluster。

在AWS ParallelCluster版本 2.6.0 之前, CloudWatch 日志仅用于集AWS Batch群。

有关更多信息,请参阅与 Amazon CloudWatch Logs

AWS CodeBuild

AWS CodeBuild(CodeBuild) 是一项AWS托管式连续集成服务,可让开发人员遵守源代码、运行测试以及生成可供部署的软件包。中AWS ParallelCluster, CodeBuild 用于在创建集群时自动透明地构建 Docker 镜像。

CodeBuild 仅用于AWS Batch群集。

有关的更多信息 CodeBuild,请参阅 https://aws.amazon.com/codebuild/https://docs.aws.amazon.com/codebuild/

Amazon DynamoDB

Amazon DynamoDB (DynamoDB) 是一项快速灵活的 NoSQL 数据库服务。它用于存储集群的最小状态信息。头节点跟踪 DynamoDB 表中的预配置实例。

DynamoDB 不用于AWS Batch集群。

有关 DynamoDB 的更多信息,请参阅 https://aws.amazon.com/dynamodb/的时间表。https://docs.aws.amazon.com/dynamodb/

Amazon Elastic Block Store

Amazon Elastic Block Store (Amazon EBS) 是一项高性能数据块存储服务,可为共享卷提供持久存储。所有 Amazon EBS 设置都可以通过配置传递。Amazon EBS 卷可以初始化为空,也可以从现有 Amazon EBS 快照初始化。

有关 Amazon EBS 事件的更多信息,请参阅 https://aws.amazon.com/ebs/的时间表。https://docs.aws.amazon.com/ebs/

Amazon Elastic Compute Cloud

Amazon Elastic Compute Cloud (Amazon EC2) 为AWS ParallelCluster。头节点和计算节点是 Amazon EC2 实例。可以选择支持 HVM 的任何实例类型。头节点和计算节点可以是不同的实例类型。此外,如果使用多个队列,则部分或全部计算节点也可以作为竞价型实例启动。在实例上找到的实例存储卷作为条带化 LVM 卷挂载。

有关 Amazon EC2 的更多信息,请参阅 https://aws.amazon.com/ec2/的时间表。https://docs.aws.amazon.com/ec2/

Amazon Elastic Container Registry

Amazon Elastic Container Registry (Amazon ECR) 是一个完全托管式 Docker 容器注册表,可让开发人员轻松地存储、管理和部署 Docker 容器镜像。在中AWS ParallelCluster,Amazon ECR 存储了创建集群时生成的 Docker 镜像。随后,AWS Batch 使用 Docker 映像为提交的作业运行容器。

Amazon ECR 仅用于集AWS Batch群。

欲了解更多信息,请参阅 https://aws.amazon.com/ecr/https://docs.aws.amazon.com/ecr/

Amazon EFS

Amazon Elastic File System (Amazon EFS) 提供了一个简单、可扩展且完全托管式的弹性 NFS 文件系统,可用于AWS Cloud服务和本地资源。指定时使用 Amazon EFS。EfsSettingsAmazon EFS (AWS ParallelClusterDS) (EFS) (DS) (DS

有关 Amazon EFS 事件的更多信息,请参阅 https://aws.amazon.com/efs/的时间表。https://docs.aws.amazon.com/efs/

Amazon FSx for Lustre

FsX for Lustre 提供了一个使用开源 Lustre 文件系统的高性能文件系统。在指定时使用 FsX for Lustre。FsxLustreSettings 属性AWS ParallelCluster版本 2.2.1 中添加了对适用于 Lustre 的 FsX 的Support。

有关 FsX for Lustre 的更多信息,请参阅 https://aws.amazon.com/fsx/lustre/https://docs.aws.amazon.com/fsx/

Amazon FSx fo NetApp r ONTAP

FSx for ONTAP 提供了一个完全托管的共享存储系统,该存储系统建立在广受欢迎 NetApp的 ONTAP 文件系统之上。指定时使用适用于 ONTAPFsxOntapSettings 属性 的 FSx。AWS ParallelCluster版本 3.2.0 中添加了对适用于 ONTAP 的 FSx 的Support。

有关 ONTAP 版 FSx 的更多信息,请参阅 https://aws.amazon.com/fsx/netapp-ontap/https://docs.aws.amazon.com/fsx/

Amazon FSx for OpenZFS

FSx for OpenZFS 提供了一个完全托管式的共享存储系统,这些存储系统建立在常见 OpenZFS 文件系统上。指定时,将使用适用于 OpenZFSFsxOpenZfsSettings 属性 的 FSX。AWS ParallelCluster版本 3.2.0 中增加了对 OpenZFS 的 FSx Support。

有关 OpenZFS for FSx 的更多信息,请参阅 https://aws.amazon.com/fsx/openzfs/https://docs.aws.amazon.com/fsx/

AWS Identity and Access Management

AWS Identity and Access Management(IAM) 用于为特定AWS ParallelCluster于每个单独集群的实例提供 Amazon EC2 的最低权限 IAM 角色。 AWS ParallelCluster实例只能访问部署和管理集群所需的特定 API 调用。

对于AWS Batch集群,还会在创建集群时为与 Docker 映像构建过程相关的组件创建 IAM 角色。这些组件包括允许在 Amazon ECR 存储库中添加和删除 Docker 镜像的 Lambda 函数。它们还包括允许删除为集群和 CodeBuild 项目创建的 Amazon S3 存储桶的函数。还为 AWS Batch 资源、实例和作业提供了角色。

有关 IAM 的更多信息,请参阅 https://aws.amazon.com/iam/https://docs.aws.amazon.com/iam/

AWS Lambda

AWS Lambda(Lambda) 运行编排 Docker 镜像创建的函数。Lambda 还管理自定义集群资源的清理,例如存储在 Amazon ECR 存储库和Amazon S3 上的 Docker 镜像。

有关 Lambda 的更多信息,请参阅 https://aws.amazon.com/lambda/ 和的时间。https://docs.aws.amazon.com/lambda/

Amazon RDS

Amazon Relational Database Service(Amazon RDS) 是一项 Web 服务,用户能够在AWS云中更轻松地设置、操作和扩展关系数据库。

AWS ParallelCluster将亚马逊 RDS 用于AWS Batch和Slurm。

有关 Amazon RDS 事件的更多信息,请参阅 https://aws.amazon.com/rds/的时间表。https://docs.aws.amazon.com/rds/

Amazon Route 53

Amazon Route 53(Route 53)用于创建托管区域,其中包含每个计算节点的主机名和完全合格的域名。

有关 53 号公路的更多信息,请参阅 https://aws.amazon.com/route53/https://docs.aws.amazon.com/route53/

Amazon Simple Notification Service

(Amazon SNS) 是一项托管服务,提供从发布者向订阅者(也称为创建者和使用者)的消息传输。

AWS ParallelCluster使用Amazon SNS 进行 API 托管。

有关 Amazon SNS 事件的更多信息,请参阅 https://aws.amazon.com/sns/的时间表。https://docs.aws.amazon.com/sns/

Amazon Simple Storage Service

Amazon Simple Storage Service (Amazon S3) 存储AWS 区域的AWS ParallelCluster模板 AWS ParallelCluster可以配置为允许 CLI/SDK 工具使用 Amazon S3。

当您使用AWS Batch集群时,您的账户中的 Amazon S3 存储桶用于存储相关数据。例如,存储桶存储根据提交的任务创建 Docker 映像和脚本时创建的工件。

欲了解更多信息,请参阅 https://aws.amazon.com/s3/https://docs.aws.amazon.com/s3/

Amazon VPC

Amazon VPC 定义了集群中节点使用的网络。

有关亚马逊 VPC 的更多信息,请参阅 https://aws.amazon.com/vpc/https://docs.aws.amazon.com/vpc/

Elastic Fabric Adapter

Elastic Fabric Adapter (EFA) 是 Amazon EC2 实例的网络接口,客户可用于在上运行要求大规模高级别节点间通信的应用程序AWS。

有关 EC2 Image Builder 的更多信息,请参阅 https://aws.amazon.com/hpc/efa/

EC2 Image Builder

EC2 Image Builder 是一项完全托管式AWS服务,可帮助您自动创建、管理和部署自定义、安全映像和 up-to-date 服务器映像。

AWS ParallelCluster使用Image Builder 来创建和管理AWS ParallelCluster图像。

有关 EC2 Image Builder 的更多信息,请参阅 https://aws.amazon.com/image-builder/https://docs.aws.amazon.com/imagebuilder/

NICE DCV

NICE DCV 是一种高性能的远程显示协议,它提供了一种在不同的网络条件下向任何设备传输远程桌面和应用程序流媒体的安全方法。指定HeadNode 部分/Dcv设置时使用 NICE DCV。DCV (NICE DCV) (NAWS ParallelCluster ICE DCV)

有关 NICE DCV 的更多信息,请参阅 https://aws.amazon.com/hpc/dcv/https://docs.aws.amazon.com/dcv/