AWS ParallelCluster自AMI 自自自 - AWS ParallelCluster

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

AWS ParallelCluster自AMI 自自自

在某些情况下,需要AWS ParallelCluster为其构建自定义 AMI。本节介绍构建自定义AWS ParallelCluster AMI 时需要考虑的事项。

您可以使用以下方法之一自定义AWS ParallelCluster AMI 自定义 MI 自定义:

  1. 创建构建映像配置文件,然后使用pcluster CLI 使用 EC2 Image Builder 构建映像。此过程是自动化的、可重复的,并支持监控。有关更多信息,请参阅 mam pclustere(mame)。

  2. 从AWS ParallelCluster AMI 创建实例,然后登录该实例并进行手动修改。最后,使用 Amazon EC2 从修改后的实例创建新的 AMI。此过程花费的时间更少。但是,它不是自动的,也不是可重复的,并且它不支持使用pcluster CLI 图像监控命令。

有关这些方法的更多信息,请参阅构建自定义 AWS ParallelCluster AMI

AWS ParallelClusterAMI 自定义注意事项

无论您如何创建自定义镜像,我们都建议您执行初步验证测试,并提供监控正在创建的映像状态的配置。

要使用构建自定义 AMIpcluster,您需要创建一个包含BuildImage部分的构建映像配置文件EC2 Image Builder 使用该部分来构建您的自定义映像。该Build部分指定了Image Builder 构建映像所需的内容。这包括 ParentImage(基础映像)和Components。I mage Builder 组件定义了一系列步骤,这些步骤需要在创建映像之前自定义实例或测试由创建的映像启动的实例。有关AWS ParallelCluster组件示例,请参阅自定义 AMI。该Image部分指定了图像属性。

从 pcluster 调用build-image以创建自定义映像时,Image Builder 使用AWS ParallelCluster食谱中的构建映像配置AWS ParallelCluster在您的映像上进行引导ParentImage。Image Builder 下载组件、运行构建和验证阶段、创建 AMI、从 AMI 启动实例并运行测试。该过程完成后,Image Builder 会生成一个新图像或一条停止消息。

执行自定义组件验证测试

在将 Image Builder 组件包含在配置中之前,请使用以下方法之一对其进行测试和验证。由于 Image Builder 过程最多可能需要 1 个小时,因此我们建议您事先测试组件。这可以为您节省大量时间。

脚本案例

在构建映像进程之外的正在运行的实例中测试脚本,并验证脚本是否以退出代码 0 退出。

Amazon Resource(ARN)。

在构建映像过程之外的正在运行的实例中测试组件文档。有关要求列表,请参阅 Im ag e Builder 用户指南中的组件管理器。

成功验证后,将组件添加到您的构建映像配置中

验证自定义组件正常运行后,将其添加到构建映像配置文件中。

使用pcluster命令监控Image Builder 过程以帮助调试

describe-image

使用此命令监视构建映像状态。

list-image-log-streams

使用此命令获取可用于检索日志事件的日志流的 ID get-image-log-events

get-image-log-events

使用此命令获取构建映像过程事件的日志流。

例如,您可以使用以下命令。

$ watch -n 1 'pcluster get-image-log-events -i <image-id> \ --log-stream-name/1 <pcluster-version> \ --query "events[*].message" | tail -n 50'

get-image-stack-events

使用此命令检索 Image Builder 创建的堆栈的图像堆栈事件。

export-image-logs

使用此命令保存图像日志。

有关AWS ParallelCluster日志和亚马逊的更多信息 CloudWatch,请参阅亚马逊 CloudWatch 日志生成图像日志亚马逊 CloudWatch 控制面板

其他考虑因素

新AWS ParallelCluster版本和自定义 AMI

如果您构建和使用自定义 AMI,则必须在每个新AWS ParallelCluster版本中重复创建自定义 AMI 时使用的步骤。

自定义引导操作

查看本自定义引导操作节,确定futureAWS ParallelCluster 版本是否可以编写脚本并支持您要进行的修改。

使用自定义 AMI

您可以在 Image/CustomAmi和//-SchedulingSlurmQueuesNameImage/CustomAmi部分的集群配置中指定自定义 AMI。

要对自定义 AMI 验证警告进行故障排除,请参阅自定义 AMI 问题疑难解答