Elastic Fabric Adapter - AWS ParallelCluster

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Elastic Fabric Adapter

Elastic Fabric Adapter (EFA) 是一种网络设备,具有操作系统旁路功能,可与同一子网上的其他实例进行低延迟的网络通信。EFA 通过 Libfabric 公开,可供使用消息传递接口 (MPI) 的应用程序使用。

要将 EFA 与AWS ParallelCluster和Slurm调度程序一起使用,请将 SlurmQueues/ComputeResources/Efa/设置Enabledtrue

要查看支持 EFA 的 EC2 实例列表,请参阅 Amazon EC2 Linux 实例用户指南中支持的实例类型

我们建议您在置放群组中运行启用 EFA 的实例。通过这种方式,在单个可用区的低延迟组中启动启用了的低延迟组中启动启动。有关如何使用配置置放群组的更多信息AWS ParallelCluster,请参阅 SlurmQueues/Networking/PlacementGroup

有关更多信息,请参阅适用于 Linux 实例的 Amazon EC2 用户指南中的 Elastic Fab ric Adapter 和使用弹性架构适配器扩展 HPC 工作负载,以及AWS ParallelClusterAWS开源博客

注意

Elastic Fabric Adapter (EFA) 有关更多信息,请参阅日程安排/SlurmQueues/联网/SubnetIds

注意

默认情况下,Ubuntu发行版启用ptrace(进程跟踪)保护。 ptrace保护已禁用,因此 Libfabric 可以正常运行。有关更多信息,请参阅适用于 Linux 实例的 Amazon EC2 用户指南中的禁用 PTRace