Compatible con P6 DLAMIs - AWS Deep Learning AMIs

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Compatible con P6 DLAMIs

A continuación se detallan los requisitos para ejecutar DLAMI en las instancias EC2 Amazon P6-B200 y EC2 Amazon P6e- 00 GB2

Compatible con el P6-B200 DLAMIs

Las siguientes instancias P6-B200 son DLAMIs compatibles:

Estos DLAMI contienen el siguiente software necesario para operar las instancias P6-B200:

Software

Requisito mínimo de versión

Kit de herramientas CUDA de Nvidia

12.8

Controlador Nvidia

R570

NVLINK 5

R570

Núcleo de Linux

6.1

Elastic Fabric Adapter (EFA)

1.41.0

AWS Complemento OFI NCCL

1.15.0

Compatible con P6e-00 GB2 DLAMIs

Las siguientes instancias P6e-00 son compatibles: DLAMIs GB2

Estos DLAMI contienen el siguiente software necesario para operar las instancias GB2 P6e- 00:

Software

Requisito mínimo de versión

Kit de herramientas CUDA de Nvidia

12.8

Controlador Nvidia

R570

Núcleo de Linux

6.12

Elastic Fabric Adapter (EFA)

1.42.0

AWS Complemento OFI NCCL

1.15.0

Confirme la funcionalidad de la GPU

Para confirmar su funcionamiento GPUs:

  1. Ejecute la siguiente prueba de consulta del dispositivo GPU de Nvidia

    $ /usr/local/cuda/extras/demo_suite/deviceQuery
  2. Confirme el siguiente resultado de la ejecución de la consulta del dispositivo:

    $ /usr/local/cuda/extras/demo_suite/deviceQuery /usr/local/cuda/extras/demo_suite/deviceQuery Starting... CUDA Device Query (Runtime API) Detected 8 CUDA Capable device(s) ... deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.8, CUDA Runtime Version = 12.8, NumDevs = 8, Device0 = NVIDIA B200, Device1 = NVIDIA B200, Device2 = NVIDIA B200, Device3 = NVIDIA B200, Device4 = NVIDIA B200, Device5 = NVIDIA B200, Device6 = NVIDIA B200, Device7 = NVIDIA B200 Result = PASS

Para confirmar que el controlador NVIDIA funciona correctamente:

  1. Ejecute la interfaz de administración del sistema Nvidia

    $ nvidia-smi
  2. Confirme el siguiente resultado de la interfaz de administración del sistema

    +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.133.20 Driver Version: 570.133.20 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA B200 Off | 00000000:51:00.0 Off | 0 | | N/A 32C P0 145W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 1 NVIDIA B200 Off | 00000000:52:00.0 Off | 0 | | N/A 30C P0 140W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 2 NVIDIA B200 Off | 00000000:62:00.0 Off | 0 | | N/A 31C P0 139W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 3 NVIDIA B200 Off | 00000000:63:00.0 Off | 0 | | N/A 29C P0 139W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 4 NVIDIA B200 Off | 00000000:75:00.0 Off | 0 | | N/A 31C P0 141W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 5 NVIDIA B200 Off | 00000000:76:00.0 Off | 0 | | N/A 31C P0 141W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 6 NVIDIA B200 Off | 00000000:86:00.0 Off | 0 | | N/A 32C P0 141W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 7 NVIDIA B200 Off | 00000000:87:00.0 Off | 0 | | N/A 30C P0 138W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+

Si tiene algún problema con las instancias P6-B200, póngase en contacto con Support. AWS