Personalización del volumen de dispositivo raíz de Amazon EBS - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Personalización del volumen de dispositivo raíz de Amazon EBS

Valores predeterminados del volumen raíz de EBS

A partir de la versión 4.x de Amazon EMR, puede especificar el tamaño del volumen raíz al crear un clúster. A partir de la versión 6.15.0 de Amazon EMR, también puede especificar las IOPS y el rendimiento del volumen raíz. Los atributos se aplican solo al volumen del dispositivo raíz de Amazon EBS y se aplican a todas las instancias del clúster. No se aplican a volúmenes de almacenamiento, que se especifican de forma independiente para cada tipo de instancia al crear el clúster.

  • El tamaño del volumen raíz predeterminado es de 15 GiB a partir de la versión 6.10.0 de Amazon EMR. Las versiones anteriores tienen un tamaño de volumen raíz predeterminado de 10 GiB. Puede ajustarlo hasta 100 GiB.

  • El valor predeterminado de IOPS del volumen raíz es de 3000. Puede ajustarlo hasta 16 000.

  • El rendimiento predeterminado del volumen raíz es de 125 MiB/s. Puede ajustarlo hasta 1000 MiB/s.

nota

El tamaño del volumen raíz y las IOPS no pueden tener una relación superior a 1 volumen por 500 IOPS (1:500), mientras que las IOPS y el rendimiento del volumen raíz no pueden tener una relación superior a 1 IOPS por 0,25 de rendimiento (1:0,25).

Para más información acerca de Amazon EBS, consulte Volumen de dispositivo raíz de Amazon EC2.

Tipo de volumen del dispositivo raíz con la AMI predeterminada

Cuando utiliza la AMI predeterminada, el tipo de volumen de dispositivo raíz lo determina la versión de Amazon EMR que utilice.

  • Con las versiones 6.15.0 y posteriores de Amazon EMR, Amazon EMR adjunta SSD de uso general (gp3) como el tipo de volumen de dispositivo raíz.

  • Con versiones de Amazon EMR anteriores a la 6.15.0, Amazon EMR adjunta el volumen SSD de uso general (gp2) como el tipo de volumen de dispositivo raíz.

Tipo de volumen del dispositivo raíz con la AMI personalizada

Una AMI personalizada puede tener otros tipos distintos de volúmenes de dispositivo raíz. Amazon EMR siempre utiliza el tipo de volumen de la AMI personalizada.

  • Con las versiones 6.15.0 y posteriores de Amazon EMR, puede configurar el tamaño del volumen raíz, las IOPS y el rendimiento de su AMI personalizada, siempre que estos atributos se apliquen al tipo de volumen de la AMI personalizada.

  • Con las versiones de Amazon EMR anteriores a la 6.15.0, solo puede configurar el tamaño del volumen raíz para su AMI personalizada.

Si no configura el tamaño del volumen raíz, las IOPS o el rendimiento al crear el clúster, Amazon EMR utilizará los valores de la AMI personalizada, si procede. Si decide configurar estos valores al crear el clúster, Amazon EMR utilizará los valores que especifique siempre que sean compatibles con el volumen raíz de la AMI personalizada. Para obtener más información, consulte Uso de una AMI personalizada.

Precios del tamaño del volumen de dispositivo raíz

El costo del volumen de dispositivo raíz de EBS se prorratea por hora, en función de los cargos mensuales de EBS para ese tipo de volumen en la región en la que se ejecuta el clúster. Lo mismo ocurre con los volúmenes de almacenamiento. Los cargos se muestran en GB, pero debe especificar el tamaño del volumen raíz en GiB, por lo que es posible que desee tener en cuenta esto en las estimaciones (1 GB es 0,931323 GiB).

Los volúmenes SSD de uso general gp2 y gp3 se facturan de forma diferente. Para estimar los cargos asociados con los volúmenes de dispositivo raíz de EBS en su clúster, utilice las siguientes fórmulas:

SSD de uso general gp2

El precio de gp2 incluye solo el tamaño del volumen de EBS en GB.

($EBS size in GB/month) * 0.931323 / 30 / 24 * EMR_EBSRootVolumesizeInGiB * InstanceCount

Por ejemplo, tome un clúster que tenga un nodo principal, un nodo central y que utilice la AMI base de Amazon Linux con el volumen de dispositivo raíz de 10 GiB predeterminado. Si el costo de EBS en la región es de 0,10 USD por GB por mes, resulta ser aproximadamente 0,00129 USD por instancia por hora y 0,00258 USD por hora para el clúster (0,10 GB al mes dividido entre 30 días, dividido entre 24 horas, multiplicado por 10 GB, multiplicado por 2 instancias de clúster).

SSD de uso general gp3

El precio de gp3 incluye el tamaño del volumen de EBS en GB, las IOPS superiores a 3000 (3000 IOPS gratuitas) y el rendimiento superior a 125 MB/s (125 MB/s gratuitos).

($EBS size in GB/month) * 0.931323 / 30 / 24 * EMR_EBSRootVolumesizeInGiB * InstanceCount + ($EBS IOPS/Month)/30/24* (EMR_EBSRootVolumeIops - 3000) * InstanceCount + ($EBS throughput/Month)/30/24* (EMR_EBSRootVolumeThroughputInMb/s - 125) * InstanceCount

Por ejemplo, tome un clúster que tenga un nodo principal, un nodo central y que utilice la AMI base de Amazon Linux con el tamaño del volumen de dispositivo raíz de 15 GiB predeterminado, 4000 IOPS y 140 de rendimiento. Si el costo de EBS en la región es de 0,10 USD por GB al mes, 0,005 USD por IOPS aprovisionadas al mes superiores a 3000 y 0,040 USD por MB/s aprovisionados por mes superiores a 125, esto equivale aproximadamente a 0,009293 USD por instancia por hora y 0,018586 USD por hora para el clúster.

Especificación de ajustes del volumen de dispositivo raíz personalizados

nota

El tamaño del volumen raíz y las IOPS no pueden tener una relación superior a 1 volumen por 500 IOPS (1:500), mientras que las IOPS y el rendimiento del volumen raíz no pueden tener una relación superior a 1 IOPS por 0,25 de rendimiento (1:0,25).

Console
Para especificar los atributos del volumen de dispositivo raíz de Amazon EBS desde la consola de Amazon EMR
  1. Inicie sesión en la AWS Management Console consola Amazon EMR y ábrala en https://console.aws.amazon.com/emr.

  2. En EMR en EC2 situado en el panel de navegación izquierdo, elija Clústeres y, a continuación, elija Crear clúster.

  3. Seleccione la versión 6.15.0 Amazon EMR o una posterior.

  4. En Configuración del clúster, vaya a la sección Volumen raíz de EBS e introduzca un valor para cualquiera de los atributos que desee configurar.

  5. Elija cualquier otra opción que se aplique a su clúster.

  6. Para lanzar el clúster, elija Crear clúster.

CLI
Para especificar los atributos del volumen de dispositivo raíz de Amazon EBS con la AWS CLI
  • Utilice los parámetros --ebs-root-volume-size, --ebs-root-volume-iops y --ebs-root-volume-throughput del comando create-cluster, tal y como se muestra en el siguiente ejemplo.

    nota

    Se incluyen caracteres de continuación de línea de Linux (\) para facilitar la lectura. Se pueden eliminar o utilizar en los comandos de Linux. En Windows, elimínelos o sustitúyalos por un signo de intercalación (^).

    aws emr create-cluster --release-label emr-6.15.0\ --ebs-root-volume-size 20 \ --ebs-root-volume-iops 3000\ --ebs-root-volume-throughput 135\ --instance-groups InstanceGroupType=MASTER,\ InstanceCount=1,InstanceType=m5.xlarge InstanceGroupType=CORE,InstanceCount=2,InstanceType=m5.xlarge