Modos de rendimiento - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Modos de rendimiento

Amazon SageMaker Feature Store ofrece dos modelos de precios entre los que elegir: los modos de rendimiento bajo demanda (On-demand) y aprovisionados (Provisioned). On-demandfunciona mejor para un tráfico menos predecible, mientras que Provisioned funciona mejor para un tráfico constante y predecible.

Tiene la opción de cambiar entre los modos de Provisioned rendimiento On-demand y de rendimiento para un grupo de características determinado, a fin de adaptarse a los períodos en los que los patrones de tráfico de las aplicaciones cambian o son menos predecibles. Solo puede actualizar el modo de rendimiento de su grupo de características a On-demand una vez cada 24 horas. El modo de rendimiento se puede actualizar mediante programación mediante la interfaz de usuario de la consola UpdateFeatureGroupAPIo a través de ella. Para obtener más información sobre cómo usar la consola, consulte Uso de Amazon SageMaker Feature Store en la consola.

Puede utilizar el modo de Provisioned rendimiento con grupos de funciones que solo estén disponibles sin conexión o con grupos de funciones del tipo de almacenamiento. Standard Para otras configuraciones de almacenamiento, se utiliza el modo On-demand de rendimiento. Para obtener información sobre las configuraciones de almacenamiento en línea y fuera de línea, consulte Almacenamiento en línea yAlmacenamiento sin conexión, respectivamente.

Para obtener más información sobre los precios, consulta Amazon SageMaker Pricing.

Modo de rendimiento bajo demanda

El modo de rendimiento On-demand (predeterminado) funciona mejor cuando se utilizan grupos de funciones con una carga de trabajo desconocida o un tráfico de aplicaciones impredecible y no se pueden prever los requisitos de capacidad.

El On-demand modo le cobra por las lecturas y escrituras que la aplicación realiza en sus grupos de funciones. No necesita especificar el rendimiento de lectura y escritura que espera que alcance su aplicación, ya que Feature Store se adapta instantáneamente a sus cargas de trabajo a medida que aumentan o disminuyen. Solo paga por lo que usa, que se mide en y. ReadRequestsUnits WriteRequestsUnits

Puede activar el modo de On-demand rendimiento mediante CreateFeatureGroupUpdateFeatureGroupAPIso a través de la interfaz de usuario de la consola. Para obtener más información sobre el uso de la interfaz de usuario de la consola, consulteUso de Amazon SageMaker Feature Store en la consola.

importante

Solo puede actualizar el modo de rendimiento de su grupo de funciones a una On-demand vez cada 24 horas.

Modo de rendimiento aprovisionado

El modo de Provisioned rendimiento funciona mejor cuando se utilizan grupos de funciones con cargas de trabajo predecibles y se pueden pronosticar los requisitos de capacidad para controlar los costes. Esto puede hacer que sea más rentable para determinadas cargas de trabajo, en las que puede anticipar los requisitos de rendimiento con antelación.

Al configurar un grupo de características en Provisioned modo, se especifican las unidades de capacidad, que son la cantidad máxima de capacidad que una aplicación puede consumir de un grupo de características. Si la aplicación supera esta capacidad de Provisioned rendimiento, está sujeta a una limitación de las solicitudes.

A continuación se incluye información sobre las unidades de capacidad de lectura y escritura.

  • La recuperación de un solo registro de hasta 4 KB mediante el GetRecord API consumirá al menos 1 RCU (unidad de capacidad de lectura). Recuperar cargas útiles más grandes puede llevar más tiempo. El número total de unidades de capacidad de lectura necesarias depende del tamaño del elemento, incluido un pequeño número de metadatos por registro que añade el servicio Feature Store.

  • Una sola solicitud de escritura con una carga útil de 1 KB que utilice el PutRecord API consumirá al menos 1 WCU (unidad de capacidad de escritura), y las cargas fraccionarias se redondearán al KB más cercano. Puede consumir más según la hora del evento, el estado de eliminación del registro y el estado del tiempo de vida ()TTL. Para obtener más información al respectoTTL, consulteTiempo de vida (TTL) duración de los registros.

importante

Al configurar las unidades de capacidad, tenga en cuenta lo siguiente:

  • Se le cobrará por las capacidades de lectura y escritura que aprovisione para su grupo de funciones, incluso si no utiliza toda la Provisioned capacidad.

  • Si estableces una capacidad de lectura o escritura demasiado baja, es posible que tus solicitudes se vean limitadas.

  • En algunos casos, los registros pueden consumir una unidad de capacidad adicional debido a los metadatos a nivel de registro que agrega el servicio Feature Store para habilitar varias funciones.

  • Recuperar solo un subconjunto de funciones que utilizan GetRecord o BatchGetRecord APIs seguirán consumiendo la cantidad RCU correspondiente a todo el registro.

  • En cuanto a la capacidad de escritura, debe doblegar la capacidad máxima reciente para evitar que se produzcan sobrecargas o ingestas de forma masiva, lo que podría provocar una gran cantidad de escrituras de registros históricos. Esto se debe a que la escritura de registros históricos consume una capacidad de escritura adicional.

  • Actualmente, Feature Store no admite el escalado automático del Provisioned modo.

Puede activar el modo de On-demand rendimiento mediante CreateFeatureGroupUpdateFeatureGroupAPIso a través de la interfaz de usuario de la consola. Para obtener más información sobre el uso de la interfaz de usuario de la consola, consulteUso de Amazon SageMaker Feature Store en la consola.

A continuación, se describe cómo puede aumentar o disminuir el RCU WCU rendimiento de sus grupos de funciones cuando el Provisioned modo está activado.

Aumentar el rendimiento aprovisionado

Puede aumentarlo RCU o con la frecuencia WCU que necesite mediante la interfaz de usuario UpdateFeatureGroupAPIo la interfaz de usuario de la consola.

Disminución del rendimiento aprovisionado

Puede reducir RCU WCU (o ambas cosas) para los grupos de funciones mediante UpdateFeatureGroupAPIla interfaz de usuario de la consola.

Existe una cuota predeterminada en cuanto al número de reducciones de Provisioned capacidad que puede realizar en su grupo de características por día. Un día se define según la hora universal coordinada (UTC). En un día determinado, puede empezar realizando hasta cuatro disminuciones en una hora, siempre que no haya realizado todavía ninguna otra disminución durante ese día. Posteriormente, puede realizar una disminución adicional por hora siempre que no haya habido disminuciones en la hora anterior. Esto efectivamente aumenta el número máximo de reducciones a 27 al día (4 reducciones en la primera hora y 1 reducción en cada hora posterior durante un día).

Métricas del modo de rendimiento

Un grupo de características en On-demand modo ConsumedReadRequestsUnits emitirá ConsumedWriteRequestsUnits métricas. Un grupo de entidades en Provisioned modo ConsumedReadCapacityUnits emitirá ConsumedWriteCapacityUnits métricas. Para obtener más información sobre las métricas de Feature Store, consulteEstadísticas de Amazon SageMaker Feature Store.

Límites del modo de rendimiento

Cada uno Cuenta de AWS tiene cuotas o límites de servicio predeterminados que se aplican para garantizar la disponibilidad y gestionar los riesgos de facturación. Para obtener información sobre las cuotas y los límites predeterminados, consulteCuotas, reglas de nomenclatura y tipos de datos.

En algunos casos, estos límites pueden ser inferiores a lo que se indica en la documentación. Si necesita límites más altos, puede enviar una solicitud de aumento. Es una buena idea hacerlo antes de alcanzar los límites actuales para evitar interrupciones en el trabajo. Para obtener más información acerca de las cuotas de servicio y cómo solicitar un aumento de cuota, consulte AWS service quotas.