Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Modos de rendimiento
Amazon SageMaker Feature Store ofrece dos modelos de precios entre los que elegir: los modos de rendimiento bajo demanda (On-demand
) y aprovisionados (Provisioned
). On-demand
funciona mejor para un tráfico menos predecible, mientras que Provisioned
funciona mejor para un tráfico constante y predecible.
Tiene la opción de cambiar entre los modos de Provisioned
rendimiento On-demand
y de rendimiento para un grupo de características determinado, a fin de adaptarse a los períodos en los que los patrones de tráfico de las aplicaciones cambian o son menos predecibles. Solo puede actualizar el modo de rendimiento de su grupo de características a On-demand
una vez cada 24 horas. El modo de rendimiento se puede actualizar mediante programación mediante la interfaz de usuario de la consola UpdateFeatureGroupAPIo a través de ella. Para obtener más información sobre cómo usar la consola, consulte Uso de Amazon SageMaker Feature Store en la consola.
Puede utilizar el modo de Provisioned
rendimiento con grupos de funciones que solo estén disponibles sin conexión o con grupos de funciones del tipo de almacenamiento. Standard
Para otras configuraciones de almacenamiento, se utiliza el modo On-demand
de rendimiento. Para obtener información sobre las configuraciones de almacenamiento en línea y fuera de línea, consulte Almacenamiento en línea yAlmacenamiento sin conexión, respectivamente.
Para obtener más información sobre los precios, consulta Amazon SageMaker Pricing
Temas
Modo de rendimiento bajo demanda
El modo de rendimiento On-demand
(predeterminado) funciona mejor cuando se utilizan grupos de funciones con una carga de trabajo desconocida o un tráfico de aplicaciones impredecible y no se pueden prever los requisitos de capacidad.
El On-demand
modo le cobra por las lecturas y escrituras que la aplicación realiza en sus grupos de funciones. No necesita especificar el rendimiento de lectura y escritura que espera que alcance su aplicación, ya que Feature Store se adapta instantáneamente a sus cargas de trabajo a medida que aumentan o disminuyen. Solo paga por lo que usa, que se mide en y. ReadRequestsUnits
WriteRequestsUnits
Puede activar el modo de On-demand
rendimiento mediante CreateFeatureGroupUpdateFeatureGroupAPIso a través de la interfaz de usuario de la consola. Para obtener más información sobre el uso de la interfaz de usuario de la consola, consulteUso de Amazon SageMaker Feature Store en la consola.
importante
Solo puede actualizar el modo de rendimiento de su grupo de funciones a una On-demand
vez cada 24 horas.
Modo de rendimiento aprovisionado
El modo de Provisioned
rendimiento funciona mejor cuando se utilizan grupos de funciones con cargas de trabajo predecibles y se pueden pronosticar los requisitos de capacidad para controlar los costes. Esto puede hacer que sea más rentable para determinadas cargas de trabajo, en las que puede anticipar los requisitos de rendimiento con antelación.
Al configurar un grupo de características en Provisioned
modo, se especifican las unidades de capacidad, que son la cantidad máxima de capacidad que una aplicación puede consumir de un grupo de características. Si la aplicación supera esta capacidad de Provisioned
rendimiento, está sujeta a una limitación de las solicitudes.
A continuación se incluye información sobre las unidades de capacidad de lectura y escritura.
-
La recuperación de un solo registro de hasta 4 KB mediante el
GetRecord
API consumirá al menos 1 RCU (unidad de capacidad de lectura). Recuperar cargas útiles más grandes puede llevar más tiempo. El número total de unidades de capacidad de lectura necesarias depende del tamaño del elemento, incluido un pequeño número de metadatos por registro que añade el servicio Feature Store. -
Una sola solicitud de escritura con una carga útil de 1 KB que utilice el
PutRecord
API consumirá al menos 1 WCU (unidad de capacidad de escritura), y las cargas fraccionarias se redondearán al KB más cercano. Puede consumir más según la hora del evento, el estado de eliminación del registro y el estado del tiempo de vida ()TTL. Para obtener más información al respectoTTL, consulteTiempo de vida (TTL) duración de los registros.
importante
Al configurar las unidades de capacidad, tenga en cuenta lo siguiente:
-
Se le cobrará por las capacidades de lectura y escritura que aprovisione para su grupo de funciones, incluso si no utiliza toda la
Provisioned
capacidad. -
Si estableces una capacidad de lectura o escritura demasiado baja, es posible que tus solicitudes se vean limitadas.
-
En algunos casos, los registros pueden consumir una unidad de capacidad adicional debido a los metadatos a nivel de registro que agrega el servicio Feature Store para habilitar varias funciones.
-
Recuperar solo un subconjunto de funciones que utilizan
GetRecord
oBatchGetRecord
APIs seguirán consumiendo la cantidad RCU correspondiente a todo el registro. -
En cuanto a la capacidad de escritura, debe doblegar la capacidad máxima reciente para evitar que se produzcan sobrecargas o ingestas de forma masiva, lo que podría provocar una gran cantidad de escrituras de registros históricos. Esto se debe a que la escritura de registros históricos consume una capacidad de escritura adicional.
-
Actualmente, Feature Store no admite el escalado automático del
Provisioned
modo.
Puede activar el modo de On-demand
rendimiento mediante CreateFeatureGroupUpdateFeatureGroupAPIso a través de la interfaz de usuario de la consola. Para obtener más información sobre el uso de la interfaz de usuario de la consola, consulteUso de Amazon SageMaker Feature Store en la consola.
A continuación, se describe cómo puede aumentar o disminuir el RCU WCU rendimiento de sus grupos de funciones cuando el Provisioned
modo está activado.
Aumentar el rendimiento aprovisionado
Puede aumentarlo RCU o con la frecuencia WCU que necesite mediante la interfaz de usuario UpdateFeatureGroupAPIo la interfaz de usuario de la consola.
Disminución del rendimiento aprovisionado
Puede reducir RCU WCU (o ambas cosas) para los grupos de funciones mediante UpdateFeatureGroupAPIla interfaz de usuario de la consola.
Existe una cuota predeterminada en cuanto al número de reducciones de Provisioned
capacidad que puede realizar en su grupo de características por día. Un día se define según la hora universal coordinada (UTC). En un día determinado, puede empezar realizando hasta cuatro disminuciones en una hora, siempre que no haya realizado todavía ninguna otra disminución durante ese día. Posteriormente, puede realizar una disminución adicional por hora siempre que no haya habido disminuciones en la hora anterior. Esto efectivamente aumenta el número máximo de reducciones a 27 al día (4 reducciones en la primera hora y 1 reducción en cada hora posterior durante un día).
Métricas del modo de rendimiento
Un grupo de características en On-demand
modo ConsumedReadRequestsUnits
emitirá ConsumedWriteRequestsUnits
métricas. Un grupo de entidades en Provisioned
modo ConsumedReadCapacityUnits
emitirá ConsumedWriteCapacityUnits
métricas. Para obtener más información sobre las métricas de Feature Store, consulteEstadísticas de Amazon SageMaker Feature Store.
Límites del modo de rendimiento
Cada uno Cuenta de AWS tiene cuotas o límites de servicio predeterminados que se aplican para garantizar la disponibilidad y gestionar los riesgos de facturación. Para obtener información sobre las cuotas y los límites predeterminados, consulteCuotas, reglas de nomenclatura y tipos de datos.
En algunos casos, estos límites pueden ser inferiores a lo que se indica en la documentación. Si necesita límites más altos, puede enviar una solicitud de aumento. Es una buena idea hacerlo antes de alcanzar los límites actuales para evitar interrupciones en el trabajo. Para obtener más información acerca de las cuotas de servicio y cómo solicitar un aumento de cuota, consulte AWS service quotas.