As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Modos de taxa de transferência
A Amazon SageMaker Feature Store oferece dois modelos de preços para você escolher: modos de taxa de transferência sob demanda (On-demand
) e provisionado (Provisioned
). On-demand
funciona melhor para tráfego menos previsível, enquanto Provisioned
funciona melhor para tráfego consistente e previsível.
Você tem a opção de alternar entre os modos On-demand
e de taxa de Provisioned
transferência para um determinado grupo de recursos, para acomodar períodos nos quais os padrões de tráfego do aplicativo estão mudando ou são menos previsíveis. Você só pode atualizar o modo de taxa de transferência do grupo de recursos para On-demand
uma vez em um período de 24 horas. O modo de taxa de transferência pode ser atualizado programaticamente usando a interface do usuário do console UpdateFeatureGroupAPIou por meio dela. Para obter mais informações sobre como usar o console, consulteUsando a Amazon SageMaker Feature Store no console.
Você pode usar o modo de taxa de Provisioned
transferência com grupos de recursos somente offline ou grupos de recursos com o tipo de armazenamento. Standard
Para outras configurações de armazenamento, o modo de On-demand
taxa de transferência é usado. Para obter informações sobre as configurações de armazenamento on-line e off-line, consulte Armazenamento on-line eArmazenamento offline, respectivamente.
Para obter mais detalhes sobre preços, consulte Amazon SageMaker Pricing
Tópicos
Modo de taxa de transferência sob demanda
O modo de taxa de transferência On-demand
(padrão) funciona melhor quando você usa grupos de recursos com carga de trabalho desconhecida, tráfego de aplicativos imprevisível e não consegue prever os requisitos de capacidade.
O On-demand
modo cobra pelas leituras e gravações que seu aplicativo executa em seus grupos de recursos. Você não precisa especificar a taxa de transferência de leitura e gravação que espera que seu aplicativo execute, pois o Feature Store acomoda instantaneamente suas cargas de trabalho à medida que elas aumentam ou diminuem. Você paga apenas pelo que usa, que é medido em ReadRequestsUnits
WriteRequestsUnits
e.
Você pode ativar o modo de taxa de On-demand
transferência usando CreateFeatureGroupou UpdateFeatureGroupAPIsou por meio da interface do console. Para obter mais informações sobre como usar a interface do usuário do console, consulteUsando a Amazon SageMaker Feature Store no console.
Importante
Você só pode atualizar o modo de taxa de transferência do grupo de recursos para On-demand
uma vez em um período de 24 horas.
Modo de taxa de transferência provisionada
O modo de taxa de Provisioned
transferência funciona melhor quando você usa grupos de recursos com cargas de trabalho previsíveis e pode prever os requisitos de capacidade para controlar os custos. Isso pode torná-lo mais econômico para determinadas cargas de trabalho, nas quais você pode antecipar os requisitos de taxa de transferência.
Ao definir um grupo de recursos para o Provisioned
modo, você especifica unidades de capacidade que são a quantidade máxima de capacidade que um aplicativo pode consumir de um grupo de recursos. Se seu aplicativo exceder essa capacidade de taxa de Provisioned
transferência, ele estará sujeito à limitação de solicitações.
Veja a seguir informações sobre as unidades de capacidade de leitura e gravação.
-
Recuperar um único registro de até 4 KB usando o
GetRecord
API consumirá pelo menos 1 RCU (unidade de capacidade de leitura). A recuperação de cargas úteis maiores pode demorar mais. O número total de unidades de capacidade de leitura necessárias depende do tamanho do item, incluindo um pequeno metadado por registro adicionado pelo serviço Feature Store. -
Uma única solicitação de gravação com uma carga útil de 1 KB usando o
PutRecord
API consumirá pelo menos 1 WCU (unidade de capacidade de gravação), com cargas fracionárias arredondadas para o KB mais próximo. Pode consumir mais dependendo da hora do evento, do status de exclusão do registro e do status de time to live (TTL). Para obter mais informações sobreTTL, consulteDuração do tempo de vida (TTL) para registros.
Importante
Ao definir suas unidades de capacidade, considere o seguinte:
-
Você será cobrado pelas capacidades de leitura e gravação provisionadas para seu grupo de recursos, mesmo que não utilize totalmente a
Provisioned
capacidade. -
Se você definir uma capacidade de leitura ou gravação muito baixa, suas solicitações poderão sofrer limitação.
-
Em alguns casos, os registros podem consumir uma unidade de capacidade extra devido aos metadados em nível de registro adicionados pelo serviço Feature Store para ativar vários recursos.
-
Recuperar somente um subconjunto de recursos usando
GetRecord
ou aindaBatchGetRecord
APIs consumirá o RCU correspondente ao registro inteiro. -
Para capacidade de gravação, você deve provisionar o dobro da capacidade de pico recente para evitar limitações ao realizar preenchimentos ou ingestão em massa, o que pode resultar em um grande número de gravações históricas de registros. Isso ocorre porque a gravação de registros históricos consome capacidade de gravação adicional.
-
Atualmente, a Feature Store não oferece suporte ao escalonamento automático para o
Provisioned
modo.
Você pode ativar o modo de taxa de On-demand
transferência usando CreateFeatureGroupou UpdateFeatureGroupAPIsou por meio da interface do console. Para obter mais informações sobre como usar a interface do usuário do console, consulteUsando a Amazon SageMaker Feature Store no console.
A seguir, descrevemos como você pode aumentar ou diminuir a taxa de WCU transferência RCU e a taxa de transferência de seus grupos de recursos quando o Provisioned
modo está ativado.
Aumento da taxa de transferência provisionada
Você pode aumentar RCU ou sempre WCU que necessário usando a interface do usuário UpdateFeatureGroupAPIou do console.
Diminuindo a taxa de transferência provisionada
Você pode diminuir RCU e WCU (ou ambos) para grupos de recursos usando UpdateFeatureGroupAPIou a interface do console.
Há uma cota padrão no número de reduções de Provisioned
capacidade que você pode realizar em seu grupo de recursos por dia. Um dia é definido de acordo com o Tempo Universal Coordenado (UTC). Em determinado dia, você pode começar realizando até quatro reduções dentro de uma hora, desde que ainda não tenha realizado nenhuma outra redução durante esse dia. Posteriormente, você pode realizar uma redução adicional por hora, desde que não tenha havido reduções na hora anterior. Isso leva o número máximo de diminuições em um dia para 27 vezes (4 diminuições na primeira hora e 1 diminuição para cada uma das janelas de 1 hora subsequentes em um dia).
Métricas do modo de produtividade
Um grupo de recursos no On-demand
modo emitirá uma ConsumedReadRequestsUnits
ConsumedWriteRequestsUnits
métrica. Um grupo de recursos no Provisioned
modo emitirá uma ConsumedReadCapacityUnits
ConsumedWriteCapacityUnits
métrica. Para obter mais informações sobre as métricas da Feature Store, consulteMétricas da Amazon SageMaker Feature Store.
Limites do modo de taxa de transferência
Cada um Conta da AWS tem cotas ou limites de serviço padrão que são aplicados para ajudar a garantir a disponibilidade e gerenciar os riscos de cobrança. Para obter informações sobre as cotas e limites padrão, consulteCotas, regras de nomenclatura e tipos de dados.
Em alguns casos, esses limites podem ser menores do que o indicado na documentação. Se precisar de limites mais altos, você pode enviar uma solicitação de aumento. É uma boa ideia fazer isso antes de atingir os limites atuais para evitar interrupções no trabalho. Para obter mais informações sobre service quotas e como solicitar um aumento de cota, consulte Service quotas da AWS.