Modos de taxa de transferência - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Modos de taxa de transferência

A Amazon SageMaker Feature Store oferece dois modelos de preços para você escolher: modos de taxa de transferência sob demanda (On-demand) e provisionado (Provisioned). On-demandfunciona melhor para tráfego menos previsível, enquanto Provisioned funciona melhor para tráfego consistente e previsível.

Você tem a opção de alternar entre os modos On-demand e de taxa de Provisioned transferência para um determinado grupo de recursos, para acomodar períodos nos quais os padrões de tráfego do aplicativo estão mudando ou são menos previsíveis. Você só pode atualizar o modo de taxa de transferência do grupo de recursos para On-demand uma vez em um período de 24 horas. O modo de taxa de transferência pode ser atualizado programaticamente usando a interface do usuário do console UpdateFeatureGroupAPIou por meio dela. Para obter mais informações sobre como usar o console, consulteUsando a Amazon SageMaker Feature Store no console.

Você pode usar o modo de taxa de Provisioned transferência com grupos de recursos somente offline ou grupos de recursos com o tipo de armazenamento. Standard Para outras configurações de armazenamento, o modo de On-demand taxa de transferência é usado. Para obter informações sobre as configurações de armazenamento on-line e off-line, consulte Armazenamento on-line eArmazenamento offline, respectivamente.

Para obter mais detalhes sobre preços, consulte Amazon SageMaker Pricing.

Modo de taxa de transferência sob demanda

O modo de taxa de transferência On-demand (padrão) funciona melhor quando você usa grupos de recursos com carga de trabalho desconhecida, tráfego de aplicativos imprevisível e não consegue prever os requisitos de capacidade.

O On-demand modo cobra pelas leituras e gravações que seu aplicativo executa em seus grupos de recursos. Você não precisa especificar a taxa de transferência de leitura e gravação que espera que seu aplicativo execute, pois o Feature Store acomoda instantaneamente suas cargas de trabalho à medida que elas aumentam ou diminuem. Você paga apenas pelo que usa, que é medido em ReadRequestsUnits WriteRequestsUnits e.

Você pode ativar o modo de taxa de On-demand transferência usando CreateFeatureGroupou UpdateFeatureGroupAPIsou por meio da interface do console. Para obter mais informações sobre como usar a interface do usuário do console, consulteUsando a Amazon SageMaker Feature Store no console.

Importante

Você só pode atualizar o modo de taxa de transferência do grupo de recursos para On-demand uma vez em um período de 24 horas.

Modo de taxa de transferência provisionada

O modo de taxa de Provisioned transferência funciona melhor quando você usa grupos de recursos com cargas de trabalho previsíveis e pode prever os requisitos de capacidade para controlar os custos. Isso pode torná-lo mais econômico para determinadas cargas de trabalho, nas quais você pode antecipar os requisitos de taxa de transferência.

Ao definir um grupo de recursos para o Provisioned modo, você especifica unidades de capacidade que são a quantidade máxima de capacidade que um aplicativo pode consumir de um grupo de recursos. Se seu aplicativo exceder essa capacidade de taxa de Provisioned transferência, ele estará sujeito à limitação de solicitações.

Veja a seguir informações sobre as unidades de capacidade de leitura e gravação.

  • Recuperar um único registro de até 4 KB usando o GetRecord API consumirá pelo menos 1 RCU (unidade de capacidade de leitura). A recuperação de cargas úteis maiores pode demorar mais. O número total de unidades de capacidade de leitura necessárias depende do tamanho do item, incluindo um pequeno metadado por registro adicionado pelo serviço Feature Store.

  • Uma única solicitação de gravação com uma carga útil de 1 KB usando o PutRecord API consumirá pelo menos 1 WCU (unidade de capacidade de gravação), com cargas fracionárias arredondadas para o KB mais próximo. Pode consumir mais dependendo da hora do evento, do status de exclusão do registro e do status de time to live (TTL). Para obter mais informações sobreTTL, consulteDuração do tempo de vida (TTL) para registros.

Importante

Ao definir suas unidades de capacidade, considere o seguinte:

  • Você será cobrado pelas capacidades de leitura e gravação provisionadas para seu grupo de recursos, mesmo que não utilize totalmente a Provisioned capacidade.

  • Se você definir uma capacidade de leitura ou gravação muito baixa, suas solicitações poderão sofrer limitação.

  • Em alguns casos, os registros podem consumir uma unidade de capacidade extra devido aos metadados em nível de registro adicionados pelo serviço Feature Store para ativar vários recursos.

  • Recuperar somente um subconjunto de recursos usando GetRecord ou ainda BatchGetRecord APIs consumirá o RCU correspondente ao registro inteiro.

  • Para capacidade de gravação, você deve provisionar o dobro da capacidade de pico recente para evitar limitações ao realizar preenchimentos ou ingestão em massa, o que pode resultar em um grande número de gravações históricas de registros. Isso ocorre porque a gravação de registros históricos consome capacidade de gravação adicional.

  • Atualmente, a Feature Store não oferece suporte ao escalonamento automático para o Provisioned modo.

Você pode ativar o modo de taxa de On-demand transferência usando CreateFeatureGroupou UpdateFeatureGroupAPIsou por meio da interface do console. Para obter mais informações sobre como usar a interface do usuário do console, consulteUsando a Amazon SageMaker Feature Store no console.

A seguir, descrevemos como você pode aumentar ou diminuir a taxa de WCU transferência RCU e a taxa de transferência de seus grupos de recursos quando o Provisioned modo está ativado.

Aumento da taxa de transferência provisionada

Você pode aumentar RCU ou sempre WCU que necessário usando a interface do usuário UpdateFeatureGroupAPIou do console.

Diminuindo a taxa de transferência provisionada

Você pode diminuir RCU e WCU (ou ambos) para grupos de recursos usando UpdateFeatureGroupAPIou a interface do console.

Há uma cota padrão no número de reduções de Provisioned capacidade que você pode realizar em seu grupo de recursos por dia. Um dia é definido de acordo com o Tempo Universal Coordenado (UTC). Em determinado dia, você pode começar realizando até quatro reduções dentro de uma hora, desde que ainda não tenha realizado nenhuma outra redução durante esse dia. Posteriormente, você pode realizar uma redução adicional por hora, desde que não tenha havido reduções na hora anterior. Isso leva o número máximo de diminuições em um dia para 27 vezes (4 diminuições na primeira hora e 1 diminuição para cada uma das janelas de 1 hora subsequentes em um dia).

Métricas do modo de produtividade

Um grupo de recursos no On-demand modo emitirá uma ConsumedReadRequestsUnits ConsumedWriteRequestsUnits métrica. Um grupo de recursos no Provisioned modo emitirá uma ConsumedReadCapacityUnits ConsumedWriteCapacityUnits métrica. Para obter mais informações sobre as métricas da Feature Store, consulteMétricas da Amazon SageMaker Feature Store.

Limites do modo de taxa de transferência

Cada um Conta da AWS tem cotas ou limites de serviço padrão que são aplicados para ajudar a garantir a disponibilidade e gerenciar os riscos de cobrança. Para obter informações sobre as cotas e limites padrão, consulteCotas, regras de nomenclatura e tipos de dados.

Em alguns casos, esses limites podem ser menores do que o indicado na documentação. Se precisar de limites mais altos, você pode enviar uma solicitação de aumento. É uma boa ideia fazer isso antes de atingir os limites atuais para evitar interrupções no trabalho. Para obter mais informações sobre service quotas e como solicitar um aumento de cota, consulte Service quotas da AWS.