Restrições de serviço e cotas para produtos de aprendizado de máquina em AWS Marketplace - AWS Marketplace

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Restrições de serviço e cotas para produtos de aprendizado de máquina em AWS Marketplace

Esta seção descreve restrições e cotas em produtos de machine learning (ML) no AWS Marketplace.

Isolamento de rede

Quando um comprador assina seu produto em contêiner, os contêineres do Docker são executados em um ambiente isolado sem acesso à Internet. Ao criar contêineres, não dependa de chamadas de saída pela Internet, pois elas falharão. As chamadas para Serviços da AWS também falharão.

Tamanho da imagem

O tamanho da imagem do Docker é controlado pelas cotas de serviço do Amazon Elastic Container Registry ECR (Amazon). O tamanho da imagem do Docker afeta o tempo de inicialização durante o treinamento, os trabalhos de transformação em lotes e os trabalhos de criação de endpoints. Para obter o melhor desempenho, mantenha o tamanho da imagem do Docker ideal.

Tamanho de armazenamento

Quando você cria um endpoint, a Amazon SageMaker anexa um volume de armazenamento do Amazon Elastic Block Store EBS (Amazon) a cada instância de computação de ML que hospeda o endpoint. (Um endpoint também é conhecido como inferência em tempo real ou serviço de SageMaker hospedagem da Amazon.) O tamanho do volume de armazenamento depende do tipo de instância. Para obter mais informações, consulte Host Instance Storage Volumes no Amazon SageMaker Developer Guide

Para transformação em lote, consulte Storage in Batch Transform no Amazon SageMaker Developer Guide.

Tamanho da instância

SageMaker fornece uma seleção de tipos de instância que são otimizados para se adequar a diferentes casos de uso de ML. Os tipos de instância são compostos por combinações variadas deCPU,GPU, memória e capacidade de rede. Os tipos de instância oferecem a flexibilidade de escolher a combinação de recursos adequada para criar, treinar e implantar os modelos de ML. Para obter mais informações, consulte Tipos de instância do Amazon SageMaker ML.

Tamanho da carga para inferência

Para um endpoint, limite o tamanho máximo dos dados de entrada por invocação a 6 MB. Esse valor não pode ser ajustado.

Para transformação em lote, o tamanho máximo dos dados de entrada por invocação é 100 MB. Esse valor não pode ser ajustado.

Tempo de processamento para inferência

Para um endpoint, o tempo máximo de processamento por invocação é de 60 segundos. Esse valor não pode ser ajustado.

Para transformação em lote, o tempo máximo de processamento por invocação é de 60 minutos. Esse valor não pode ser ajustado.

Cotas de serviço

Para obter mais informações sobre cotas relacionadas a treinamento e inferência, consulte Amazon Service SageMaker Quotas.

Inferência assíncrona

Pacotes de modelos e algoritmos publicados em não AWS Marketplace podem ser implantados em endpoints configurados para Amazon SageMaker Asynchronous Inference. Os endpoints configurados para inferência assíncrona exigem que os modelos tenham conectividade de rede. Todos os AWS Marketplace modelos operam em isolamento de rede. Para mais informações, consulte Sem acesso à rede.

Inferência com tecnologia sem servidor

Pacotes de modelos e algoritmos publicados em não AWS Marketplace podem ser implantados em endpoints configurados para o Amazon SageMaker Serverless Inference. Os endpoints configurados para inferência com tecnologia sem servidor exigem que os modelos tenham conectividade de rede. Todos os AWS Marketplace modelos operam em isolamento de rede. Para mais informações, consulte Sem acesso à rede.

Treinamento gerenciado de spots

Para todos os algoritmos do AWS Marketplace, o valor de MaxWaitTimeInSeconds é definido como 3.600 segundos (60 minutos), mesmo que o ponto de verificação para treinamento pontual gerenciado seja implementado. Esse valor não pode ser ajustado.

Imagens do Docker e Contas da AWS

Para publicação, as imagens devem ser armazenadas nos ECR repositórios da Amazon de propriedade Conta da AWS do vendedor. Não é possível publicar imagens armazenadas em um repositório de propriedade de outra pessoa Conta da AWS.

Publicação de pacotes de modelos a partir de algoritmos integrados ou AWS Marketplace

Pacotes de modelos criados a partir de trabalhos de treinamento usando um algoritmo SageMaker integrado da Amazon ou um algoritmo de uma AWS Marketplace assinatura não podem ser publicados.

Você ainda pode usar os artefatos do modelo do trabalho de treinamento, mas sua própria imagem de inferência é necessária para publicar pacotes de modelo.

Regiões da AWS Compatível com publicação

AWS Marketplace suporta recursos de pacotes de modelos e algoritmos de publicação, dos Regiões da AWS quais o seguinte é verdadeiro:

Todos os ativos necessários para publicar um pacote de modelo ou produto de algoritmo devem ser armazenados na mesma região da qual você escolhe publicar. Essa transmissão inclui o seguinte:

  • Recursos de pacotes e algoritmos de modelos criados na Amazon SageMaker

  • Imagens de inferência e treinamento que são enviadas para os repositórios da Amazon ECR

  • Artefatos de modelo (se houver) que são armazenados no Amazon Simple Storage Service (Amazon S3) e carregados dinamicamente durante a implantação do modelo para recursos do pacote de modelo

  • Dados de teste para inferência e validação de treinamento armazenados no Amazon S3

Você pode desenvolver e treinar seu produto em qualquer região que seja apoiada pela SageMaker. Mas, antes de publicar, você deve copiar todos os ativos e recriar recursos em uma região para a qual o AWS Marketplace ofereça suporte à publicação.

Durante o processo de listagem, independentemente de onde você publica, você pode escolher as regiões nas quais deseja publicar e disponibilizar seu produto. Região da AWS