Acessando imagens do Docker para Scikit-learn e Spark ML - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Acessando imagens do Docker para Scikit-learn e Spark ML

SageMaker fornece imagens pré-criadas do Docker que instalam as bibliotecas scikit-learn e Spark ML. Essas bibliotecas também incluem as dependências necessárias para criar imagens do Docker que sejam compatíveis com o SageMaker uso do Amazon Python SageMaker . SDK Com oSDK, você pode usar o scikit-learn para tarefas de aprendizado de máquina e usar o Spark ML para criar e ajustar pipelines de aprendizado de máquina. Para obter instruções sobre como instalar e usar oSDK, consulte SageMaker Python SDK.

Você também pode acessar as imagens de um ECR repositório da Amazon em seu próprio ambiente.

Use os seguintes comandos para descobrir quais versões das imagens estão disponíveis. Por exemplo, use o seguinte para encontrar a imagem sagemaker-sparkml-serving disponível na região ca-central-1:

aws \ ecr describe-images \ --region ca-central-1 \ --registry-id 341280168497 \ --repository-name sagemaker-sparkml-serving

Acessando uma imagem do SageMaker Python SDK

A tabela a seguir contém links para os GitHub repositórios com o código-fonte dos contêineres scikit-learn e Spark ML. A tabela também contém links para instruções que mostram como usar esses contêineres com SDK estimadores Python para executar seus próprios algoritmos de treinamento e hospedar seus próprios modelos.

Para obter mais informações e links para os repositórios do github, consulte Recursos para usar o Scikit-learn com a Amazon SageMaker e Recursos para usar o SparkML Serving com a Amazon SageMaker.

Especificar manualmente as imagens pré-compiladas

Se você não estiver usando o SageMaker Python SDK e um de seus estimadores para gerenciar o contêiner, precisará recuperar o contêiner pré-construído relevante manualmente. As imagens SageMaker pré-criadas do Docker são armazenadas no Amazon Elastic Container Registry (AmazonECR). Você pode enviá-los ou retirá-los usando seus endereços de registro de nome completo. SageMaker usa os seguintes URL padrões de imagem do Docker para scikit-learn e Spark ML:

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-scikit-learn:<SCIKIT-LEARN_VERSION>-cpu-py<PYTHON_VERSION>

    Por exemplo, 746614075791.dkr.ecr.us-west-1.amazonaws.com/sagemaker-scikit-learn:1.2-1-cpu-py3

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-sparkml-serving:<SPARK-ML_VERSION>

    Por exemplo, 341280168497.dkr.ecr.ca-central-1.amazonaws.com/sagemaker-sparkml-serving:2.4

Para nomes de contas IDs e AWS regiões, consulte Caminhos de registro do Docker e código de exemplo.