As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Implante a lógica de pré-processamento em um modelo de ML em um único endpoint usando um pipeline de inferência na Amazon SageMaker
Criado por Mohan Gowda Purushothama (AWS), Gabriel Rodriguez Garcia (AWS) e Mateusz Zaremba (AWS)
Resumo
Esse padrão explica como implantar vários objetos de modelo de pipeline em um único endpoint usando um pipeline de inferência na Amazon. SageMaker O objeto do modelo de pipeline representa diferentes estágios do fluxo de trabalho de machine learning (ML), como pré-processamento, inferência de modelos e pós-processamento. Para ilustrar a implantação de objetos de modelo de pipeline conectados em série, esse padrão mostra como implantar um contêiner Scikit-learn de pré-processamento e um modelo de regressão baseado no algoritmo linear do aluno incorporado. SageMaker A implantação é hospedada por trás de um único endpoint em SageMaker.
nota
A implantação nesse padrão usa o tipo de instância ml.m4.2xlarge. Recomendamos usar um tipo de instância que se alinhe aos seus requisitos de tamanho de dados e à complexidade do seu fluxo de trabalho. Para obter mais informações, consulte Amazon SageMaker Pricing
Pré-requisitos e limitações
Pré-requisitos
Uma conta AWS ativa
Função do AWS Identity and Access Management (AWS IAM) com permissões básicas e SageMaker permissões do Amazon Simple Storage Service (Amazon S3)
Versões do produto
Arquitetura
Pilha de tecnologias de destino
Amazon Elastic Container Registry (Amazon ECR)
Amazon SageMaker
SageMaker Estúdio Amazon
Amazon Simple Storage Service (Amazon S3)
Endpoint de inferência em tempo real para a Amazon SageMaker
Arquitetura de destino
O diagrama a seguir mostra a arquitetura para a implantação de um objeto de modelo de SageMaker pipeline da Amazon.

O diagrama mostra o seguinte fluxo de trabalho:
Um SageMaker notebook implanta um modelo de pipeline.
Um bucket do S3 armazena os artefatos do modelo.
O Amazon ECR obtém as imagens do contêiner de origem do bucket do S3.
Ferramentas
Ferramentas da AWS
O Amazon Elastic Container Registry (Amazon ECR) é um serviço gerenciado de registro de imagens de contêineres seguro, escalável e confiável.
SageMakerA Amazon é um serviço gerenciado de ML que ajuda você a criar e treinar modelos de ML e depois implantá-los em um ambiente hospedado pronto para produção.
O Amazon SageMaker Studio é um ambiente de desenvolvimento integrado (IDE) baseado na web para ML que permite criar, treinar, depurar, implantar e monitorar seus modelos de ML.
O Amazon Simple Storage Service (Amazon S3) é um serviço de armazenamento de objetos baseado na nuvem que ajuda você a armazenar, proteger e recuperar qualquer quantidade de dados.
Código
O código desse padrão está disponível no GitHub Inference Pipeline com o repositório Scikit-learn e Linear
Épicos
Tarefa | Descrição | Habilidades necessárias |
---|---|---|
Prepare o conjunto de dados para sua tarefa de regressão. | Abra um caderno no Amazon SageMaker Studio. Para importar todas as bibliotecas necessárias e inicializar seu ambiente de trabalho, use o código de exemplo a seguir em seu notebook:
Para baixar um conjunto de dados de exemplo, adicione o seguinte código ao seu caderno:
notaO exemplo desse padrão usa o Conjunto de Dados Abalone | Cientista de dados |
Faça upload do conjunto de dados em um bucket do S3. | No caderno em que você preparou seu conjunto de dados anteriormente, adicione o código a seguir para carregar seus dados de amostra em um bucket do S3:
| Cientista de dados |
Tarefa | Descrição | Habilidades necessárias |
---|---|---|
Prepare o script preprocessor.py. |
| Cientista de dados |
Crie o objeto do SKLearn pré-processador. | Para criar um objeto SKLearn pré-processador (chamado SKLearn Estimator) que você possa incorporar ao seu pipeline de inferência final, execute o seguinte código em seu notebook: SageMaker
| Cientista de dados |
Teste a inferência do pré-processador. | Para confirmar se seu pré-processador está definido corretamente, inicie um trabalho de transformação em lote inserindo o seguinte código em seu SageMaker notebook:
|
Tarefa | Descrição | Habilidades necessárias |
---|---|---|
Criar um objeto modelo. | Para criar um objeto de modelo com base no algoritmo linear do aluno, insira o seguinte código em seu SageMaker caderno:
O código anterior recupera a imagem do Docker do Amazon ECR do Registro público do Amazon ECR para o modelo, cria um objeto estimador e, em seguida, usa esse objeto para treinar o modelo de regressão. | Cientista de dados |
Tarefa | Descrição | Habilidades necessárias |
---|---|---|
Implantar o modelo de pipeline. | Para criar um objeto de modelo de pipeline (ou seja, um objeto de pré-processador) e implantar o objeto, insira o seguinte código em seu SageMaker notebook:
notaVocê pode ajustar o tipo de instância usado no objeto de modelo para atender às suas necessidades. | Cientista de dados |
Teste a inferência | Para confirmar se o endpoint está funcionando corretamente, execute o seguinte exemplo de código de inferência em seu SageMaker notebook:
| Cientista de dados |