Práticas recomendadas -

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Práticas recomendadas

Esta seção fornece uma visão geral das AWS melhores práticas para MLOps.

Gerenciamento e separação de contas

AWS as melhores práticas para gerenciamento de contas recomendam que você divida suas contas em quatro contas para cada caso de uso: experimentação, desenvolvimento, teste e produção. Também é uma prática recomendada ter uma conta de governança para fornecer MLOps recursos compartilhados em toda a organização e uma conta de data lake para fornecer acesso centralizado aos dados. A justificativa para isso é separar completamente os ambientes de desenvolvimento, teste e produção, evitar atrasos causados por limites de serviço atingidos por vários casos de uso, evitar que equipes de ciência de dados compartilhem o mesmo conjunto de contas e fornecer uma visão geral completa dos custos de cada caso de uso. Finalmente, é prática recomendada separar os dados no nível da conta, pois cada caso de uso tem seu próprio conjunto de contas.

Padrões de segurança

Para atender a requisitos de segurança, é prática recomendada desativar o acesso público à Internet e criptografar todos os dados com chaves personalizadas. Em seguida, você pode implantar uma instância segura do Amazon SageMaker AI Studio na conta de desenvolvimento em questão de minutos usando o Service Catalog. Você também pode obter recursos de auditoria e monitoramento de modelos para cada caso de uso usando a SageMaker IA por meio de modelos implantados com projetos de SageMaker IA.

Recursos de casos de uso

Depois que a configuração da conta for concluída, os cientistas de dados da sua organização poderão solicitar um novo modelo de caso de uso usando SageMaker projetos de SageMaker IA no AI Studio. Esse processo implanta a infraestrutura necessária para ter MLOps recursos na conta de desenvolvimento (com o mínimo de suporte exigido das equipes centrais), como CI/CD pipelines, testes unitários, testes de modelos e monitoramento de modelos.

Cada caso de uso é então desenvolvido (ou refatorado no caso de uma base de código de aplicativo existente) para ser executado em uma arquitetura de IA usando SageMaker recursos de SageMaker IA, como rastreamento de experimentos, explicabilidade do modelo, detecção de viés e monitoramento de qualidade. data/model Você pode adicionar esses recursos a cada pipeline de caso de uso usando etapas de pipelines no SageMaker AI Pipelines.

MLOps jornada de maturidade

A jornada de MLOps maturidade define os MLOps recursos necessários disponibilizados em uma configuração em toda a empresa para garantir a implementação de um end-to-end modelo de fluxo de trabalho. A jornada de maturidade consiste em quatro estágios:

  1. Inicial: nesse estágio, você estabelece a conta de experimentação. Você também protege uma nova AWS conta em sua organização, onde pode experimentar o SageMaker Studio e outros novos AWS serviços.

  2. Repetível: nesse estágio, você padroniza os repositórios de código e o desenvolvimento da solução de ML. Você também adota uma abordagem de implementação de várias contas e padroniza seus repositórios de código para oferecer suporte a governança do modelo e a auditorias de modelos à medida que aumenta a escala da oferta horizontalmente. É prática recomendada adotar uma abordagem de desenvolvimento de modelos pronta para produção com soluções padrão fornecidas por uma conta de governança. Os dados são armazenados em uma conta do data lake e os casos de uso são desenvolvidos em duas contas. A primeira conta é para experimentação durante o período de exploração de ciência de dados. Nessa conta, os cientistas de dados descobrem modelos para resolver o problema de negócios e experimentam várias possibilidades. A outra conta deve ser usada para o desenvolvimento que ocorre após a identificação do melhor modelo e quando a equipe de ciência de dados está pronta para trabalhar no pipeline de inferência.

  3. Confiável: nesse estágio, você introduz o teste, a implantação e a implantação de várias contas. Você deve entender MLOps os requisitos e introduzir testes automatizados. Implemente as MLOps melhores práticas para garantir que os modelos sejam robustos e seguros. Durante essa fase, apresente duas novas contas de casos de uso: uma conta de teste para testar modelos desenvolvidos em um ambiente que emula o ambiente de produção e uma conta de produção para executar a inferência de modelos durante as operações comerciais. Por fim, use testes, implantação e monitoramento automatizados de modelos em uma configuração de várias contas para garantir que seus modelos atendam ao padrão de alta qualidade e performance definidos.

  4. Escalável: nesse estágio, você modela e produz várias soluções de ML. Várias equipes e casos de uso de ML começam a ser adotados MLOps durante o processo de construção do end-to-end modelo. Para obter escalabilidade nesse estágio, você também aumenta o número de modelos em sua biblioteca de modelos por meio de contribuições de uma base mais ampla de cientistas de dados, reduz o tempo de geração de valor da ideia ao modelo de produção para mais equipes em toda a organização e itera à medida que você escala.

Para obter mais informações sobre o modelo de MLOps maturidade, consulte o roteiro MLOps básico para empresas com Amazon SageMaker AI no blog do AWS Machine Learning.