Planejando MLOPs bem-sucedidos - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Planejando MLOPs bem-sucedidos

Bruno Klein, Amazon Web Services (AWS)

Dezembro de 2021 (histórico do documento)

A implantação de soluções de aprendizado de máquina (ML) na produção apresenta muitos desafios que não surgem em projetos de desenvolvimento de software padrão. Em primeiro lugar, as soluções de ML são mais complexas e difíceis de obter. Eles também existem em ambientes geralmente voláteis, onde a distribuição de dados se desvia significativamente ao longo do tempo por vários motivos esperados e inesperados.

Esses problemas são ainda mais agravados pelo fato de muitos profissionais de ML não terem experiência em engenharia de software, então eles podem não estar familiarizados com as melhores práticas desse setor, como escrever código testável, modularizar componentes e usar o controle de versão de forma eficaz. Esses desafios criam dívidas técnicas, e as soluções se tornam mais complexas e difíceis de manter com o tempo, impulsionadas por um efeito composto, para as equipes de ML.

Este guia enumera as melhores práticas de operações de ML (MLOPs) que ajudam a mitigar esses desafios em projetos e cargas de trabalho de ML.

Como os MLOps são uma preocupação transversal, esses problemas afetam não apenas os processos de implantação e monitoramento, mas todo o ciclo de vida do modelo. Neste guia, as melhores práticas de MLOP são organizadas em quatro áreas principais:

Resultados comerciais direcionados

A implantação de modelos de ML na produção é uma tarefa que exige esforço contínuo e uma equipe dedicada para manter esses recursos durante toda a vida útil (em alguns casos, até anos). Os modelos de ML podem extrair um valor considerável dos dados comerciais, mas têm altos custos. Para minimizar os custos, as empresas devem seguir boas práticas em desenvolvimento de software e ciência de dados. Eles devem estar cientes das nuances dos sistemas de ML, como o desvio de dados, que faz com que os modelos funcionem inesperadamente após algum tempo. Ao estarem cientes dessas preocupações, as empresas podem atingir suas metas de negócios com segurança e agilidade no curto e longo prazo.

Existem vários tipos de modelos de ML, e os setores que eles visam têm vários tipos de tarefas de ML e problemas de negócios. Portanto, é necessário considerar um conjunto diferente de preocupações para cada modelo e setor. As práticas apresentadas neste guia não são específicas para um modelo ou negócio, mas se aplicam a um amplo conjunto de modelos e setores para melhorar os tempos de implantação, gerar maior produtividade e construir uma governança e uma segurança mais fortes.

Colocar modelos em produção é uma tarefa multidisciplinar que exige cientistas de dados, engenheiros de aprendizado de máquina, engenheiros de dados e engenheiros de software. Ao criar sua equipe de ML, recomendamos que você foque nessas habilidades e experiências.