Princípios de design - Framework Well-Architected da AWS

Princípios de design

Os princípios de design para alcançar a excelência operacional na nuvem são:

  • Organize as equipes em torno dos resultados comerciais: a capacidade de uma equipe alcançar resultados comerciais vem da visão de liderança, das operações eficazes e de um modelo operacional alinhado aos negócios. A liderança deve estar totalmente envolvida e comprometida com a transformação de CloudOps por meio de um modelo operacional de nuvem adequado que incentive as equipes a operar da maneira mais eficiente e atingir os resultados comerciais. O modelo operacional correto usa pessoas, processos e recursos tecnológicos para escalar, otimizar a produtividade e promover a diferenciação por meio de agilidade, capacidade de resposta e adaptação. A visão de longo prazo da organização é convertida em metas que são comunicadas em toda a empresa às partes interessadas e aos consumidores dos serviços de nuvem. As metas e os KPIs operacionais estão alinhados em todos os níveis. Essa prática sustenta o valor de longo prazo derivado da implementação dos princípios de design a seguir.

  • Implemente observabilidade para insights acionáveis: obtenha uma compreensão abrangente do comportamento, da performance, da confiabilidade, do custo e da integridade da workload. Estabeleça indicadores-chave de performance (KPIs) e aproveite a telemetria de observabilidade para tomar decisões fundamentadas e agir imediatamente quando os resultados obtidos estiverem em risco. Melhore proativamente a performance, a confiabilidade e o custo com base em dados de observabilidade úteis.

  • Automatize com segurança onde possível: na nuvem, você pode aplicar a mesma disciplina de engenharia usada para o código da aplicação em todo o ambiente. Você pode definir toda a workload e as respectivas operações (aplicações, infraestrutura, configuração e procedimentos) como código e atualizá-las. Em seguida, você pode automatizar as operações da workload iniciando-as em resposta a eventos. Na nuvem, você pode usar a segurança de automação configurando barreiras de proteção, incluindo controle de taxa, limites de erro e aprovações. Por meio de uma automação eficiente, você pode conseguir respostas consistentes a eventos, restringir erros humanos e reduzir o trabalho do operador.

  • Faça alterações frequentes, pequenas e reversíveis: projete workloads escaláveis e com acoplamento fraco para permitir que os componentes sejam atualizados regularmente. Técnicas de implantação automatizadas, bem como mudanças menores e incrementais, reduzem o raio de expansão e permitem uma reversão mais rápida se ocorrerem falhas. Isso aumenta a confiança na entrega de mudanças benéficas à workload, mantendo a qualidade e possibilitando uma rápida adaptação às mudanças nas condições do mercado.

  • Refine os procedimentos operacionais com frequência: à medida que você evolui suas workloads, desenvolva suas operações de forma adequada. À medida que usar procedimentos operacionais, procure oportunidades para melhorá-los. Organize revisões regularmente e valide se todos os procedimentos estão em vigor e se as equipes estão familiarizadas com eles. Ao identificar lacunas, atualize os procedimentos adequadamente. Comunique as atualizações dos procedimentos a todas as partes interessadas e equipes. Promova o aprendizado gamificado em suas operações para compartilhar as práticas recomendadas e instruir as equipes.

  • Preveja a falha: maximize o sucesso operacional conduzindo cenários de falha para entender o perfil de risco da workload e seu impacto nos resultados comerciais. Teste a eficácia de seus procedimentos e a resposta de sua equipe em relação a essas falhas simuladas. Tome decisões embasadas para gerenciar riscos abertos identificados pelos testes.

  • Aprenda com todos os eventos operacionais e métricas: promova melhorias com as lições aprendidas em todos os eventos e falhas operacionais. Compartilhe o que foi aprendido com as equipes e a organização inteira. Os aprendizados devem destacar dados e curiosidades sobre como as operações contribuem para os resultados comerciais.

  • Use serviços gerenciados: reduza a carga operacional usando serviços gerenciados da AWS sempre que possível. Crie procedimentos operacionais em torno das interações com esses serviços.