OPS07-BP02 Garantir uma revisão consistente da prontidão operacional - Pilar Excelência operacional

OPS07-BP02 Garantir uma revisão consistente da prontidão operacional

Use revisões de prontidão operacional (ORRs) para validar que você pode operar sua workload. A ORR é um mecanismo desenvolvido na Amazon para validar que as equipes podem operar as workloads com segurança. Uma ORR é um processo de análise e inspeção que usa uma lista de verificação de requisitos. Uma ORR é uma experiência de autoatendimento que as equipes usam para certificar suas workloads. As ORRs incluem práticas recomendadas de lições aprendidas de nossos anos de experiência na criação de software.

Uma lista de verificação de ORR é composta de recomendações de arquitetura, processo operacional, gerenciamento de evento e qualidade de lançamento. Nosso processo de Correção de erros (CoE) é um motivador principal desses itens. Sua própria análise pós-incidente deve impulsionar a evolução de sua própria ORR. Uma ORR não é apenas sobre seguir as práticas recomendadas, mas evitar a recorrência de eventos que você já viu. Por fim, os requisitos de segurança, governança e conformidade também podem ser incluídos em uma ORR.

Execute ORRs antes do lançamento de uma workload para disponibilidade geral e por todo o ciclo de vida de desenvolvimento do software. A execução da ORR antes do lançamento aumenta a capacidade de operar a workload com segurança. Execute a ORR periodicamente na workload para identificar qualquer desvio das práticas recomendadas. Você pode ter listas de verificação da ORR para o lançamento de outros serviços e ORRs para avaliações periódicas. Isso ajuda a manter você em dia com as novas práticas recomendadas que surgem e incorporar as lições aprendidas da análise pós-incidente. À medida que seu uso da nuvem amadurece, é possível criar requisitos de ORR em sua arquitetura como padrões.

Resultado desejado: você tem uma lista de verificação da ORR com as práticas recomendadas para sua organização. As ORRs são realizadas antes do lançamento das workloads. As ORRs são executadas periodicamente ao longo do ciclo de vida da workload.

Práticas comuns que devem ser evitadas:

  • Você lança uma workload sem saber se pode operá-la.

  • Os requisitos de governança e segurança não estão incluídos na certificação de uma workload para o lançamento.

  • As workloads não são reavaliadas periodicamente.

  • As workloads são lançadas sem a aplicação dos procedimentos exigidos.

  • Você vê a repetição das mesmas falhas da causa-raiz em várias workloads.

Benefícios de implementar esta prática recomendada:

  • Suas workloads incluem práticas recomendadas de arquitetura, processo e gerenciamento.

  • As lições aprendidas são incorporadas em seu processo de ORR.

  • Os procedimentos exigidos estão em vigor no lançamento das workloads.

  • As ORRs são executadas durante todo o ciclo de vida do software das workloads.

Nível de risco se esta prática recomendada não for estabelecida: Alto

Orientação para implementação

Uma ORR é composta por dois elementos: um processo e uma lista de verificação. O processo da ORR deve ser adotado pela organização e ter o apoio de um patrocinador executivo. No mínimo, as ORRs devem ser realizadas antes do lançamento da workload para disponibilidade geral. Execute a ORR ao longo de todo o ciclo de vida de desenvolvimento do software para mantê-la atualizada com as práticas recomendadas ou os novos requisitos. A lista de verificação da ORR deve incluir itens de configuração, requisitos de segurança e governança e práticas recomendadas de sua organização. Com o tempo, você pode usar serviços como AWS Config, AWS Security Hub e AWS Control Tower Guardrails para criar as práticas recomendadas do ORR em grades de proteção para a detecção automática de práticas recomendadas.

Exemplo de cliente

Depois de vários incidentes na produção, a AnyCompany Retail decidiu implementar um processo de ORR. Ela criou uma lista de verificação composta de práticas recomendadas, requisitos de governança e conformidade e lições aprendidas de interrupções. As novas workloads passam pelo processo de ORR antes do lançamento. Uma ORR é realizada anualmente para cada workload com um subconjunto de práticas recomendadas para incorporar novas práticas recomendadas e requisitos que são adicionados à lista de verificação da ORR. A AnyCompany Retail usava o AWS Config para detectar algumas das práticas recomendadas, acelerando o processo de ORR.

Etapas de implementação

Para saber mais sobre ORRs, leia o whitepaper Revisões de prontidão operacional (ORR). Ele fornece informações detalhadas sobre o histórico do processo de ORR, como criar sua própria prática de ORR e como desenvolver sua lista de verificação da ORR. As etapas a seguir são uma versão resumida desse documento. Para uma compreensão aprofundada do que são as ORRs e de como criar sua própria revisão, recomendamos a leitura desse whitepaper.

  1. Reúna as principais partes interessadas, incluindo os representantes de segurança, operações e desenvolvimento.

  2. Peça para cada parte interessada fornecer pelo menos um requisito. Para a primeira iteração, tente limitar o número de itens para trinta ou menos.

  3. Reúna seus requisitos em uma planilha.

  4. Identifique uma workload na qual realizar a ORR. O ideal seria em uma workload em pré-lançamento ou uma workload interna.

  5. Execute a lista de verificação completa da ORR e anote as descobertas feitas. As descobertas poderão não ser corretas caso uma mitigação esteja ocorrendo. Para descobertas que não tenham uma mitigação, acrescente-as à sua lista de pendências e implemente-as antes do lançamento.

  6. Continue a adicionar práticas recomendadas e requisitos à sua lista de verificação de ORR ao longo do tempo.

Os clientes do AWS Support com Enterprise Support podem solicitar o workshop Revisões de prontidão operacional a seus gerentes técnicos de conta. O workshop é uma sessão de trabalho retroativo interativa que permite desenvolver sua própria lista de verificação de ORR.

Nível de esforço do plano de implementação: Alto. Adotar uma prática de ORR em sua organização exige a adesão de um patrocinador executivo e das partes interessadas. Crie e atualize a lista de verificação com as opiniões de toda a sua organização.

Recursos

Práticas recomendadas relacionadas:

Documentos relacionados:

Vídeos relacionados:

Exemplos relacionados:

Serviços relacionados: