OPS07-BP02 Revisione costante della prontezza operativa
Usa le revisioni della prontezza operativa (ORR) per verificare che puoi utilizzare il carico di lavoro. ORR è un meccanismo sviluppato da Amazon per verificare che i team possano utilizzare in sicurezza i propri carichi di lavoro. ORR è un processo di revisione e ispezione che utilizza un elenco di controllo per i requisiti. È un'esperienza self-service che i team utilizzano per certificare i propri carichi di lavoro. Le ORR includono le best practice delle lezioni apprese durante gli anni dedicati alla creazione di software.
Un elenco di controllo ORR è composto da suggerimenti sull'architettura, processo operativo, gestione degli eventi e qualità del rilascio. Il nostro processo di correzione dell'errore (CoE, Correction of Error) è uno dei principali fattori trainanti di questi elementi. L'analisi post-incidente deve guidare l'evoluzione della ORR. Una ORR non riguarda solo l'adozione delle best practice, ma anche la prevenzione del ripetersi di eventi già visti. Infine, in una ORR possono essere inclusi anche i requisiti di sicurezza, governance e conformità.
Esegui le ORR prima che un carico di lavoro venga lanciato nella disponibilità generale e quindi durante tutto il ciclo di vita dello sviluppo software. L'esecuzione della ORR prima del lancio aumenta la tua capacità di utilizzare il carico di lavoro in sicurezza. Riesegui periodicamente la ORR sul carico di lavoro per cogliere eventuali scostamenti dalle best practice. Puoi usare gli elenchi di controllo ORR per il lancio di nuovi servizi e le ORR per le revisioni periodiche. In tal modo puoi tenerti aggiornato sulle nuove best practice che emergono e incorporare le lezioni apprese dall'analisi post-incidente. Man mano che l'utilizzo del cloud cresce, puoi creare i requisiti di ORR nella tua architettura come valori predefiniti.
Risultato desiderato: hai un elenco di controllo ORR con le best practice per la tua organizzazione. Le ORR vengono eseguite prima dell'avvio dei carichi di lavoro. Le ORR vengono eseguite periodicamente nel corso del ciclo di vita del carico di lavoro.
Anti-pattern comuni:
-
Avvii un carico di lavoro senza sapere se puoi utilizzarlo.
-
I requisiti di governance e sicurezza non sono inclusi nella certificazione di un carico di lavoro per l'avvio.
-
I carichi di lavoro non vengono rivalutati periodicamente.
-
I carichi di lavoro vengono avviati senza le procedure richieste.
-
Si osserva la ripetizione di errori con la stessa causa principale in più carichi di lavoro.
Vantaggi dell'adozione di questa best practice:
-
I tuoi carichi di lavoro includono le best practice di architettura, processo e gestione.
-
Le lezioni apprese sono incorporate nel processo ORR.
-
Le procedure richieste sono in atto all'avvio dei carichi di lavoro.
-
Le ORR vengono eseguite durante l'intero ciclo di vita del software dei carichi di lavoro.
Livello di rischio se questa best practice non fosse adottata: alto
Guida all'implementazione
Una ORR è composta da un processo e un elenco di controllo. Il processo ORR deve essere adottato dall'organizzazione e supportato da uno sponsor esecutivo. Come minimo, le ORR devono essere eseguite prima che il carico di lavoro venga lanciato nella disponibilità generale. Esegui la ORR durante tutto il ciclo di vita dello sviluppo software per mantenerlo aggiornato con le best practice o i nuovi requisiti. L'elenco di controllo ORR deve includere elementi di configurazione, requisiti di sicurezza e governance e best practice dell'organizzazione. Nel tempo, puoi utilizzare i servizi, come AWS Config, AWS Security Hube AWS Control Tower Guardrailsper creare le best practice dalla ORR nei guardrail per il rilevamento automatico delle best practice.
Esempio del cliente
Dopo diversi incidenti di produzione, AnyCompany Retail ha deciso di implementare un processo ORR. Ha creato un elenco di controllo composto da best practice, requisiti di governance e conformità e lezioni apprese dalle interruzioni. I nuovi carichi di lavoro conducono le ORR prima dell'avvio. Ogni carico di lavoro esegue una ORR annuale con un sottoinsieme di best practice per incorporare nuove best practice e requisiti che vengono aggiunti all'elenco di controllo ORR. Nel tempo, AnyCompany Retail ha utilizzato AWS Config per individuare le best practices, accelerando il processo ORR.
Passaggi dell'implementazione
Per ulteriori informazioni sulle ORR, consulta il whitepaper Operational Readiness Reviews (ORR) (Revisioni della prontezza operativa (ORR)). Fornisce informazioni dettagliate sulla cronologia del processo ORR, su come creare la procedura ORR e su come sviluppare il proprio elenco di controllo ORR. I passaggi seguenti costituiscono una versione abbreviata di quel documento. Per una comprensione approfondita di cosa sono le ORR e di come crearne una, ti consigliamo di leggere il whitepaper.
-
Riunisci gli stakeholder importanti, inclusi i rappresentanti della sicurezza, delle operazioni e dello sviluppo.
-
Chiedi a ogni stakeholder di indicare almeno un requisito. Per la prima iterazione, prova a limitare il numero di elementi a trenta al massimo.
-
Appendix B: Example ORR questions (Appendice B: Domande ORR di esempio) del whitepaper Operational Readiness Reviews (ORR) (Revisioni della prontezza operativa (ORR)) contiene domande di esempio che puoi utilizzare per iniziare.
-
-
Raccogli i tuoi requisiti in un foglio di calcolo.
-
Puoi utilizzare gli obiettivi personalizzati nella funzione AWS Well-Architected Tool
per sviluppare la ORR e condividerla tra i tuoi account e l'organizzazione AWS.
-
-
Identifica un carico di lavoro su cui condurre la ORR. L'ideale è un carico di lavoro pre-lancio o un carico di lavoro interno.
-
Scorri l'elenco di controllo ORR e prendi nota di tutti i rilevamenti fatti. I rilevamenti potrebbero non essere validi se è in atto una mitigazione. Aggiungi qualsiasi rilevamento privo di mitigazione al tuo backlog di elementi e implementalo prima del lancio.
-
Continua ad aggiungere le best practice e i requisiti all'elenco di controllo ORR nel corso del tempo.
I clienti di AWS Support con supporto Enterprise possono richiedere il workshop Operational Readiness Review (Revisione sulla prontezza operativa)
Livello di impegno per il piano di implementazione: alto. L'adozione di una procedura ORR nella tua organizzazione richiede la sponsorizzazione dell'esecutivo e l'adesione degli stakeholder. Crea e aggiorna l'elenco di controllo con input provenienti da tutta l'organizzazione.
Risorse
Best practice correlate:
-
OPS01-BP03 Valutazione dei requisiti di governance - I requisiti di governance sono una scelta naturale per un elenco di controllo ORR.
-
OPS01-BP04 Valutazione dei requisiti di conformità - I requisiti di conformità sono talvolta inclusi in un elenco di controllo ORR. Altre volte costituiscono un processo separato.
-
OPS03-BP07 Fornitura di risorse appropriate ai team - La capacità del team è un buon requisito ORR.
-
OPS06-BP01 Preparazione di un piano in caso di esito negativo delle modifiche - Prima di avviare il carico di lavoro, è necessario stabilire un piano di rollback o rollforward.
-
OPS07-BP01 Verifica della capacità del personale - Per supportare un carico di lavoro è necessario disporre del personale necessario.
-
SEC01-BP03 Identificazione e convalida degli obiettivi di controllo - Gli obiettivi di controllo della sicurezza costituiscono eccellenti requisiti ORR.
-
REL13-BP01 Definizione degli obiettivi di ripristino in caso di downtime e perdita di dati - I piani di ripristino di emergenza sono un buon requisito ORR.
-
COST02-BP01 Sviluppo di politiche basate sui requisiti dell'organizzazione - Le policy di gestione dei costi sono utili da includere nell'elenco di controllo ORR.
Documenti correlati:
Video correlati:
Esempi correlati:
Servizi correlati: