Principi di progettazione - Principio dell'eccellenza operativa

Principi di progettazione

Esistono cinque principi di progettazione per l'eccellenza operativa nel cloud:

  • Esegui le operazioni come codice: Nel cloud ti è possibile applicare la medesima disciplina di progettazione che utilizzi per il codice dell'applicazione a tutto il tuo ambiente. Puoi definire l'intero carico di lavoro (applicazioni, infrastruttura ecc.) come codice e aggiornarlo con il codice. Puoi creare script per le procedure operative e automatizzarne l'esecuzione attivandole in risposta a eventi. Eseguendo le operazioni come codice, limiti gli errori umani e attivi risposte coerenti agli eventi.

  • Applica modifiche frequenti, minime e reversibili: Progetta carichi di lavoro che consentano l'aggiornamento regolare dei componenti per aumentare il flusso di modifiche vantaggiose nel carico di lavoro. Apporta modifiche in piccoli incrementi, che possono essere invertite se non sono in grado di contribuire a identificare e risolvere i problemi introdotti nell'ambiente (senza influire sui clienti, quando possibile).

  • Perfeziona frequentemente le procedure operative: Se usi procedure operative, cerca delle opportunità per migliorarle. Man mano che il tuo carico di lavoro si evolve, garantisci anche l'evoluzione adeguata delle tue procedure. Organizza delle simulazioni regolari per verificare e accertarti che tutte le procedure siano efficaci e che i team le conoscano adeguatamente.

  • Prevedi gli insuccessi: Esegui un'analisi prefallimentare per individuare le potenziali cause di errore in modo da eliminarle o mitigarle. Testa gli scenari di errore e convalida la tua comprensione relativamente al loro impatto. Testa le tue procedure di risposta per assicurarti che siano efficaci e che i team ne conoscano l'esecuzione. Organizza regolarmente game day per testare i carichi di lavoro e le risposte dei team agli eventi simulati.

  • Impara da tutti gli insuccessi operativi: Favorisci il miglioramento tramite le lezioni apprese da tutti gli eventi e gli errori operativi. Condividi ciò che hai imparato con i vari team e con tutta l'organizzazione.