Il pilastro dell'eccellenza operativa - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Il pilastro dell'eccellenza operativa

L'eccellenza operativa (OE) rappresenta la dedizione alla creazione di soluzioni software di alta qualità che soddisfino e superino costantemente le aspettative degli utenti. Il pilastro dell'eccellenza operativa del AWS Well-Architected Framework comprende strategie collaudate per un'organizzazione efficace del team, una solida progettazione dei carichi di lavoro, operazioni efficienti su larga scala e un adattamento senza interruzioni ai requisiti in evoluzione nel tempo. Aderendo a questi principi, le organizzazioni possono garantire che i propri sistemi rimangano resilienti, performanti e in linea con le esigenze aziendali in evoluzione.

Aree di interesse principali per l'applicazione di questo pilastro all'ambiente di streaming 2.0: AppStream

  • Monitoraggio e osservabilità

  • Automazione e DevOps

  • Procedure operative e documentazione

  • Support e gestione degli incidenti

Organizza i team in base ai risultati aziendali

Crea un modello operativo allineato al cloud con un forte impegno di leadership, in cui gli obiettivi aziendali e gli indicatori chiave di performance (KPIs) guidano la trasformazione organizzativa attraverso persone, processi e tecnologie ottimizzati.

  • Struttura del team. Crea team dedicati in linea con i risultati dello streaming delle applicazioni. Ad esempio:

    • Il team di gestione delle immagini è responsabile del packaging delle applicazioni e dell'ottimizzazione delle immagini.

    • Il team addetto alle operazioni della flotta gestisce la capacità, le prestazioni e la scalabilità.

    • Il team addetto all'esperienza utente gestisce il supporto e la soddisfazione degli utenti finali.

  • KPIs e metriche. Definisci e monitora metriche allineate al business come:

    • Tassi di disponibilità delle applicazioni

    • È ora di implementare nuove applicazioni

    • Costo per ora di streaming delle applicazioni

  • Modello operativo. Crea processi chiari per:

    • Onboarding e aggiornamenti delle applicazioni

    • Gestione della capacità della flotta

    • Fornitura dell'accesso degli utenti

    • Risposta e risoluzione degli incidenti

Implementa l'osservabilità per ottenere informazioni fruibili

Implementa il monitoraggio e l'osservabilità completi per monitorare e monitorare lo stato del carico di lavoro KPIs . Questo principio consente decisioni basate sui dati e miglioramenti proattivi in termini di prestazioni, affidabilità e costi.

Automatizza in modo sicuro laddove possibile

Applica i principi dell'infrastruttura come codice (IaC) per automatizzare tutti gli aspetti delle operazioni del carico di lavoro. Utilizza i guardrail per garantire un'esecuzione sicura e coerente riducendo al contempo l'intervento manuale.

  • Automatizza la creazione e la configurazione di immagini AppStream 2.0 utilizzando la CLI di Image Assistant. Per ulteriori informazioni, consulta Creare l'immagine Amazon AppStream 2.0 a livello di codice utilizzando le operazioni della CLI di Image Assistant nella documentazione 2.0. AppStream

    • Installazione delle applicazioni: utilizzate la CLI di Image Assistant per automatizzare l'installazione delle applicazioni durante la creazione delle immagini.

    • Creazione di immagini: crea immagini AppStream 2.0 in modo programmatico utilizzando i comandi CLI di Image Assistant.

    • Gestione della configurazione: automatizza la configurazione delle impostazioni predefinite dell'applicazione e dei parametri di avvio.

  • Automatizza la personalizzazione delle immagini 2.0. AppStream Per ulteriori informazioni, consulta il post del AWS blog Creazione automatica di immagini Windows AppStream 2.0 personalizzate.

  • Applica IAc per implementare l'infrastruttura e i componenti dell'applicazione per AppStream 2.0. Per ulteriori informazioni, consulta il post AWS sul blog Automazione dell'infrastruttura e della distribuzione delle applicazioni per Amazon AppStream 2.0 con Terraform.

  • Implementa processi automatizzati per la gestione della flotta, tra cui:

    • Scalabilità della flotta in base alla domanda. Configura politiche di scalabilità automatica per regolare automaticamente la capacità della flotta in base alle metriche di utilizzo. Per ulteriori informazioni, consulta il post del AWS blog AWS Lambda Use to adjust scaling steps and threshold for Amazon 2.0. AppStream

    • Aggiornamenti delle immagini di base. Sfrutta gli aggiornamenti automatici all'immagine di base AppStream 2.0 forniti da AWS.

    • Ottimizzazione della capacità. Imposta soglie di scalabilità automatizzate per ottimizzare l'utilizzo delle risorse in base ai modelli di domanda.

  • Configura i guardrail per automatizzare i controlli di sicurezza:

    • Limiti massimi di dimensione della flotta. Stabilisci limiti massimi alla capacità della flotta per evitare un eccesso di approvvigionamento.

    • Configurazione delle politiche di scalabilità. Implementa politiche di scalabilità per fasi o individua politiche di scalabilità con soglie appropriate.

    • Quote di servizio. Utilizza le quote AWS di servizio come limiti predefiniti per evitare un'allocazione eccessiva delle risorse.

    • Protezione scalabile. Configura la protezione scalabile per impedire la rimozione di istanze attive durante gli eventi di scalabilità.

  • Esegui test e convalide, inclusi test di creazione di immagini, flotta e integrazione.

    • Test di Image Builder:

      • Testa le applicazioni direttamente nell'interfaccia di Image Builder.

      • Verifica l'avvio e la funzionalità dell'applicazione.

      • Verifica le impostazioni e le configurazioni degli utenti.

      • Convalida la compatibilità delle applicazioni.

    • Test della flotta:

      • Prova le sessioni di streaming da diversi dispositivi client.

      • Verifica i diritti e l'accesso degli utenti.

      • Convalida le prestazioni delle applicazioni.

      • Verifica l'esperienza utente per elementi e operazioni come gli appunti, il trasferimento di file e la stampa.

    • Test di integrazione:

      • Prova l'autenticazione basata su Active Directory o SAML 2.0.

      • Prova le cartelle home e lo storage persistente.

      • Verifica i diritti delle applicazioni.

      • Verifica il reindirizzamento dei dispositivi USB (se configurato).

  • Usa il gestore delle applicazioni AppStream 2.0 per automatizzare la creazione e la distribuzione delle applicazioni. Per ulteriori informazioni, consulta il post AWS sul blog Semplifica l'onboarding delle applicazioni con Applications Manager for Amazon 2.0. AppStream

  • Automatizza la distribuzione di nuove versioni delle applicazioni utilizzando pipeline di integrazione continua e distribuzione continua (CI/CD). Per ulteriori informazioni, consulta il post AWS sul blog Screening Eagle: ottimizzazione CI/CD dell'esperienza utente finale in Amazon AppStream 2.0.

Apporta modifiche frequenti, piccole e reversibili

Crea carichi di lavoro scalabili e liberamente accoppiati che consentano implementazioni automatizzate frequenti e su piccola scala con rischi minimi e funzionalità di rollback semplici.

  • Per gli aggiornamenti delle immagini, utilizza la creazione di immagini con versioni e gli aggiornamenti incrementali.

    • Creazione di immagini con versioni:

      • Crea nuove immagini per ogni set di modifiche utilizzando un generatore di immagini.

      • Mantieni più versioni di immagini per supportare gli scenari di rollback.

      • Utilizza strategie di AWS tagging per tenere traccia delle versioni e degli attributi delle immagini.

    • Aggiornamenti incrementali:

      • Apporta piccole modifiche incrementali alle applicazioni o alle configurazioni.

      • Prova a fondo gli aggiornamenti nel generatore di immagini prima di creare una nuova immagine.

      • Documenta tutte le modifiche apportate in ogni nuova versione dell'immagine.

  • Per gli aggiornamenti della flotta di controllo:

    • Crea nuove flotte con immagini aggiornate per i test.

    • Modifica gli attributi della flotta esistente senza interrompere le sessioni attive.

  • Stabilisci procedure di gestione delle modifiche per la documentazione, i protocolli di test, i flussi di lavoro di approvazione e i processi di monitoraggio.

    • Documentazione:

      • Conserva registri delle modifiche dettagliati per tutti gli aggiornamenti delle immagini e del parco macchine.

      • Documenta le procedure e i risultati dei test per ogni modifica.

      • Utilizzato AWS CloudTrailper tenere traccia e verificare le modifiche alla configurazione.

    • Protocolli di test:

      • Stabilisci un processo di test completo per tutte le modifiche.

      • Includi test di funzionalità, prestazioni e esperienza utente delle applicazioni.

      • Eseguite dei test nel generatore di immagini prima di creare nuove immagini.

      • Eseguite test aggiuntivi sulle flotte non di produzione prima della distribuzione completa.

    • Flussi di lavoro di approvazione:

      • Implementa un processo di approvazione per le modifiche agli ambienti di produzione.

      • Definisci i criteri per le modifiche che richiedono l'approvazione rispetto agli aggiornamenti standard.

      • Stabilisci ruoli e responsabilità per l'approvazione delle modifiche.

    • Monitoraggio e convalida:

      • Usa Amazon CloudWatch per monitorare le prestazioni della flotta e delle applicazioni dopo le modifiche.

      • Imposta avvisi per le metriche chiave per identificare rapidamente i problemi dopo gli aggiornamenti.

      • Conduci revisioni successive all'implementazione per convalidare il successo delle modifiche e raccogliere informazioni.

Perfezionate frequentemente le procedure operative

Migliora continuamente le procedure operative attraverso revisioni, aggiornamenti e coinvolgimento del team regolari per mantenere tutte le parti interessate informate e allineate alle migliori pratiche.

  • Gestione della documentazione. Conserva la documentazione aggiornata e con controllo di versione delle procedure AppStream 2.0 in una posizione centrale per garantire la coerenza operativa e la condivisione delle conoscenze tra i team.

    • Documentazione richiesta: Conserva la up-to-date documentazione per le operazioni AppStream 2.0 critiche per la creazione e la gestione delle immagini, le operazioni del parco veicoli e la risoluzione dei problemi.

    • Revisioni operative: monitora e rivedi gli aspetti operativi chiave, tra cui le metriche delle prestazioni e la gestione degli incidenti.

  • Miglioramento continuo. Migliora sistematicamente le operazioni AppStream 2.0 incorporando Servizio AWS aggiornamenti, metriche operative e best practice acquisite nelle procedure standard.

    • Aggiornamenti del servizio: monitora le note di rilascio AppStream 2.0 per individuare nuove funzionalità, miglioramenti del servizio, aggiornamenti di sicurezza e disponibilità regionale.

    • Procedure ottimali: rivedi e incorpora gli aggiornamenti di AWS Well-Architected Framework, le best practice AWS 2.0 AppStream , le architetture di riferimento e i consigli di sicurezza. AWS

    • Gestione della conoscenza: gestione e aggiornamento delle procedure operative standard, dei runbook, delle guide alla risoluzione dei problemi e della documentazione di supporto agli utenti.

Anticipa il fallimento

Esegui regolarmente test sugli scenari di fallimento per comprendere i rischi, convalidare le procedure di risposta e migliorare la preparazione del team alla gestione di incidenti reali.

  • Test di fallimento. Simula e verifica regolarmente errori come l'esaurimento della capacità della flotta, gli errori di avvio delle applicazioni e i problemi di connettività di rete.

    • Esaurimento della capacità della flotta:

      • Monitora e testa il comportamento di scalabilità della flotta quando si avvicinano i limiti di capacità.

      • Configura CloudWatch allarmi e metriche. CapacityUtilization AvailableCapacity

      • Implementa procedure per gestire i vincoli di capacità durante i picchi di utilizzo.

    • Errori di avvio delle applicazioni:

      • Verifica il comportamento di avvio delle applicazioni su istanze di streaming.

      • Convalida l'accesso e le prestazioni delle applicazioni in diverse configurazioni del parco veicoli.

    • Problemi di connettività di rete:

      • Verifica le prestazioni della sessione di streaming in diverse condizioni di rete.

      • Monitora StreamingSessionLatency i problemi di qualità della connessione.

      • Garantisci la corretta configurazione delle impostazioni VPC e dei gruppi di sicurezza.

  • Procedure di ripristino. Sviluppare e testare procedure per:

    • Failover della flotta tra AWS Zone di disponibilità. Inoltre, documenta le procedure per scalare la capacità della flotta, gestire gli aggiornamenti della flotta e rispondere ai problemi di salute delle istanze.

    • Gestione dei dati degli utenti:

      • Configura e testa le soluzioni di persistenza e archiviazione delle impostazioni delle applicazioni per le cartelle home in Amazon Simple Storage Service (Amazon S3) per flotte Windows e file system condivisi nelle flotte Amazon Elastic File System (Amazon EFS) per Linux.

      • Convalida la sincronizzazione dei dati tra le sessioni.

    • Continuità del servizio. Mantieni le procedure per la creazione di nuove istanze del parco istanze, la gestione degli aggiornamenti delle immagini e la gestione delle disconnessioni delle sessioni.

  • Gestione del rischio. Identifica e mitiga:

    • Limiti di capacità impostando la capacità minima appropriata del parco veicoli, configurando politiche di scalabilità automatica basate sui modelli di domanda e monitorando le tendenze di utilizzo della flotta utilizzando CloudWatch metriche come, e. CapacityUtilization InUseCapacity AvailableCapacity

    • Rallentamenti delle prestazioni grazie al monitoraggio di metriche chiave come e alla configurazione degli allarmi appropriati. StreamingSessionLatency CloudWatch

Impara da tutti gli eventi e le metriche operative

Promuovi una cultura del miglioramento continuo condividendo le lezioni apprese dagli eventi e dai fallimenti operativi in tutta l'organizzazione. Sottolinea il loro impatto sui risultati aziendali.

  • Analisi degli eventi. Documenta e analizza le interruzioni del servizio, il degrado delle prestazioni, i reclami degli utenti e i problemi di capacità.

  • Revisione delle metriche. Analizza regolarmente i modelli di utilizzo, le tendenze delle prestazioni, le metriche dei costi e i dati sulla soddisfazione degli utenti.

  • Condivisione delle conoscenze. Stabilisci processi per sessioni di apprendimento in team, documentazione sulle migliori pratiche, trasferimento di conoscenze tra team e retrospettive sugli incidenti.

Utilizza servizi gestiti

Riduci al minimo il sovraccarico operativo utilizzando servizi AWS gestiti e sviluppando procedure standardizzate sulla base di essi. Effettua l'integrazione con i seguenti servizi AWS gestiti: