PERF03-BP01 Identificazione delle caratteristiche e dei requisiti di archiviazione - Framework AWS Well-Architected

PERF03-BP01 Identificazione delle caratteristiche e dei requisiti di archiviazione

Identifica e documenta i requisiti di archiviazione dei carichi di lavoro e definisci le caratteristiche di archiviazione di ciascuna posizione. Le caratteristiche di archiviazione includono, ad esempio, accesso condivisibile, dimensioni dei file, tasso di crescita, velocità di trasmissione effettiva, IOPS, latenza, schemi di accesso e persistenza dei dati. Utilizza queste caratteristiche per valutare se i servizi di archiviazione di blocchi, file, oggetti o istanze rappresentano la soluzione più efficiente per gli specifici requisiti di archiviazione.

Risultato desiderato: individua e documenta i requisiti di archiviazione e valuta le soluzioni di archiviazione disponibili. In base alle caratteristiche di archiviazione chiave, il team saprà valutare in che modo i servizi di archiviazione selezionati ottimizzeranno le prestazioni dei carichi di lavoro. I criteri chiave includono gli schemi di accesso ai dati, il tasso di crescita, i requisiti di dimensionamento e i requisiti di latenza.

Anti-pattern comuni:

  • Utilizzi un unico tipo di archiviazione, ad esempio Amazon Elastic Block Store (Amazon EBS), per tutti i carichi di lavoro.

  • Ritieni che tutti i carichi di lavoro abbiano requisiti di prestazioni di accesso allo storage simili.

Vantaggi dell'adozione di questa best practice: la selezione della soluzione di archiviazione in base alle caratteristiche individuate e richieste contribuirà a migliorare le prestazioni dei carichi di lavoro, ridurre i costi e limitare lo sforzo operativo necessario alla gestione del carico di lavoro. Le prestazioni dei carichi di lavoro trarranno benefici dalla soluzione, configurazione e posizione del servizio di archiviazione.

Livello di rischio associato se questa best practice non fosse adottata: alto

Guida all'implementazione

Identifica i parametri delle prestazioni di storage più importanti del carico di lavoro e implementa i miglioramenti come parte di un approccio basato sui dati, ricorrendo a benchmark o test di carico. Utilizza tali dati per identificare i punti in cui la soluzione di storage è vincolante ed esamina le opzioni di configurazione per migliorare la soluzione. Determina il tasso di crescita previsto per il carico di lavoro e scegli una soluzione di storage che soddisfi tali percentuali. Cerca le offerte di archiviazione AWS per determinare la soluzione di archiviazione più adatta per i vari requisiti a livello di carichi di lavoro. Il provisioning delle soluzioni di archiviazione in AWS aumenta le opportunità che hai di verificare le offerte di archiviazione e verificare se sono in linea con i requisiti dei carichi di lavoro.

Servizio AWS Caratteristiche chiave Casi d'uso comuni
Amazon S3

Durabilità del 99,999999999%, crescita illimitata, accessibilità indipendente dalla posizione, svariati modelli di costi basati su accesso e resilienza

Dati applicativi nativi del cloud, archiviazione e backup dei dati, analisi, data lake, hosting di siti web statici, dati IoT

Amazon S3 Glacier

Latenza da secondi a ore, crescita illimitata, costi più bassi, archiviazione a lungo termine

Archiviazione dei dati, archivi di file multimediali, conservazione a lungo termine dei backup.

Amazon EBS Le dimensioni di archiviazione richiedono la gestione e il monitoraggio, una bassa latenza, l'archiviazione persistente, una durabilità dal 99,8% al 99,9%; la maggior parte dei tipi di volume è accessibile solo da un'istanza EC2.

Applicazioni COTS, applicazioni ad alta intensità di I/O, database relazionali e NoSQL, backup e ripristino

Archivio dell'istanza EC2

Dimensioni di archiviazione predefinite, latenza minima, non persistente, accessibile solo da un'istanza EC2

Applicazioni COTS, applicazioni ad alta intensità di I/O, datastore in memoria

Amazon EFS

Durabilità del 99,999999999%, crescita illimitata, accessibile da più servizi di calcolo

Applicazioni moderne che condividono file tra servizi di calcolo, archiviazione di file per il dimensionamento dei sistemi di gestione dei contenuti

Amazon FSx

Supporta 4 file system (NetApp, OpenZFS, Windows File Server e Amazon FSx for Lustre), archiviazione disponibile in base al file system specifico, accessibile da più servizi di calcolo

Carichi di lavoro nativi del cloud, espansione del cloud privato, carichi di lavoro migrati che richiedono un file system specifico, VMC, sistemi ERP, archiviazione e backup di file on-premise

AWS Snow Family

Dispositivi portatili, crittografia a 256 bit, endpoint NFS, calcolo su scheda, TB di archiviazione

Migrazione dei dati nel cloud, archiviazione, calcolo in condizioni on-premise estreme, ripristino di emergenza, raccolta di dati remoti

AWS Storage Gateway

Fornisce accesso on-premise a bassa latenza all'archiviazione supportata dal cloud, cache on-premise completamente gestita

Migrazioni di dati on-premise nel cloud, popolamento dei data lake nel cloud da origini on-premise, condivisione avanzata dei file

Passaggi dell'implementazione:

  1. Utilizza test di benchmarking o caricamento per raccogliere le caratteristiche chiave dei requisiti di archiviazione. Le caratteristiche chiave includono:

    1. Condivisibilità (quali componenti accedono a questo tipo di archiviazione)

    2. Tasso di crescita

    3. Throughput

    4. Latenza

    5. Dimensione I/O

    6. Durabilità

    7. Schemi di accesso (letture/scritture, frequenza, con picchi o costante)

  2. Individua il tipo di soluzione di archiviazione che supporta le caratteristiche di archiviazione desiderate.

    1. Amazon S3 è un servizio di archiviazione di oggetti con scalabilità illimitata, elevata disponibilità e più opzioni di accessibilità. Il trasferimento di oggetto e l'accesso a oggetti in Amazon S3 possono utilizzare un servizio, ad esempio Transfer Acceleration oppure Access Points , per supportare la posizione, i requisiti di sicurezza e gli schemi di accesso. Utilizza le linee guida relative alle prestazioni di Amazon S3 per ottimizzare la configurazione di Amazon S3 e garantire la conformità ai requisiti relativi alle prestazioni dei carichi di lavoro.

    2. Amazon S3 Glacier è una classe di archiviazione di Amazon S3 creata per l'archiviazione dei dati. Puoi scegliere tra tre diverse soluzioni di archiviazione, a partire da un accesso in millisecondi a un accesso di 5-12 ore con opzioni di costi e sicurezza diverse. Amazon S3 Glacier ti consente di rispettare i requisiti relativi alle prestazioni mediante l'implementazione di un ciclo di vita dei dati che supporta i requisiti aziendali e le caratteristiche dei dati.

    3. Amazon Elastic Block Store (Amazon EBS) è un servizio di archiviazione a blocchi a elevate prestazioni progettato per Amazon Elastic Compute Cloud (Amazon EC2). Puoi scegliere tra soluzioni basate su SSD o HDD con caratteristiche diverse che danno priorità agli IOPS oppure alla velocità di trasmissione effettiva. I volumi EBS sono adatti per carichi di lavoro a prestazioni elevate, archiviazione principale per file system, database o applicazioni che possono accedere solo a sistemi di staging collegati.

    4. L'archivio dell'istanza Amazon EC2 è simile ad Amazon EBS in quanto si collega a un'istanza Amazon EC2. Tuttavia, l'archivio dell'istanza è solo un'archiviazione temporanea che deve essere idealmente utilizzata come buffer, cache o altro contenuto temporaneo. Non è possibile scollegare un archivio dell'istanza in quanto tutti i dati andranno perduti in caso di arresto dell'istanza stessa. Gli archivi dell'istanza possono essere utilizzati per casi d'uso basati su prestazioni di I/O elevate e bassa latenza, in cui i dati non devono essere persistenti.

    5. Amazon Elastic File System (Amazon EFS) è un file system montabile a cui possono accedere più tipi di soluzioni di calcolo. Amazon EFS aumenta o riduce automaticamente lo spazio di archiviazione, mentre le relative prestazioni sono ottimizzate in modo da offrire costantemente latenze basse. EFS dispone di due modalità di configurazione delle prestazioni, ovveroGeneral Purpose (Uso generico) e Max I/O (I/O max). La modalità General Purpose (Uso generico) è caratterizzata da una latenza di lettura con valori inferiori a millisecondi e da una latenza di scrittura con valori nell'ordine di millisecondi a una cifra. La funzionalità Max I/O (I/O max) può supportare migliaia di istanze di calcolo che richiedono un file system condiviso. Amazon EFS supporta due modalità di velocità di trasmissione effettiva, ovveroBursting (Espansione) e Provisioned (Allocato). Un carico di lavoro caratterizzato da uno schema di accesso a picchi trarrà vantaggio dalla modalità Bursting (Espansione), mentre un carico di lavoro costantemente elevato sarà più performante con la modalità Provisioned (Allocato).

    6. Amazon FSx è stato sviluppato con le più recenti soluzioni di calcolo AWS per supportare i 4 file system più comunemente utilizzati: NetApp ONTAP, OpenZFS, Windows File Server e Lustre. Relativamente ad Amazon FSx , la latenza, la velocità di trasmissione effettiva e le operazioni di input/output al secondo (IOPS) variano a seconda del file system; è necessario considerare attentamente questi elementi quando si deve selezionare il file system in modo conforme ai requisiti dei carichi di lavoro.

    7. AWS Snow Family sono dispositivi di archiviazione e calcolo che supportano la migrazione di dati online e offline nel cloud, nonché l'archiviazione e il calcolo dei dati on-premise. I dispositivi AWS Snow supportano la raccolta e l'elaborazione di grandi quantità di dati on-premise, nonché il loro spostamento nel cloud. Sono disponibili numerose best practice documentate sulle prestazioni relative a numero, dimensioni e compressione dei file.

    8. AWS Storage Gateway fornisce alle applicazioni on-premise l'accesso all'archiviazione basata sul cloud. AWS Storage Gateway supporta più servizi di archiviazione cloud, tra cui Amazon S3, Amazon S3 Glacier, Amazon FSx e Amazon EBS. Supporta più protocolli, ad esempio iSCSI, SMB e NFS. Fornisce prestazioni a bassa latenza mediante la memorizzazione nella cache dei dati on-premise con accesso frequente e invia solo i dati modificati e compressi ad AWS.

  3. Dopo aver sperimentato la nuova soluzione di archiviazione e avere individuato la configurazione ottimale, pianifica la migrazione e convalida i parametri prestazionali. Questo sarà un processo continuativo, che dovrà essere riesaminato al variare delle caratteristiche chiave o delle opzioni o dei servizi disponibili.

Livello di impegno per il piano di implementazione: in caso di spostamento del carico di lavoro da una soluzione di archiviazione a un'altra, può essere richiesto un moderato livello di impegno per riprogettare l'applicazione.  

Risorse

Documenti correlati:

Video correlati:

Esempi correlati: