Analisi di Amazon S3 – Analisi della classe di storage - Amazon Simple Storage Service

Analisi di Amazon S3 – Analisi della classe di storage

Lo strumento per l'analisi della classe di storage Amazon S3 Analytics consente di analizzare gli schemi di accesso allo storage per stabilire quando eseguire la transizione dei dati corretti alla classe di storage appropriata. Questa nuova funzionalità di analisi di Amazon S3 osserva gli schemi di accesso ai dati per determinare quando è opportuno spostare i dati meno utilizzati dallo storage STANDARD alla classe di storage STANDARD_IA (ad accesso infrequente). Per ulteriori informazioni sulle classi di storage, consulta Utilizzo delle classi di storage di Amazon S3.

Dopo l'osservazione degli schemi di accesso poco frequenti a un set di dati filtrati in un certo periodo di tempo da parte dell'analisi della classe di storage, i risultati dell'analisi possono essere utilizzati per migliorare le policy del ciclo di vita. È possibile configurare l'analisi della classe di storage per tutti gli oggetti di un bucket, oppure si possono configurare filtri per raggruppare gli oggetti per l'analisi in base a un prefisso condiviso (ossia, oggetti i cui nomi iniziano con una stringa comune), ai tag dell'oggetto o a entrambe le opzioni. Con ogni probabilità, l'applicazione di filtri in base ai gruppi di oggetti si rivelerà la soluzione più vantaggiosa per l'analisi della classe di archiviazione.

Importante

L'analisi della classe di archiviazione fornisce solo suggerimenti per le classi da standard a standard (accesso infrequente).

La funzionalità di analisi della classe di archiviazione consente di attivare più filtri per bucket (fino a 1.000) e di ricevere un'analisi separata per ogni filtro. Le configurazioni a più filtri permettono di analizzare gruppi specifici di oggetti, al fine di migliorare le policy del ciclo di vita che trasferiscono gli oggetti alla classe STANDARD_IA.

L'analisi della classe di storage fornisce nella console Amazon S3 le visualizzazioni relative l'utilizzo dello storage aggiornate quotidianamente. È anche possibile esportare questi dati di utilizzo giornaliero in un bucket S3 e visualizzarli in un'applicazione per fogli di calcolo o con strumenti di Business Intelligence, come Amazon QuickSight.

Ci sono costi associati all'analisi della classe di archiviazione. Per informazioni sui prezzi, consulta Gestione e replica Prezzi di Amazon S3.

Come impostare l'analisi della classe di storage

È possibile impostare l'analisi della classe di storage configurando i dati degli oggetti da analizzare. A seconda della configurazione, l'analisi della classe di storage può:

  • Analizzare l'intero contenuto di un bucket.

    Verrà generata un'analisi per tutti gli oggetti del bucket.

  • Analizzare gli oggetti raggruppati in base al prefisso e ai tag.

    Si possono configurare filtri che raggruppano gli oggetti per l'analisi in base a un prefisso, ai tag dell'oggetto o a una combinazione di entrambe le opzioni. Viene generata un'analisi separata per ogni filtro configurato. È possibile definire più configurazioni di filtri per ciascun bucket (fino a 1.000).

  • Esportare i dati dell'analisi.

    Quando si configura l'analisi della classe di storage per un bucket o un filtro, si può scegliere di far esportare ogni giorno i relativi dati in un file. L'analisi del giorno corrente viene aggiunta al file per formare un registro storico dell'analisi per il filtro configurato. Il file viene aggiornato quotidianamente nella destinazione selezionata. Al momento della selezione dei dati da esportare, si specifica un bucket di destinazione e un prefisso di destinazione (facoltativo) dove scrivere il file.

Per configurare l'analisi della classe di archiviazione puoi utilizzare la console Amazon S3, l'API REST oppure la AWS CLI o gli SDK AWS.

Come utilizzare l'analisi della classe di storage

L'analisi della classe di storage consente di osservare gli schemi di accesso ai dati nel tempo e raccogliere così informazioni utili per migliorare la gestione del ciclo di vita dello storage STANDARD_IA. Dopo aver configurato un filtro, entro 24 o 48 ore nella console Amazon S3 inizierà a essere disponibile l'analisi dei dati basata sul filtro. Tuttavia, prima di fornire un risultato, la funzionalità continuerà a osservare gli schemi di accesso a un insieme di dati filtrati per almeno 30 giorni, al fine di raccogliere le informazioni necessarie. Dopo i primi risultati, l'analisi resta in esecuzione e aggiorna il risultato via via che gli schemi di accesso cambiano.

Quando configuri un filtro per la prima volta, alla console Amazon S3 potrebbe occorrere qualche istante per analizzare i tuoi dati.

L'analisi della classe di archiviazione continua a osservare gli schemi di accesso a un insieme di dati di oggetti filtrati per almeno 30 giorni, al fine di raccogliere informazioni sufficienti. Una volta raccolte informazioni a sufficienza, nella console Amazon S3 verrà visualizzato un messaggio di analisi completata.

Durante l'analisi degli oggetti ad accesso infrequente, l'analisi della classe di storage prende in considerazione un insieme filtrato di oggetti raggruppati in base al tempo trascorso dal loro caricamento su Amazon S3. e determina se l'accesso al gruppo di età è infrequente valutando i fattori seguenti per l'insieme di dati filtrati:

  • Oggetti nella classe di storage STANDARD più grandi di 128 KB.

  • Volume medio di storage totale per gruppo di età

  • Numero medio di byte trasferiti in uscita (non la frequenza) per gruppo di età.

  • I dati dell'esportazione analitica includono solo le richieste con dati pertinenti per l'analisi della classe di storage. Per questo motivo il numero di richieste, nonché il totale dei byte per caricamenti e richieste, potrebbe variare rispetto a quanto riportato nei parametri dello storage o tracciato dai sistemi interni dell'utente

  • Benché non siano conteggiate nell'analisi, le richieste GET e PUT non andate a buon fine sono incluse nei parametri dello storage.

Volume di storage recuperato

I grafici della console Amazon S3 mostrano il volume di storage dei dati filtrati che è stato recuperato nel periodo di osservazione.

Percentuale di storage recuperata

I grafici della console Amazon S3 mostrano anche la percentuale di storage dei dati filtrati che è stata recuperata nel periodo di osservazione.

Come indicato più in alto in questo argomento, durante l'analisi degli oggetti ad accesso infrequente, l'analisi della classe di storage prende in considerazione un insieme filtrato di oggetti raggruppati in base al tempo trascorso dal loro caricamento su Amazon S3. L'analisi della classe di storage utilizza questi gruppi predefiniti di età degli oggetti:

  • Oggetti Amazon S3 con meno di 15 giorni

  • Oggetti Amazon S3 con 15-29 giorni

  • Oggetti Amazon S3 con 30-44 giorni

  • Oggetti Amazon S3 con 45-59 giorni

  • Oggetti Amazon S3 con 60-74 giorni

  • Oggetti Amazon S3 con 75-89 giorni

  • Oggetti Amazon S3 con 90-119 giorni

  • Oggetti Amazon S3 con 120-149 giorni

  • Oggetti Amazon S3 con 150-179 giorni

  • Oggetti Amazon S3 con 180-364 giorni

  • Oggetti Amazon S3 con 365-729 giorni

  • Oggetti Amazon S3 con almeno 730 giorni

In genere servono circa 30 giorni di osservazione degli schemi di accesso per raccogliere informazioni sufficienti a generare un risultato dell'analisi. Potrebbero anche essere necessari più di 30 giorni, a seconda dei singoli schemi di accesso ai dati. Tuttavia, dopo aver configurato un filtro, entro 24 o 48 ore nella console Amazon S3 inizierà a essere disponibile l'analisi dei dati basata sul filtro. Nella console Amazon S3 è possibile visualizzare l'analisi giornaliera dell'accesso agli oggetti suddivisa per gruppo di età degli oggetti.

Volume di storage ad accesso infrequente

La console Amazon S3 mostra i modelli di accesso raggruppati in base ai gruppi di età degli oggetti predefiniti. Il testo visualizzato Frequently accessed (Accesso frequente) o Infrequently accessed (Accesso poco frequente) è inteso come un aiuto visivo per aiutarti nel processo di creazione del ciclo di vita.

Come esportare i dati relativi all'analisi della classe di storage

Si può scegliere di far esportare i report dell'analisi della classe di storage in un file flat in formato CSV. I report sono aggiornati quotidianamente e si basano sui filtri configurati per i gruppi di età degli oggetti. Utilizzando la console Amazon S3, al momento di creare un filtro si può scegliere l'opzione di esportazione del report. Al momento della selezione dei dati da esportare, si specifica un bucket di destinazione e un prefisso di destinazione (facoltativo) dove scrivere il file. I dati possono essere esportati in un bucket di destinazione in un account diverso. ma il bucket di destinazione deve trovarsi nella stessa regione del bucket configurato per l'analisi.

È necessario creare una policy di bucket sul bucket di destinazione al fine di assegnare ad Amazon S3 le autorizzazioni per verificare quale Account AWS possiede il bucket e per scrivere gli oggetti nel bucket nel percorso definito. Per un esempio di policy, consulta Concessione delle autorizzazioni per l'Inventario Amazon S3 e le analisi dei dati di Amazon S3.

Una volta configurati, i report dell'analisi della classe di storage esportati iniziano a essere disponibili dopo 24 ore. Successivamente Amazon S3 continua a monitorare e generare esportazioni quotidiane.

Il file CSV può essere aperto in un foglio elettronico o importato in altre applicazioni come Amazon QuickSight. Per informazioni sull'utilizzo dei file Amazon S3 con Amazon QuickSight, consulta Creazione di un set di dati mediante file Amazon S3 nella Guida per l'utente di Amazon QuickSight.

Nel file esportato, i dati sono ordinati per data nell'ambito del gruppo di età degli oggetti, come nell'esempio seguente. Se la classe di storage è STANDARD, la riga contiene anche i dati per le colonne ObjectAgeForSIATransition e RecommendedObjectAgeForSIATransition.


        Screenshot.

Alla fine del report, il gruppo di età degli oggetti restituito è ALL (Tutti). Le righe ALL contengono i totali cumulativi, inclusi gli oggetti inferiori a 128 KB, per tutti i gruppi di età per quel dato giorno.


        Screenshot.

La sezione successiva descrive le colonne utilizzate nel report.

Layout del file esportato

Nella seguente tabella è descritto il layout del file esportato.

Utilizzare le barre di scorrimento per visualizzare il resto della tabella.

Layout del file esportato dall'analisi della classe di storage Amazon S3
Nome colonna Dimensione/parametro DataType Descrizione
Data Dimensione Stringa Data di elaborazione del record. Il formato è MM-GG-AAAA.
ConfigId Dimensione Stringa

Valore immesso come nome del filtro all'aggiunta della configurazione del filtro.

Filter Dimensione Stringa

Valori completi del filtro definiti all'aggiunta della configurazione del filtro.

StorageClass Dimensione Stringa

Classe di storage dei dati.

ObjectAge Dimensione Stringa

Gruppo di età degli oggetti in un filtro. Oltre ai 12 diversi gruppi di età (0-14 giorni, 15-29 giorni, 30-44 giorni, 45-59 giorni, 60-74 giorni, 75-89 giorni, 90-119 giorni, 120-149 giorni, 150-179 giorni, 180-364 giorni, 365-729 giorni, oltre 730 giorni) per gli oggetti più grandi di 128 KB è presente un ulteriore valore = "ALL", che rappresenta tutti i gruppi di età.

ObjectCount Parametro Integer

Numero totale di oggetti conteggiati al giorno per classe di archiviazione. Questo valore è riempito solo per AgeGroup='ALL' e mostra il conteggio totale degli oggetti al giorno per tutti i gruppi di età.

DataUploaded_MB Parametro Numero

Dati totali in MB caricati al giorno per classe di archiviazione. Questo valore è riempito solo per AgeGroup='ALL' e mostra il caricamento totale in MB per tutti i gruppi di età al giorno. (L'attività relativa ai caricamenti di oggetti in più parti non è inclusa nei dati esportati perché attualmente non sono previste informazioni sulla classe di archiviazione per le richieste di caricamenti in più parti).

Storage_MB Parametro Numero

Volume totale di storage in MB nel giorno per classe di storage nel gruppo di età. Per l'elemento AgeGroup='ALL', il valore è il volume totale complessivo in MB nel giorno per tutti i gruppi di età.

DataRetrieved_MB Parametro Numero

Dati trasferiti in uscita in MB con richieste GET per classe di storage per il giorno nel gruppo di età. Per l'elemento AgeGroup='ALL', il valore è il volume complessivo in MB dei dati trasferiti in uscita con richieste GET per il giorno per tutti i gruppi di età.

GetRequestCount Parametro Integer

Numero di richieste GET e PUT inviate nel corso del giorno per la classe di archiviazione nel gruppo di età. Per l'elemento AgeGroup='ALL', il valore rappresenta il conteggio complessivo di richieste GET e PUT nel giorno per tutti i gruppi di età.

Nota

La colonna GetRequestCount è erroneamente etichettata e include anche il numero di richieste PUT effettuate per classe di archiviazione.

CumulativeAccessRatio Parametro Numero

Rapporto di accesso cumulativo. Questo rapporto viene utilizzato per rappresentare la frequenza di utilizzo/byte in un dato gruppo di età al fine di stabilire la sua idoneità al trasferimento alla classe STANDARD_IA.

ObjectAgeForSIATransition Parametro Numero intero in giorni

Valore previsto solo per l'elemento AgeGroup=’ALL’ e la classe di storage = STANDARD. Rappresenta l'età osservata per il trasferimento alla classe STANDARD_IA.

RecommendedObjectAgeForSIATransition Parametro Numero intero in giorni

Valore previsto solo per l'elemento AgeGroup=’ALL’ e la classe di storage = STANDARD. Indica in giorni l'età dell'oggetto da considerare per il trasferimento alla classe STANDARD_IA dopo la stabilizzazione dell'elemento ObjectAgeForSIATransition.