Inventario Amazon S3 - Amazon Simple Storage Service

Inventario Amazon S3

Amazon S3 Inventory è uno degli strumenti forniti da Amazon S3 per semplificare la gestione dell'archiviazione. È possibile utilizzarlo per effettuare l'audit e creare report sullo stato di replica e crittografia degli oggetti per attività, conformità ed esigenze normative. Amazon S3 Inventory può anche semplificare e accelerare flussi di lavoro aziendali e processi con Big Data, fornendo un'alternativa pianificata all'operazione API sincrona List in Amazon S3. Amazon S3 Inventory non utilizza l'API List per verificare gli oggetti e non influisce sulla velocità di richiesta del bucket.

Amazon S3 Inventory fornisce file di output con valori separati da virgole (CSV), Apache Optimized Row Columnar (ORC) o Apache Parquet che elencano gli oggetti e i metadati corrispondenti con frequenza giornaliera o settimanale per un bucket S3 o un prefisso condiviso, ovvero oggetti che hanno nomi che iniziano con una stringa comune. Se settimanale, un report viene generato ogni domenica (fuso orario UTC) dopo il report iniziale. Per informazioni sui prezzi di Amazon S3 Inventory, consulta Prezzi di Amazon S3.

È possibile configurare diversi elenchi di inventario per un bucket. È possibile configurare quali metadata degli oggetti includere nell'inventario, se elencare tutte le versioni degli oggetti o solo quelle attuali, dove archiviare l'output dei file dell'elenco di inventario, nonché decidere se generare l'inventario giornalmente o settimanalmente. Inoltre, è possibile specificare che il file dell'elenco di inventario deve essere crittografato.

Puoi eseguire query su Amazon S3 utilizzando SQL standard con Amazon Athena, Amazon Redshift Spectrum e altri strumenti come Presto, Apache Hive, e Apache Spark. Puoi utilizzare Athena per eseguire query sui file di inventario. Puoi utilizzarlo per eseguire query su Amazon S3 Inventory in tutte le Regioni in cui è disponibile Athena.

Bucket di origine e di destinazione

Il bucket per il quale l'inventario elenca gli oggetti è denominato bucket di origine. Il bucket nel quale viene archiviato il file dell'elenco di inventario è denominato bucket di destinazione.

Bucket di origine

L'inventario elenca gli oggetti che sono archiviati nel bucket di origine. È possibile ottenere gli elenchi dell'inventario per un intero bucket o filtrarli mediante prefisso (nome chiave dell'oggetto).

Il bucket di origine:

  • Contiene gli oggetti elencati nell'inventario.

  • Contiene la configurazione per l'inventario.

Bucket di destinazione

I file dell'elenco di Amazon S3 Inventory vengono scritti nel bucket di destinazione. Per raggruppare tutti i file di elenco dell'inventario in un percorso comune del bucket di destinazione, puoi specificare un prefisso di destinazione (nome chiave dell'oggetto) nella configurazione dell'inventario.

Il bucket di destinazione:

  • Contiene gli elenchi dei file dell'inventario.

  • Contiene i file manifest che catalogano tutti i file dell'inventario che sono archiviati nel bucket di destinazione. Per ulteriori informazioni, consulta Manifest inventario.

  • Deve avere una policy del bucket per concedere ad Amazon S3 le autorizzazioni necessarie per verificare la proprietà del bucket e per scrivere file nel bucket.

  • Deve essere nella stessa Regione AWS del bucket di origine.

  • Può coincidere con il bucket di origine.

  • Può essere di proprietà di un Account AWS differente rispetto all'account proprietario del bucket di origine.

Elenco di Amazon S3 Inventory

Un file dell'elenco di inventario contiene un elenco degli oggetti presenti nel bucket di origine e i metadata per ogni oggetto. Gli elenchi dell'inventario sono archiviati nel bucket di destinazione come un file CSV compresso in formato GZIP, come file Apache ORC (Optimized Row Columnar) compresso con ZLIB o come un file Apache Parquet compresso con Snappy. Gli oggetti vengono ordinati in ordine crescente in base ai nomi delle chiavi.

L'elenco d'inventario contiene un elenco degli oggetti presenti in un bucket S3 e i seguenti metadata per ogni oggetto elencato:

  • Bucket Name (Nome bucket): nome del bucket cui è destinato l'inventario.

  • Nome chiave: il nome della chiave dell'oggetto (o chiave) che identifica in modo univoco l'oggetto nel bucket. In caso di utilizzo del formato di file CSV, il nome della chiave è codificato in formato URL e dovrà essere decodificato prima di poterlo utilizzare.

  • ID versione: l'ID versione dell'oggetto. Quando viene attivata la funzione Controllo delle versioni in un bucket, Amazon S3 assegna un numero di versione agli oggetti aggiunti al bucket. Per ulteriori informazioni, consulta Utilizzo della funzione Controllo delle versioni nei bucket S3. (Questo campo non è incluso se l'elenco riguarda unicamente la versione corrente degli oggetti).

  • IsLatest: impostato su True se l'oggetto è la versione corrente dell'oggetto. (Questo campo non è incluso se l'elenco riguarda unicamente la versione corrente degli oggetti).

  • Dimensioni: le dimensioni dell'oggetto in byte.

  • Data dell'ultima modifica: la più recente tra la data di creazione dell'oggetto o la data dell'ultima modifica.

  • ETag: il tag dell'entità è un hash dell'oggetto. L'ETag riflette solo i cambiamenti ai contenuti di un oggetto, non i suoi metadata. Questo ETag può essere o meno un digest MD5 dei dati oggetto. a seconda di come l'oggetto è stato creato e crittografato.

  • Classe di storage: la classe di storage utilizzata per archiviare l'oggetto. Per ulteriori informazioni, consulta Utilizzo delle classi di storage di Amazon S3.

  • Multipart upload flag (Contrassegno di caricamento in più parti): impostato su True se l'oggetto è stato caricato come caricamento in più parti. Per ulteriori informazioni, consulta Caricamento e copia di oggetti utilizzando il caricamento in più parti.

  • Contrassegno di eliminazione: impostato su True se l'oggetto è un contrassegno di eliminazione. Per ulteriori informazioni, consulta Utilizzo della funzione Controllo delle versioni nei bucket S3. (Questo campo viene aggiunto automaticamente al report se questo è stato configurato per comprendere tutte le versioni degli oggetti).

  • Stato della replica: impostare su PENDING, COMPLETED, FAILED oppureREPLICA. Per ulteriori informazioni, consulta Ottenimento delle informazioni sullo stato della replica.

  • Encryption status (Stato di crittografia): impostato su SSE-S3, SSE-C, SSE-KMS o NOT-SSE. Lo stato della crittografia lato server per SSE-S3, SSE-KMS e SSE con chiavi fornite dal cliente (SSE-C). Uno stato di NOT-SSE indica che l'oggetto non è crittografato con crittografia lato server. Per ulteriori informazioni, consulta Protezione dei dati tramite crittografia.

  • Data di fine conservazione del blocco oggetti S3: data fino alla quale l'oggetto bloccato non può essere eliminato. Per ulteriori informazioni, consulta Utilizzo del blocco oggetti S3.

  • Modalità blocco oggetti S3: impostata su Governance o Compliance per gli oggetti bloccati. Per ulteriori informazioni, consulta Utilizzo del blocco oggetti S3.

  • Stato legale blocco oggetti S3: impostato su On se è stato applicato un blocco di carattere legale a un oggetto, altrimenti su un oggetto. Altrimenti il valore è impostato su Off. Per ulteriori informazioni, consulta Utilizzo del blocco oggetti S3.

  • Livello di accesso S3 Intelligent-Tiering: livello di accesso, frequente o raro, dell'oggetto se archiviato in S3 Intelligent-Tiering. Per ulteriori informazioni, consulta Classe di storage per ottimizzare automaticamente i dati con modelli di accesso variabili o sconosciuti.

  • Stato delle chiavi bucket S3: impostare su ENABLED o DISABLED. Indica se l'oggetto utilizza la chiave bucket S3 per la crittografia lato server. Per ulteriori informazioni, consulta Utilizzo di chiavi bucket Amazon S3.

  • Algoritmo di checksum: indica l'algoritmo usato per creare il checksum dell'oggetto.

Consigliamo di creare una policy del ciclo di vita che elimini i vecchi elenchi di inventario. Per ulteriori informazioni, consultare Gestione del ciclo di vita dello storage.

L'autorizzazione s3:PutInventoryConfiguration consente all'utente di selezionare tutti i campi di metadati elencati in precedenza per ogni oggetto durante la configurazione di un elenco inventario e di specificare il bucket di destinazione in cui archiviare l'inventario. Un utente con accesso in lettura agli oggetti nel bucket di destinazione può accedere a tutti i campi di metadati degli oggetti disponibili nell'elenco inventario. Per limitare l'accesso a un report di inventario, consulta Limitazione dell'accesso a un report di Amazon S3 Inventory.

Consistenza dell'inventario

In ogni elenco di inventario potrebbero non comparire tutti gli oggetti. L'elenco inventario fornisce l'eventuale consistenza delle richieste PUT per nuovi oggetti e sovrascritture e delle richieste DELETE. Gli elenchi di inventario sono uno snapshot in sequenza di voci del bucket, che sono a consistenza finale (cioè, l'elenco potrebbe non includere oggetti aggiunti o eliminati di recente).

Per convalidare lo stato dell'oggetto prima di agire sull'oggetto stesso, consigliamo di effettuare una richiesta REST API HEAD Object per recuperare i metadati dell'oggetto o controllare le proprietà dell'oggetto nella console Amazon S3. Inoltre, è possibile controllare i metadati dell'oggetto tramite la AWS CLI o gli SDK AWS. Per ulteriori informazioni, consulta HEAD Object in Amazon Simple Storage Service API Reference (Guida di riferimento per l'API di Amazon Simple Storage Service).

Per ulteriori informazioni sull'utilizzo di Amazon S3 Inventory, consulta gli argomenti riportati di seguito.