Lavorare con le tabelle Apache Iceberg utilizzando Amazon Data Firehose

Amazon Data Firehose è un servizio serverless e senza codice per la distribuzione di flussi di dati da oltre 20 fonti come log, Amazon Logs AWS WAF , Amazon CloudWatch Kinesis Data AWS IoT Streams e Amazon Managed Streaming for Apache Kafka (Amazon MSK) in destinazioni come Amazon S3, Amazon Redshift, Snowflake, e Splunk.

Puoi usare Firehose per distribuire direttamente i dati di streaming alle tabelle Apache Iceberg in Amazon S3. Utilizzando Firehose, è possibile indirizzare i record da un singolo flusso a diverse tabelle Apache Iceberg e applicare automaticamente le operazioni di inserimento, aggiornamento ed eliminazione ai record nelle tabelle. Firehose garantisce una consegna esatta una volta ai tavoli Iceberg. Questa funzionalità richiede l'utilizzo di. AWS Glue Data Catalog

Firehose può anche fornire direttamente dati in streaming alle tabelle Amazon S3. Queste tabelle forniscono uno storage ottimizzato per carichi di lavoro di analisi su larga scala e includono funzionalità che migliorano continuamente le prestazioni delle query e riducono i costi di archiviazione per i dati tabulari.

Per informazioni su come configurare un flusso Firehose per fornire dati alle tabelle Apache Iceberg, consulta Configurare il flusso Firehose nella documentazione di Firehose o il post del blog Trasmettere dati in tempo reale nelle tabelle Apache Iceberg in Amazon S3 usando Amazon Data Firehose.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Lavorare con le tabelle Iceberg utilizzando Spark

Lavorare con le tabelle Iceberg utilizzando Athena SQL