Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Lavorare con le tabelle Apache Iceberg utilizzando Amazon Data Firehose
Amazon Data Firehose è un servizio serverless e senza codice per la distribuzione di flussi di dati da oltre 20 fonti come log, Amazon Logs AWS WAF , Amazon CloudWatch Kinesis Data AWS IoT Streams e Amazon Managed Streaming for Apache Kafka (Amazon MSK) in destinazioni come Amazon S3, Amazon Redshift, Snowflake, e Splunk.
Puoi usare Firehose per distribuire direttamente i dati di streaming alle tabelle Apache Iceberg in Amazon S3. Utilizzando Firehose, è possibile indirizzare i record da un singolo flusso a diverse tabelle Apache Iceberg e applicare automaticamente le operazioni di inserimento, aggiornamento ed eliminazione ai record nelle tabelle. Firehose garantisce una consegna esatta una volta ai tavoli Iceberg. Questa funzionalità richiede l'utilizzo di. AWS Glue Data Catalog
Firehose può anche fornire direttamente dati in streaming alle tabelle Amazon S3. Queste tabelle forniscono uno storage ottimizzato per carichi di lavoro di analisi su larga scala e includono funzionalità che migliorano continuamente le prestazioni delle query e riducono i costi di archiviazione per i dati tabulari.
Per informazioni su come configurare un flusso Firehose per fornire dati alle tabelle Apache Iceberg, consulta Configurare il flusso Firehose nella documentazione di Firehose o il post del blog Trasmettere dati in tempo reale nelle tabelle Apache Iceberg in Amazon S3 usando Amazon