Che cos'è Amazon Data Firehose? - Amazon Data Firehose

Amazon Data Firehose era precedentemente noto come Amazon Kinesis Data Firehose

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Che cos'è Amazon Data Firehose?

Amazon Data Firehose è un servizio completamente gestito per la distribuzione di dati di streaming in tempo reale a destinazioni come Amazon Simple Storage Service (Amazon S3), Amazon Redshift, Amazon Service, Amazon Serverless OpenSearch , Splunk e qualsiasi endpoint HTTP personalizzato o endpoint HTTP di proprietà di fornitori di servizi terzi supportati, tra cui Datadog LogicMonitor, Dynatrace, MongoDB, New Redhose Lic, Coralogix ed Elastic. OpenSearch Con Amazon Data Firehose, non è necessario scrivere applicazioni o gestire risorse. Configurate i vostri produttori di dati per inviare dati ad Amazon Data Firehose, che li consegna automaticamente alla destinazione specificata. Puoi anche configurare Amazon Data Firehose per trasformare i tuoi dati prima di distribuirli.

Per ulteriori informazioni sulle soluzioni per i AWS big data, consulta Big Data on AWS. Per ulteriori informazioni sulle soluzioni AWS per i dati in streaming, consulta Cosa sono i dati in streaming?

Nota

Nota la più recente soluzione di AWS streaming di dati per Amazon MSK che fornisce AWS CloudFormation modelli in cui i dati fluiscono attraverso produttori, storage in streaming, consumatori e destinazioni.

Scopri i concetti chiave

Quando inizi a usare Amazon Data Firehose, puoi trarre vantaggio dalla comprensione dei seguenti concetti:

Flusso Firehose

L'entità sottostante di Amazon Data Firehose. Puoi utilizzare Amazon Data Firehose creando uno stream Firehose e inviandogli dati. Per ulteriori informazioni, consulta Creare uno stream Firehose e Inviare dati a uno stream Firehose.

record

I dati di interesse che il produttore di dati invia a uno stream Firehose. Un record può essere grande fino a 1.000 KB.

producer di dati

I produttori inviano i dischi agli stream di Firehose. Ad esempio, un server Web che invia dati di registro a un flusso Firehose è un produttore di dati. Puoi anche configurare lo stream Firehose per leggere automaticamente i dati da un flusso di dati Kinesis esistente e caricarli nelle destinazioni. Per ulteriori informazioni, consulta Inviare dati a uno stream Firehose.

Dimensioni del buffer e intervallo del buffer

Amazon Data Firehose memorizza nel buffer i dati di streaming in entrata fino a una certa dimensione o per un determinato periodo di tempo prima di consegnarli alle destinazioni. Buffer Sizeè in MB e Buffer Interval lo è in secondi.

Comprendi il flusso di dati in Amazon Data Firehose

Per le destinazioni Amazon S3, i dati in streaming vengono distribuiti sul bucket S3. Se è abilitata la trasformazione dei dati, puoi scegliere di eseguire il backup dei dati di origine su un altro bucket Amazon S3.

Flusso di dati Amazon Data Firehose per Amazon S3

Per le destinazioni Amazon Redshift, i dati in streaming vengono distribuiti prima sul bucket S3. Amazon Data Firehose emette quindi un comando Amazon COPY Redshift per caricare i dati dal bucket S3 al cluster Amazon Redshift. Se è abilitata la trasformazione dei dati, puoi scegliere di eseguire il backup dei dati di origine su un altro bucket Amazon S3.

Flusso di dati Amazon Data Firehose per Amazon Redshift

Per le destinazioni OpenSearch del servizio, i dati in streaming vengono distribuiti al cluster di OpenSearch servizio e, facoltativamente, possono essere sottoposti a backup contemporaneamente nel bucket S3.

Flusso di dati Amazon Data Firehose per Service OpenSearch

Per le destinazioni Splunk, i dati in streaming vengono distribuiti su Splunk e se ne può eseguire contemporaneamente il backup sul bucket S3.

Flusso di dati Amazon Data Firehose per Splunk