O que é o Amazon Data Firehose? - Amazon Data Firehose

O Amazon Data Firehose era conhecido anteriormente como Amazon Kinesis Data Firehose

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O que é o Amazon Data Firehose?

O Amazon Data Firehose é um serviço totalmente gerenciado para fornecer dados de streaming em tempo real para destinos como Amazon Simple Storage Service (Amazon S3), Amazon Redshift, Amazon Service, Amazon Serverless, Splunk e qualquer endpoint HTTP personalizado ou endpoints HTTP de propriedade de provedores de serviços terceirizados compatíveis, incluindo Datadog LogicMonitor, Dynatrace, MongoDB, New Relic, Coralogix e Elastic. OpenSearch OpenSearch Com o Amazon Data Firehose, você não precisa criar aplicativos ou gerenciar recursos. Você configura seus produtores de dados para enviar dados para o Amazon Data Firehose, e ele entrega automaticamente os dados para o destino que você especificou. Você também pode configurar o Amazon Data Firehose para transformar seus dados antes de entregá-los.

Para obter mais informações sobre as soluções de big data da AWS, consulte Big Data na AWS. Para obter mais informações sobre as soluções de dados em streaming da AWS, consulte O que são dados em streaming?

nota

Observe a mais recente solução AWS de dados de streaming para Amazon MSK, que fornece AWS CloudFormation modelos em que os dados fluem por produtores, armazenamento de streaming, consumidores e destinos.

Principais conceitos

Ao começar a usar o Amazon Data Firehose, você pode se beneficiar da compreensão dos seguintes conceitos:

Stream Firehose

A entidade subjacente do Amazon Data Firehose. Você usa o Amazon Data Firehose criando um stream do Firehose e enviando dados para ele. Para obter mais informações, consulte Enviando dados para um stream do Firehose e Criação de um stream do Firehose.

registro

Os dados de interesse que seu produtor de dados envia para um stream do Firehose. Um registro pode ter, no máximo, 1000 KB.

produtor de dados

Os produtores enviam discos para as transmissões do Firehose. Por exemplo, um servidor web que envia dados de log para um stream do Firehose é um produtor de dados. Você também pode configurar seu stream do Firehose para ler automaticamente os dados de um stream de dados existente do Kinesis e carregá-los nos destinos. Para ter mais informações, consulte Enviando dados para um stream do Firehose.

tamanho e intervalo do buffer

O Amazon Data Firehose armazena os dados de streaming recebidos em um determinado tamanho ou por um determinado período de tempo antes de entregá-los aos destinos. Buffer Sizeestá em MBs e Buffer Interval está em segundos.

Fluxo de dados

Para destinos do Amazon S3, os dados em streaming são entregues no bucket do S3. Se a transformação de dados estiver habilitada, você também poderá fazer backup dos dados da fonte em outro bucket do Amazon S3.


                Fluxo de dados do Amazon Data Firehose para o Amazon S3

Para os destinos do Amazon Redshift, os dados em streaming são entregues primeiro no bucket do S3. Em seguida, o Amazon Data Firehose emite um comando do Amazon COPY Redshift para carregar dados do seu bucket do S3 para o seu cluster do Amazon Redshift. Se a transformação de dados estiver habilitada, você também poderá fazer backup dos dados da fonte em outro bucket do Amazon S3.


                Fluxo de dados do Amazon Data Firehose para o Amazon Redshift

Para destinos OpenSearch de serviço, os dados de streaming são entregues ao seu cluster de OpenSearch serviços e, opcionalmente, podem ser copiados para seu bucket do S3 simultaneamente.


                Fluxo de dados do Amazon Data Firehose para serviço  OpenSearch

Para destinos do Splunk, os dados em streaming são entregues ao Splunk e eles podem ser submetidos a backup no bucket do S3 simultaneamente, se você desejar.


                Fluxo de dados do Amazon Data Firehose para Splunk