什麼是 Amazon 數據 Firehose? - Amazon 數據 Firehose

Amazon 數據 Firehose 以前被稱為 Amazon Kinesis Data Firehose

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

什麼是 Amazon 數據 Firehose?

Amazon 資料 Firehose 是一項全受管服務,可將即時串流資料交付到 Amazon 簡單儲存服務 (Amazon S3)、Amazon Redshift、Amazon 服務、亞馬遜 OpenSearch 無伺 OpenSearch 服器、Splunk 以及任何自訂 HTTP 端點或 HTTP 端點由支援的第三方服務提供者擁有的任何自訂 HTTP 端點或 HTTP 端點,包括資料多、重新遺物、Coralogix 和彈性。 LogicMonitor使用 Amazon 資料 Firehose,您不需要撰寫應用程式或管理資源。您可以將資料生產者設定為將資料傳送到 Amazon Data Firehose,它會自動將資料傳送到您指定的目的地。您也可以將 Amazon 資料 Firehose 設定為在交付資料之前轉換資料。

如需有關 AWS 巨量資料解決方案的詳細資訊,請參閱上的大數據 AWS。如需 AWS 串流資料解決方案的詳細資訊,請參閱什麼是串流資料?

注意

請注意最新的 Amazon MSK AWS 串流資料解決方案,該解決方案提供 AWS CloudFormation 範本,讓資料流經生產者、串流儲存、消費者和目的地。

學習關鍵概念

當您開始使用 Amazon 資料 Firehose 時,您可以從瞭解下列概念中受益:

Firehose 溪

Amazon 數據 Firehose 件的基礎實體。您可以通過創建一個 Firehose 流,然後將數據發送到該流來使用 Amazon 數據防火軟管。如需詳細資訊,請參閱 建立 Firehose 串流將資料傳送至 Firehose 串流

record

您的資料生產者會傳送至 Firehose 串流的感興趣資料。記錄最大可達 1,000 KB。

資料產生來源

製作人將記錄發送到 Firehose 流。例如,將記錄資料傳送至 Firehose 串流的 Web 伺服器就是資料生產者。您也可以將 Firehose 串流設定為自動從現有 Kinesis 資料串流讀取資料,並將其載入目標。如需詳細資訊,請參閱 將資料傳送至 Firehose 串流

緩衝區大小和緩衝間隔

Amazon Data Firehose 會將傳入的串流資料緩衝為特定大小或一段時間,然後再將其傳送到目的地。 Buffer Size以 MB 為單位,並Buffer Interval且以秒為單位。

了解 Amazon 數據 Firehose 件中的數據流

以 Amazon S3 目的地而言,串流資料都交付至您的 S3 儲存貯體。如果已啟用資料轉換,您可以選擇性將原始資料備份到另一個 Amazon S3 儲存貯體。

Amazon S3 的亞馬遜數據 Firehose 數據流

以 Amazon Redshift 目的地而言,串流資料會先交付至您的 S3 儲存貯體。然後,Amazon 數據 Firehose 發出 Amazon Redshift COPY 命令,將數據從 S3 存儲桶加載到 Amazon Redshift 集群。如果已啟用資料轉換,您可以選擇性將原始資料備份到另一個 Amazon S3 儲存貯體。

Amazon 數據 Firehose 數據流 Amazon Redshift

對於 OpenSearch 服務目的地,串流資料會傳遞到您的 OpenSearch服務叢集,並且可以選擇性地同時備份到 S3 儲存貯體。

Amazon 數據 Firehose 服 OpenSearch 務數據流

以 Splunk 目的地而言,串流資料會交付到 Splunk,然後可以選擇性同時備份到 S3 儲存貯體。

適用於 Splunk 的 Amazon 資料 Firehose 資料流