本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
啟用記錄格式轉換
如果啟用記錄格式轉換,則無法將 Amazon 數據 Firehose 目的地設置為 Amazon OpenSearch 服務,亞馬遜紅移或 Splunk。啟用格式轉換後,Amazon S3 是您唯一可用於 Firehose 串流的目的地。以下部分說明如何從主控台和 Firehose API 作業啟用記錄格式轉換。有關如何設置記錄格式轉換的示例 AWS CloudFormation,請參閱 AWS::DataFirehose::DeliveryStream.
從控制台啟用記錄格式轉換
您可以在建立或更新 Firehose 串流時,在主控台上啟用資料格式轉換。啟用資料格式轉換後,Amazon S3 是唯一可以為 Firehose 串流設定的目的地。此外,啟用格式轉換將停用 Amazon S3 壓縮。然而,轉換程序中會自動出現 Snappy 壓縮。Amazon 數據 Firehose 在這種情況下使用的 Snappy 的框架格式與 Hadoop 兼容。這表示您可使用 Snappy 壓縮的結果,並在 Athena 中查詢這些資料。有關 Hadoop 依賴的活潑框架格式,請參閱 .java。BlockCompressorStream
啟用資料 Firehose 串流的資料格式轉換
-
登入 AWS Management Console,然後開啟 Amazon 資料 Firehose 主控台,網址為。https://console.aws.amazon.com/firehose/
-
選擇要更新的 Firehose 串流,或依照中的步驟建立新的 Firehose 串流。教學課程:從主控台建立 Firehose 串流
-
在 Convert record format (轉換記錄格式) 底下,將 Record format conversion (記錄格式轉換) 設定為 Enabled (已啟用)。
-
選擇您想要的輸出格式。如需有關這兩個選項的詳細資訊,請參閱 Apache 鑲木地板
和 Apache ORC 。 -
選擇一個 AWS Glue 用於指定來源記錄的結構描述的表格。設定區域、資料庫、表格與表格版本。
管理 Firehose 的記錄格式轉換 API
如果您希望 Amazon 數據 Firehose 將輸入數據的格式從JSON轉換為實木複合地板ORC,或者在擴展 DS3 或擴展DestinationConfiguration中指定可選DataFormatConversionConfiguration元素。DestinationUpdate如果您指定 DataFormatConversionConfiguration,則適用下列限制。
-
在中 BufferingHints,如果啟用記錄格式轉換,則無法設定
SizeInMBs
為小於 64 的值。格式轉換未啟用時,該值預設為 5,啟用後則變成 128。 -
您必須在延伸 DS3
CompressionFormat
中DestinationConfiguration或在延伸 DS3 中設定為。DestinationUpdateUNCOMPRESSED
CompressionFormat
的預設值為UNCOMPRESSED
。因此,您也可以將其保留在擴展 DestinationConfiguration DS3 中未指定。序列化程序仍會壓縮這些資料,預設使用 Snappy 壓縮。Amazon 數據 Firehose 在這種情況下使用的 Snappy 的框架格式與 Hadoop 兼容。這表示您可使用 Snappy 壓縮的結果,並在 Athena 中查詢這些資料。有關 Hadoop 依賴的活潑框架格式,請參閱 .java。BlockCompressorStream設定序列化程式時,您可選擇其他壓縮類型。