优化元数据表查询性能
由于 S3 元数据基于 Apache Iceberg 表格式,因此,可以使用特定的时间范围来优化日记表查询的性能和成本。
例如,以下 SQL 查询提供了 S3 通用存储桶中新对象的敏感级别:
SELECT key, object_tags['SensitivityLevel'] FROM "b_
general-purpose-bucket-name
"."journal" WHERE record_type = 'CREATE' GROUP BY object_tags['SensitivityLevel']
此查询将扫描整个日记表,运行可能需要很长时间。要提高性能,您可以包括 record_timestamp
列以专注于特定的时间范围。我们还建议使用完全限定的表名称,您可以在 Amazon S3 控制台中通用存储桶的元数据选项卡上的元数据配置详情页面上找到该名称。以下是上一个查询的更新版本,它查看了过去一个月的新对象:
SELECT key, object_tags['SensitivityLevel'] FROM b_
general-purpose-bucket-name
"."aws-s3.b_general-purpose-bucket-name
.journal" WHERE record_type = 'CREATE' AND record_timestamp > (CURRENT_TIMESTAMP – interval '1' month) GROUP BY object_tags['SensitivityLevel']
要提高对清单表的查询性能,请确保仅查询所需的最少列。