配置元数据表 - Amazon Simple Storage Service

配置元数据表

Amazon S3 元数据通过自动捕获通用存储桶中对象的元数据,并将其存储在您可以查询的只读、完全托管式 Apache Iceberg 表中,从而加快数据发现速度。这些只读表称为元数据表。在通用存储桶中添加、更新和移除对象时,S3 元数据会自动刷新相应的元数据表,以反映最新的更改。

借助 S3 元数据,您可以轻松查找、存储和查询 S3 对象的元数据,这样您就可以快速准备数据,以用于业务分析、人工智能和机器学习(AI/ML)模型训练等。

要生成对象元数据并将其存储在 S3 托管式元数据表中,您需要为通用存储桶创建元数据表配置。只要存储桶上的配置处于活动状态,Amazon S3 就会持续更新元数据表以反映对数据的最新更改。此外,Amazon S3 会持续优化您的元数据表,以有助于降低存储成本并提高分析查询性能。

要创建元数据表配置,确保您拥有创建和管理元数据表所必需的 AWS Identity and Access Management(IAM)权限。您还必须创建或指定用于存储元数据表的 S3 表存储桶。此表存储桶必须与通用存储桶位于相同的 AWS 区域和 AWS 账户中。

要监控对元数据表配置的更新,可以使用 AWS CloudTrail。有关更多信息,请参阅 CloudTrail 日志记录跟踪的 Amazon S3 存储桶级操作