查看敏感数据发现作业的统计数据和结果 - Amazon Macie

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

查看敏感数据发现作业的统计数据和结果

当您运行敏感数据发现作业时,Amazon Macie 会自动计算并报告该作业的某些统计数据。例如,Macie 会报告作业运行的次数以及该作业在当前运行期间尚未处理的 Amazon Simple Storage Service (Amazon S3) 对象的大致数量。Macie 还会为该作业生成多种类型的结果:日志事件、敏感数据调查发现和敏感数据发现结果。

敏感数据发现作业的结果类型

随着敏感数据发现作业的进行,Amazon Macie 会为该作业生成以下类型的结果。

日志事件

这是作业运行时发生的事件的记录。Macie 会自动记录特定事件的数据并将其发布到 Amazon CloudWatch 日志。这些日志中的数据提供了作业进度或状态变化的记录,例如作业开始或停止运行的确切日期和时间。这些数据还提供了有关作业运行时发生的任何账户或存储桶级错误的详细信息。

日志事件可以帮助您监控作业,并解决任何阻碍该作业分析所需数据的问题。如果作业使用运行时标准来确定要分析哪些 S3 存储桶,则日志事件还可以帮助您确定作业运行时是否符合标准以及哪些 S3 存储桶符合标准。

您可以使用亚马逊 CloudWatch 控制台或亚马逊日 CloudWatch 志 API 访问日志事件。为了帮助您导航到作业的日志事件,Amazon Macie 控制台提供了指向这些事件的链接。有关更多信息,请参阅 监控作业

敏感数据调查发现

这是 Macie 在 S3 对象中发现的敏感数据的报告。每项调查发现都会提供严重性评级和详细信息,如:

  • Macie 发现敏感数据的日期与时间。

  • Macie 发现敏感数据的类别和类型。

  • Macie 发现的每种敏感数据的出现次数。

  • 生成调查发现的作业的唯一标识符。

  • 受影响的 S3 存储桶和对象的名称、公开访问设置、加密类型和其他信息。

根据受影响 S3 对象的文件类型或存储格式,详细信息还可能包括 Macie 发现的、多达 15 处敏感数据的位置。为了报告位置数据,敏感数据调查发现使用标准化的 JSON 架构

敏感数据调查发现不包括 Macie 发现的敏感数据。相反,它提供了用于进一步调查和必要补救的信息。

Macie 会将敏感数据调查发现存储 90 天。您可以使用 Amazon Macie 控制台或 Amazon Macie API 访问它们。您还可以使用其他应用程序、服务和系统,监控和处理它们。有关更多信息,请参阅 分析调查发现

敏感数据发现结果

这是记录有关 S3 对象分析详细信息的记录。Macie 会自动为您配置作业进行分析的每个对象创建敏感数据发现结果。这包括 Macie 在其中没有发现敏感数据、因而不会产生敏感数据调查发现的对象,以及 Macie 因错误或问题(例如,权限设置或使用不受支持的文件或存储格式)而无法分析的对象。

如果 Macie 在 S3 对象中发现敏感数据,则敏感数据发现结果将包含来自相应敏感数据调查发现的数据。它还提供了其他信息,例如 Macie 在对象中发现的每种敏感数据出现多达 1000 次的位置。例如:

  • Microsoft Excel 工作簿、CSV 文件或 TSV 文件中单元格或字段的列号和行号

  • JSON 或 JSON Lines 文件中的字段或数组路径

  • 除 CSV、JSON、JSON Lines 或 TSV 文件之外的非二进制文本文件中的行号,例如 HTML、TXT 或 XML 文件

  • Adobe 可移植文档格式 (PDF) 文件中页面的页码

  • Apache Avro 对象容器或 Apache Parquet 文件中记录的字段的记录索引和路径

如果受影响的 S3 对象是存档文件,例如.tar 或.zip 文件,则敏感数据发现结果还会提供 Macie 从存档中提取的各个文件中出现的敏感数据的详细位置数据。Macie 不会在存档文件的敏感数据调查发现中包含此信息。为了报告位置数据,敏感数据发现结果使用标准化 JSON 架构

敏感数据发现结果不包括 Macie 发现的敏感数据。相反,它为您提供分析记录,有助于数据隐私和保护审计或调查。

Macie 会将您的敏感数据发现结果存储 90 天。您无法直接在 Amazon Macie 控制台或使用 Amazon Macie API 访问它们。相反,您可以配置 Macie 将其加密并存储至 S3 存储桶内。存储桶可以用作所有敏感数据发现结果的最终长期存储库。然后,您可以选择访问和查询该存储库中的结果。要了解如何配置这些设置,请参阅 存储和保留敏感数据发现结果

配置好这些设置之后,Macie 会将敏感数据发现结果写入 JSON Lines (.jsonl) 文件,然后它加密这些文件并将其作为 GNU Zip (.gz) 文件添加至 S3 存储桶。为了帮助您导航到结果,Amazon Macie 控制台提供了指向这些结果的链接。

敏感数据调查发现和敏感数据发现结果都遵循标准化架构。这可以帮助您选择性地使用其他应用程序、服务和系统进行查询、监控和处理。

提示

有关如何查询和使用敏感数据发现结果来分析和报告潜在的数据安全风险的详细教学示例,请参阅安全博客上的 “如何使用 Amazon Athena 和 A QuickSight mazon 查询和可视化 Macie 敏感数据发现结果” 博客文章。AWS

有关可用于分析敏感数据发现结果的 Amazon Athena 查询示例,请访问上的 Amazon Macie 结果分析存储库。 GitHub此存储库还提供了有关配置 Athena 以检索和解密结果的说明,以及用于为结果创建表的脚本。

查看敏感数据发现作业的统计数据和结果

要查看单个敏感数据发现作业的处理统计数据和结果,您可以使用 Amazon Macie 控制台或 Amazon Macie API。按照以下步骤,使用控制台查看作业的统计数据和结果。

要以编程方式访问任务的处理统计数据,请使用 Amazon Macie API 的DescribeClassificationJob操作。要以编程方式访问作业产生的结果,请使用 Amazon Macie API 的ListFindings操作,并在该字段的筛选条件中指定该任务的唯一标识符。classificationDetails.jobId要了解如何操作,请参阅 创建筛选条件并将其应用于调查发现。然后,您可以使用该GetFindings操作来检索发现的详细信息。

查看作业的统计数据和结果
  1. 通过以下网址打开 Amazon Macie 控制台:https://console.aws.amazon.com/macie/

  2. 在导航窗格中,选择作业

  3. 作业页面上,选择要查看其统计数据和结果的作业的名称。此详细信息面板显示有关作业的统计数据、设置和其他信息。

  4. 在详细信息面板中,执行以下任一操作:

    • 要查看作业的处理统计数据,请参阅面板的统计数据部分。此部分显示统计数据,例如作业运行的次数以及该作业在当前运行期间尚未处理的大致对象数。

    • 要查看作业的日志事件,请选择面板顶部的显示结果,然后选择显示 CloudWatch 日志。Macie 打开亚马逊 CloudWatch控制台并显示 Macie 为该任务发布的日志事件表。

    • 要查看作业生成的所有敏感数据调查发现,请选择面板顶部的显示结果,然后选择显示调查发现。Macie 会打开调查发现页面,并显示作业中的所有调查发现。然后,要查看特定调查发现的详细信息,请选择该调查发现,然后参考详细信息面板。

      提示

      在调查发现详细信息面板中,您可以使用详细结果位置字段中的链接导航到 Amazon S3 中相应的敏感数据发现结果:

      • 如果调查发现适用于大型存档或压缩文件,则该链接将显示包含该文件发现结果的文件夹。如果存档文件或压缩文件生成的发现结果超过 100 个,则该文件

      • 如果调查发现适用于小存档或压缩文件,则该链接将显示包含该文件发现结果的文件。如果存档文件或压缩文件生成的发现结果不超过 100 个,则该文件

      • 如果调查发现适用于其他类型的文件,则该链接将显示包含该文件发现结果的文件。

    • 要查看作业生成的所有敏感数据发现结果,请选择面板顶部的显示结果,然后选择显示分类。Macie 打开 Amazon S3 控制台并显示包含作业所有发现结果的文件夹。只有在将 Macie 配置为将敏感数据发现结果存储在 S3 存储桶后,此选项才可用。