PII 异步分析作业(控制台) - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

PII 异步分析作业(控制台)

您可以使用控制台创建异步分析作业来检测 PII 实体。有关 PII 实体类型的更多信息,请参阅PII.

创建分析作业

  1. 登录到AWS Management Console打开Amazon Comprehend

  2. 从左侧菜单中,选择分析职位然后选择创建作业.

  3. UNDERJob 设置,为分析作业指定唯一的名称。

  4. 适用于分析类型,选择个人身份信息 (PII).

  5. 输出模式,选择以下项之一:

    • OFFFF— 任务输出返回每个 PII 实体的位置。

    • 保留— 作业输出返回输入文本的副本,其中每个 PII 条目都已编辑。

  6. (可选) 如果您选择保留作为输出模式,您可以选择要编辑的 PII 实体类型。

  7. UNDER输入数据,指定输入文档在 Amazon S3 中的位置:

    • 要分析您自己的文档,请选择Ment,然后选择浏览 S3以提供包含您的文件的存储桶或文件夹的路径。

    • 要分析由亚马逊 Comprehend 提供的样本,请选择示例文档. 在这种情况下,Amazon Comprehend 使用由托管的存储桶AWS,并且您不必指定位置。

  8. (可选)对于输入格式,为您的输入文件指定以下格式之一:

    • 每个文件一个文档— 每个文件包含一个输入文档。这最适合大型文档的集合。

    • 每行一个文档— 输入是一个或多个文件。文件中的每一行都被视为文档。这最适合短文档,例如社交媒体帖子。每行必须以换行符(LF、\ n)、回车符(CR、\ r)或两者结尾(CRLF、\ r\ n)。您不能使用 UTF-8 行分隔符 (u+2028) 来结束一行。

  9. UNDER输出数据,选择浏览 S3. 选择您希望 Amazon Comprehend 在其中写入分析生成的输出数据的 Amazon S3 存储桶或文件夹。

  10. (可选)要加密作业的输出结果,请选择加密. 然后,选择是使用与当前账户关联的 KMS 密钥还是其他账户中的密钥:

    • 如果您使用与当前账户关联的密钥,请选择密钥别名或 IDKMS 密钥 ID.

    • 如果您使用与其他账户关联的密钥,请在下方输入密钥别名或 ID 的 ARNKMS 密钥 ID.

      注意

      有关创建和使用 KMS 密钥以及关联加密的更多信息,请参阅密钥管理服务 (KMS).

  11. UNDER访问权限,提供一个 IAM 角色,该角色具有:

    • 授予对输入文档的 Amazon S3 位置的读取访问权限。

    • 授予对输出文档的 Amazon S3 位置的写入访问权限。

    • 包括一项信任策略,该策略允许comprehend.amazonaws.com服务委托人代入该角色并获取其权限。

    如果您还没有具有这些权限和适当信任策略的 IAM 角色,选择创建 IAM角色来创建一个。

  12. 填写完此表后,选择创建作业创建并启动主题检测作业。

新作业将显示在作业列表中,状态字段显示作业的状态。该字段可以是IN_PROGRESS对于正在处理的作业,COMPLETED对于已成功完成的作业,以及FAILED对于出现错误的作业。您可以单击作业以获取有关该作业的更多信息,包括任何错误消息。

任务完成后,Amazon Comprehend 会将分析结果存储在您为任务指定的输出 Amazon S3 位置中。有关分析结果的说明,请参阅PII.