使用控制台运行分析作业 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用控制台运行分析作业

您可以使用 Amazon Comprehend 控制台创建和管理异步分析任务。您的任务会分析 Amazon S3 中存储的文档,以查找事件、短语、主要语言、情绪或个人身份信息 (PII) 等实体。

创建分析作业

  1. 登录到AWS Management Console然后打开Amazon Comprehend

  2. 从左侧菜单中,选择分析作业然后选择创建作业.

  3. UNDERJob 设置,为分析作业指定唯一的名称。

  4. 适用于分析类型,选择其中一个内置分析类型。

    如果选择主要语言个人身份信息 (PII),或者主题建模,则您可以跳过下一步。

  5. 这取决于分析类型控制台会显示以下一个或多个附加字段:

    • 语言是所有内置分析类型所必需的主要语言主题建模.

      选择输入文档的语言。

    • 目标事件类型是必填字段事件分析类型。

      选择要在输入文档中检测的事件类型。有关支持的事件类型的更多信息,请参阅。事件类型.

    • PII 检测设置是必填字段PII分析类型。

      选择输出模式。有关 PII 检测设置的更多信息,请参阅。PII.

  6. UNDER输入数据,指定输入文档在 Amazon S3 中的位置:

    • 要分析您自己的文档,请选择我的文档,然后选择浏览 S3以提供包含您的文件的存储桶或文件夹的路径。

    • 要分析由亚马逊 Comprehend 提供的样本,请选择示例文档. 在这种情况下,Amazon Comprehend 使用AWS,您不必指定位置。

  7. (可选)对于输入格式,为您的输入文件指定下列格式之一:

    • 每个文件一个文档— 每个文件包含一个输入文档。这最适合大型文档的集合。

    • 每行一个文档— 输入是一个或多个文件。文件中的每一行都被视为文档。这最适合短文档,例如社交媒体帖子。每行必须以换行符(LF、\ n)、回车符(CR、\ r)或两者结尾(CRLF、\ r\ n)。您不能使用 UTF-8 行分隔符 (u+2028) 来结束一行。

  8. UNDER输出数据,选择浏览 S3. 选择您希望 Amazon Comprehend 在其中写入分析生成的输出数据的 Amazon S3 存储桶或文件夹。

  9. (可选)要加密作业的输出结果,请选择加密. 然后,选择是使用与当前账户关联的 KMS 密钥还是其他账户中的密钥:

    • 如果您正在使用与当前账户关联的密钥,请选择KMS 密钥 ID.

    • 如果您使用与其他账户关联的密钥,请在下方输入密钥别名或 ID 的 ARNKMS 密钥 ID.

      注意

      有关创建和使用 KMS 密钥以及关联加密的更多信息,请参阅密钥管理服务 (KMS).

  10. UNDER访问权限,提供一个 IAM 角色,该角色具有:

    • 授予对输入文档的 Amazon S3 位置的读入访问。

    • 授予对输出文档的 Amazon S3 位置的写入访问。

    • 包括一项信任策略,该策略允许comprehend.amazonaws.com服务委托人代入该角色并获取其权限。

    如果您还没有具有这些权限的 IAM 角色和适当的信任策略,选择创建 IAM角色来创建一个。

  11. 填写完此表后,选择创建作业创建并启动主题检测作业。

新作业将显示在作业列表中,状态字段显示作业的状态。该字段可以是IN_PROGRESS对于正在处理的作业,COMPLETED对于已成功完成的作业,以及FAILED对于出现错误的作业。您可以单击作业以获取有关该作业的更多信息,包括任何错误消息。

任务完成后,Amazon Comprehend 会将分析结果存储在您为任务指定的输出 Amazon S3 位置中。有关每种数据类型的分析结果的说明,请参阅。见解.