导入对话转录 - Amazon Lex

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

导入对话转录

导入对话转录的过程包括三个步骤:

  1. 将转录转换为正确的格式,为导入做好准备。如果您使用的是 Contact Lens for Amazon Connect,则转录已经是正确的格式。

  2. 将转录上传到 Amazon S3 存储桶。如果您使用的是 Contact Lens,则您的转录已在 S3 存储桶中。

  3. 使用 Amazon Lex V2 控制台或 API 操作对转录进行分析。完成训练所需要的时间取决于转录的数量以及对话的复杂性。通常,每分钟分析 500 行转录。

其中的各个步骤将在后文中予以说明。

从 Contact Lens for Amazon Connect 导入转录

Amazon Lex V2 自动聊天机器人设计器与 Contact Lens 转录文件兼容。要使用 Contact Lens 转录文件,必须打开 Contact Lens 并记下其输出文件的位置。

从 Contact Lens 导出转录
  1. 在您的 Amazon Connect 实例中打开 Contact Lens。有关说明,请参阅《Amazon Connect 管理员指南》中的启用 Contact Lens for Amazon Connect

  2. 记下 Amazon Connect 用于您的实例的 S3 存储桶的位置。要查看位置,请在 Amazon Connect 控制台中打开数据存储页面。有关说明,请参阅《Amazon Connect 管理员指南》中的更新实例设置

打开 Contact Lens 并记下转录文件位置后,请访问使用 Amazon Lex V2 控制台分析转录以查看转录导入和分析的说明。

准备转录

创建转录文件,以准备好您的转录。

  • 为每个对话创建一个转录文件,以便列出各方之间的交互。对话中的每次交互可能有多行内容。您可以提供对话的已编辑版本和未编辑版本。

  • 文件必须为输入转录格式中指定的 JSON 格式。

  • 您必须提供至少 1,000 个对话回合。为了更好地发现您的意图和插槽类型,您应该提供约 10,000 个或更多个对话回合。自动聊天机器人设计器仅处理前 700,000 个回合。

  • 您可以上传的转录文件没有数量限制,也没有文件大小限制。

如果您计划按日期筛选已导入的转录,则这些文件必须位于以下目录结构中:

<path or bucket root> --> yyyy --> mm --> dd --> transcript files

转录文件的文件名中必须包含“yyyy-mm-dd”格式的日期。

从其他联络中心应用程序导出转录
  1. 使用联络中心应用程序的工具导出对话。对话必须至少包含输入转录格式中指定的信息。

  2. 将您的联络中心应用程序生成的转录转换为输入转录格式中所述的格式。该转换应由您负责执行。

我们提供三个用于准备转录的脚本。它们是:

  • 将 Contact Lens 转录与 Amazon Lex V2 对话日志结合起来的脚本。Contact Lens 转录不包括与 Amazon Lex V2 机器人交互的 Amazon Connect 对话部分。该脚本要求为 Amazon Lex V2 开启对话日志,同时需要查询对话日志 CloudWatch Logs 和 Contact Lens S3 存储桶的相应权限。

  • 用于将 Amazon Transcribe 通话分析功能转换为 Amazon Lex V2 输入格式的脚本。

  • 用于将 Amazon Connect 聊天转录转换为 Amazon Lex V2 输入格式的脚本。

您可以访问以下 GitHub 存储库下载脚本:https://github.com/aws-samples/amazon-lex-bot-recommendation-integration

将转录上传到 S3 存储桶

如果您使用的是 Contact Lens,则您的转录文件已包含在 S3 存储桶中。有关转录文件的位置和文件名,请参阅《Amazon Connect 管理员指南》中的示例 Contact Lens 输出文件

如果您正在使用其他联络中心应用程序,但尚未为转录文件设置 S3 存储桶,请按照以下步骤操作。否则,如果您已有 S3 存储桶,则在登录 Amazon S3 控制台后,请从此过程的第 5 步开始执行。

将文件上传到 S3 存储桶
  1. 登录到 AWS Management Console,然后通过以下网址打开 Amazon S3 控制台:https://console.aws.amazon.com/s3/

  2. 请选择 Create bucket(创建桶)

  3. 指定存储桶的名称,然后选择“区域”。该区域必须与您在 Amazon Lex V2 中使用的区域相同。根据需要针对您的用例设置其他选项。

  4. 请选择 Create bucket(创建桶)

  5. 在存储桶列表中,选择现有存储桶或者您刚创建的存储桶。

  6. 请选择 Upload(上传)。

  7. 添加您要上传的转录文件。

  8. 请选择 Upload(上传)。

使用 Amazon Lex V2 控制台分析转录

您只能使用空语言的自动机器人设计。可以将新语言添加到现有机器人,也可以创建新机器人。

要在新机器人中创建新语言,请执行以下操作:
  1. 登录到 AWS Management Console,并通过以下网址打开 Amazon Lex 控制台:https://console.aws.amazon.com/lex/

  2. 选择创建机器人

  3. 选择从自动聊天机器人设计器开始。填写信息以创建机器人。

  4. 选择 Next(下一步)。

  5. 为机器人添加语言中,填写语言信息。

  6. S3 上的转录文件位置部分中,选择包含您的转录文件的 S3 存储桶,以及文件的本地路径(如有必要)。

  7. 可选的选项如下:

    • 在处理过程中对转录数据进行加密的 AWS KMS 密钥。如果不选择密钥,则使用服务 AWS KMS 密钥。

    • 按照特定的日期范围对转录进行筛选。如果您选择对转录进行筛选,则转录文件必须位于正确的文件夹结构中。有关更多信息,请参阅准备转录

  8. 选择完成

等待 Amazon Lex V2 处理转录。分析完成后,系统将显示一条完成消息。

如何停止分析转录

如果您需要停止对已上传转录的分析,则可以停止 BotRecommendationStatus 状态为“正在处理”的正在运行的 BotRecommendation 任务。从控制台提交任务后,或者使用适用于 StopBotRecommendation API 的 CLI SDK,您可以点击横幅上显示的停止处理按钮。有关更多信息,请参阅 StopBotRecommendation

调用 StopBotRecommendation 后,内部 BotRecommendationStatus 被设置为 Stopping,您无需支付任何费用。要确保任务已停止,您可以调用 DescribeBotRecommendation API 并验证 BotRecommendationStatus 是否为 Stopped。此过程通常需要 3 到 4 分钟。

调用 StopBotRecommendation API 后,您无需支付处理费用。