开始使用 Incident Manager - Incident Manager

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开始使用 Incident Manager

该部分介绍在 Incident Manager 控制台中做准备。您需要先在控制台中完成做准备,然后才能将其用于事件管理。该向导会引导您设置复制集、至少一个联系人和一个上报计划以及您的第一个响应计划。以下指南将帮助您了解 Incident Manager 和事件生命周期:

先决条件

如果您第一次使用 Incident Manager,请参阅 设置 AWS Systems Manager 事件管理器。我们建议您在用于管理操作的账户中设置 Incident Manager。

我们建议您在开始 Incident Manager 做准备向导之前完成 Systems Manager 快速设置功能。使用 Systems Manager 快速设置功能以配置常用的 AWS 服务和特征,并提供建议的最佳实践。Incident Manager 使用 Systems Manager 特征来管理与 AWS 账户 相关的事件,并从首先配置的 Systems Manager 中受益。

准备向导

首次使用 Incident Manager 时,您可以从 Incident Manager 服务主页访问做准备向导。要在首次完成设置后访问做准备向导,请在事件列表页面上选择做准备

  1. 打开 Incident Manager 控制台

  2. 在 Incident Manager 服务主页上,选择做准备

常规设置
  1. 常规设置下,选择设置

  2. 通读条款和条件。如果您同意 Incident Manager 的条款和条件,请选择我已阅读并同意 Incident Manager 的条款和条件,然后选择下一步

  3. 区域区域中,您的当前 AWS 区域 显示为复制集中的第一个区域。要向您的复制集添加更多区域,请从区域列表中进行选择。

    我们建议包括至少两个区域。如果其中一个区域暂时不可用,与事件有关的活动仍可转到另一个区域。

    注意

    创建复制集可在账户中创建 AWSServiceRoleforIncidentManager 服务相关角色。要了解有关该角色的更多信息,请参阅 使用 Incident Manager 的服务相关角色

  4. 要为您的复制集设置加密,请执行以下操作之一:

    注意

    所有 Incident Manager 资源均加密。要了解有关您的数据如何加密的更多信息,请参阅 Incident Manager 中的数据保护。有关 Incident Manager 复制集的更多信息,请参阅 使用 Incident Manager 复制集

    • 要使用 AWS 自有密钥,请选择使用 AWS 自有密钥

    • 要使用自己的 AWS KMS 密钥,请选择选择现有 AWS KMS key。对于您在步骤 3 中选择的每个区域,请选择 AWS KMS 密钥或输入 AWS KMS Amazon 资源名称(ARN)。

      提示

      如果您没有可用的 AWS KMS key,请选择创建 AWS KMS key

  5. (可选)在标签区域,向复制集添加一个或多个标签。标签包括密钥和可选的值。

    标签是您分配给资源的可选元数据。标签可让您按不同的方式(如用途、拥有者或环境)对资源进行分类。有关更多信息,请参阅 在 Incident Manager 中标记资源

  6. (可选)在服务访问权限区域中,要激活调查发现特征,请选择为该帐户中的调查发现创建服务角色复选框。

    调查发现是指与事件创建时间相近的代码部署或基础设施变更的相关信息。可以将调查发现视为事件的潜在原因进行审查。有关这些潜在原因的信息已添加到事件的事件详细信息页面。由于有关这些部署和变更的信息随时可用,响应者无需手动搜索这些信息。

    提示

    要查看有关要创建的角色的信息,请选择查看权限

  7. 选择创建

    要了解有关复制集和故障恢复能力的更多信息,请参阅 韧性在 AWS Systems Manager Incident Manager

联系人(可选)
  1. 选择创建联系人

    Incident Manager 在事件期间与联系人互动。有关联系人的更多信息,请参阅 在 Incident Manager 中使用联系人

  2. 对于姓名,输入联系人的姓名。

  3. 对于唯一别名,输入别名以识别该联系人。

  4. 联系人渠道部分,请执行以下操作以定义事件期间与联系人的互动方式:

    1. 对于类型,选择电子邮件短信语音

    2. 对于渠道名称,输入有助于标识该渠道的唯一名称。

    3. 对于详细信息,输入联系人的电子邮件地址或电话号码。

      电话号码必须包含 9-15 个字符,并以 + 开头,然后是国家/地区代码和订阅用户号码。

    4. 要创建其他联系人渠道,请选择添加新的联系人渠道。我们建议为每位联系人至少定义两个渠道。

  5. 互动计划区域,请执行以下操作以定义通过哪些渠道通知联系人,以及通过每个渠道等待确认需要多长时间。选择用于在事件发生期间与联系人互动的联系人渠道。

    注意

    我们建议在互动计划中至少定义两个设备。

    1. 对于联系人渠道名称,选择您在联系人渠道区域中指定的渠道。

    2. 对于互动时间(分钟),输入与联系人渠道互动之前要等待的分钟数。

      我们建议您在互动开始时至少选择一个设备进行互动,并指定 0(零)分钟的等待时间。

    3. 要在互动计划中添加更多联系人渠道,请选择添加互动

  6. (可选)在标签区域,向联系人添加一个或多个标签。标签包括密钥和可选的值。

    标签是您分配给资源的可选元数据。标签可让您按不同的方式(如用途、拥有者或环境)对资源进行分类。有关更多信息,请参阅 在 Incident Manager 中标记资源

  7. 要创建联系人记录并向定义的联系人渠道发送激活码,请选择下一步

  8. (可选)在联系人渠道激活页面中,输入发送到每个渠道的激活码。

    如果您现在无法输入代码,则可以稍后再生成新的激活码。

  9. 重复第四步,直到将所有联系人添加到 Incident Manager。

  10. 输入所有联系人后,选择完成

(可选)上报计划
  1. 选择创建上报计划

    事件发生期间,上报计划会通过您的联系人进行上报,从而确保 Incident Manager 在事件发生期间与正确的响应者互动。有关上报计划的更多信息,请参阅 在 Incident Manager 中使用上报计划

  2. 对于名称,输入上报计划的唯一名称。

  3. 对于别名,输入唯一别名以帮助您识别上报计划。

  4. 第 1 阶段区域,执行以下操作:

    1. 对于上报渠道,请选择要互动的联系人渠道。

    2. 如果您希望联系人能够停止上报计划各阶段的进展,请选择确认停止计划进展

    3. 要向一个阶段添加更多渠道,请选择添加上报渠道

  5. 要在上报计划中创建新阶段,请选择添加阶段并添加其阶段详细信息。

  6. (可选)在标签区域,向上报计划添加一个或多个标签。标签包括密钥和可选的值。

    标签是您分配给资源的可选元数据。标签可让您按不同的方式(如用途、拥有者或环境)对资源进行分类。有关更多信息,请参阅 在 Incident Manager 中标记资源

  7. 选择创建上报计划

响应计划
  1. 选择创建响应计划。使用响应计划整理您创建的联系人和上报计划。在该开始使用向导中,以下部分为可选部分,特别是如果您是第一次制定响应计划:

    • 聊天通道

    • 运行手册

    • 互动

    • 第三方集成

    有关稍后将这些要素添加到响应计划的信息,请参阅 在 Incident Manager 中为事件做准备

  2. 对于名称,输入响应计划输入的唯一、可识别的名称。该名称用于创建响应计划 ARN 或在没有显示名称的响应计划中。

  3. (可选)对于显示名称,输入名称,以帮助您在创建事件时识别该响应计划。

  4. 对于标题,输入标题,以帮助识别与该响应计划相关的事件类型。您指定的值将包含在每个事件的标题中。标题中还会添加引发事件的警报或事件。

  5. 对于影响,选择您预期与该响应计划有关的事件的影响级别,例如 CriticalLow

  6. (可选)对于摘要,输入用于概述事件的简要说明。Incident Manager 会在事件发生期间自动将相关信息填入摘要中。

  7. (可选)对于重复数据删除字符串,输入重复数据删除字符串。Incident Manager 使用此字符串来防止相同的根本原因在同一个账户中创建多个事件。

    重复数据删除字符串是系统用来检查重复事件的术语或短语。如果您指定重复数据删除字符串,Incident Manager 会在创建事件时在 dedupeString 字段中搜索包含相同字符串的未解决事件。如果检测到重复事件,Incident Manager 会删除较新事件的重复数据到现有事件中。

    注意

    默认情况下,Incident Manager 会自动删除由同一 Amazon CloudWatch 警报或 Amazon EventBridge 事件创建的多个事件的重复数据。您无需输入自己的重复数据删除字符串即可防止这些资源类型出现重复。

  8. (可选)在标签区域,向响应计划添加一个或多个标签。标签包括密钥和可选的值。

    标签是您分配给资源的可选元数据。标签可让您按不同的方式(如用途、拥有者或环境)对资源进行分类。有关更多信息,请参阅 在 Incident Manager 中标记资源

  9. 互动下拉列表中选择要应用于事件的联系人和上报计划。

  10. 选择创建响应计划

创建响应计划后,您可以将 Amazon CloudWatch 警报或 Amazon EventBridge 事件与响应计划相关联。这将根据警报或事件自动创建事件。有关更多信息,请参阅 在 Incident Manager 中创建事件