删除数据来源 - Amazon Kendra

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

删除数据来源

如果要从 Amazon Kendra 索引中移除数据来源中包含的信息,则可以删除该数据来源。例如,在以下情况下删除数据来源:

  • 数据来源配置不正确。删除数据来源,等待数据来源完成删除,然后重新创建。

  • 您将文档从一个数据来源迁移到另一个数据来源。删除原始数据来源并在新位置重新创建。

  • 您已达到索引的数据来源数限制。删除一个现有数据来源并添加一个新数据来源。有关可创建的数据来源数量的更多信息,请参阅配额

要删除数据来源,请使用控制台、AWS Command Line Interface (AWS CLI)、DeleteDataSource API 或 AWS CloudFormation 脚本。删除数据来源会从索引中移除有关该数据来源的所有信息。如果您只想停止同步数据来源,请将数据来源的同步计划更改为“按需运行”。

删除数据来源是一项异步操作。开始删除数据来源时,数据来源状态将更改为 DELETING。在删除与数据来源相关的信息之前,它一直处于 DELETING 状态。删除数据来源后,该数据来源将不再出现在调用 ListDataSources 的结果中。如果您使用已删除数据来源的标识符调用 DescribeDataSource API,则会收到 ResourceNotFound 异常。

注意

从数据来源中删除特定文档后,删除整个数据来源或重新同步索引可能需要一小时或更长时间,具体取决于要删除的文档数量。

删除数据来源(控制台)
  1. 登录到 AWS Management Console,然后通过以下网址打开 Amazon Kendra 控制台:https://console.aws.amazon.com/kendra/

  2. 在导航窗格中,选择索引,然后选择包含要删除的数据来源的索引。

  3. 在导航窗格中,选择 Data sources(数据来源)。

  4. 选择要移除的数据来源。

  5. 选择删除以删除数据来源。

删除数据来源 (CLI)
  • 在 AWS Command Line Interface 中,使用下列命令。该命令针对 Linux 和 macOS 编排了格式。如果您使用 Windows,请将 Unix 行继续符 (\) 替换为脱字号 (^)。

    aws kendra delete-data-source \ --id data-source-id \ --index-id index-id

删除数据来源时,Amazon Kendra 会删除有关该数据来源的所有存储信息。Amazon Kendra 会移除索引中存储的所有文档数据,以及与数据来源关联的所有运行历史记录和指标。删除数据来源并不会从存储中移除原始文档。

当 Amazon Kendra 删除数据来源时,数据来源中的文档可能会包含在 DescribeIndex API 返回的文档数量中。当 Amazon Kendra 删除数据来源时,数据来源中的文档可能会出现在搜索结果中。

只要在控制台中调用 DeleteDataSource API 或选择删除数据来源,Amazon Kendra 就会立即释放该数据来源的资源。如果您要删除数据来源以将数据来源数量减少到限制以下,则可以立即创建新的数据来源。

如果您要删除一个数据来源,然后为该文档数据创建另一个数据来源,请等待第一个数据来源删除完成,然后同步新的数据来源。

您可以删除正在与 Amazon Kendra 同步的数据来源。同步已停止,数据来源已删除。如果在删除数据来源时尝试启动同步,则会出现 ConflictException 异常。

如果关联的索引处于 DELETING 状态,则无法删除数据来源。如果删除索引,则会删除该索引的所有数据来源。当索引的数据来源处于 DELETING 状态时,您可以开始删除该索引。

如果您有两个数据来源指向相同的文档,例如,两个数据来源指向同一个 Amazon S3 存储桶,则删除其中一个数据来源时,索引中的文档可能会出现不一致。当两个数据来源引用相同的文档时,索引中仅存储文档数据的一个副本。移除一个数据来源会移除文档的索引数据。另一个数据来源不知道这些文档已删除,因此,在下次同步时,Amazon Kendra 无法正确地重新为文档编制索引。当有两个数据来源指向同一个文档位置时,您应删除这两个数据来源,然后重新创建一个数据来源。