疑難排解資料來 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

疑難排解資料來

本節可協助您解決設定和使用 Amazon Kendra 資料來源連接器時的常見問題。

我的文件沒有編製索引

當您將索 Amazon Kendra 引與資料來源同步處理時,可能會遇到阻止文件編製索引的問題。索引是一個兩個步驟的過程。首先,檢查資料來源是否有要建立索引的新文件和更新文件,並尋找要從索引中移除的文件。其次,在文檔級別,每個文檔被訪問和索引。

在這些步驟之一中都可能發生錯誤。資料來源詳細資料頁面的 [同步執行歷程記錄] 區段的主控台中會報告資料來源層級錯誤。同步化工作的狀態可以是「成」、「未成」或「失敗」。您也可以查看工作期間編製索引和刪除的文件數目。如果狀態為「失敗」,則「詳細資料」欄中會顯示訊息。

在中報告文件層級錯誤 Amazon CloudWatch Logs。你可以使用 CloudWatch 控制台看到錯誤。

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我的同步工作失敗

當索引或資料來源中發生組態錯誤時,同步化工作通常會失敗。在主控台中,您可以在資料來源詳細資料頁面的 [詳細資料] 欄下的 [同步執行歷程記錄] 區段中找到錯誤訊息。在中報告文件層級錯誤 Amazon CloudWatch Logs。錯誤消息提供了有關出錯的信息。問題通常是索引或資料來源沒有適當的 IAM 權限。錯誤訊息會描述遺失的權限。以下是您可以收到的一些錯誤訊息:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

如果您的索引角色沒有使用權限 CloudWatch,則資料來源將無法建立 CloudWatch 記錄檔。如果您收到這個錯誤,您必須新增索引角色的 CloudWatch 權限。

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

使用 Amazon S3 資料來源時, Amazon Kendra 必須具有存取包含文件之值區的權限。您需要新增權限,才 Amazon Kendra 能將值區讀取至資料來源 IAM 角色。

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra 需要具有索引和資料來源 IAM 角色的權限。您需要將信任原則新增至具有sts:AssumeRole動作權限的角色。

有關 Amazon Kendra 需要為資料來源編製索引的 IAM 策略,請參閱IAM 角色

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我的同步工作不完整

工作通常在完成資料來源層級程序後不完整,但在文件層級處理期間出現一些錯誤。當工作不完整時,某些文件可能未成功編製索引。對於 Amazon S3 資料來源,不完整的工作通常是由下列原因造成的:

  • 一或多個文件的中繼資料無效。

  • 提交文件進行索引,但至少有一份文件未提交時。

  • 提交要從索引中刪除的文件,但至少有一份文件未提交時。

若要疑難排解不完整的同步處理工作,請先查看您的 CloudWatch 記錄檔。

  1. 從詳細資訊欄中,選擇檢視詳細資料於 CloudWatch

  2. 檢閱錯誤訊息以查看導致文件失敗的原因。

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我的同步處理工作成功,但沒有編製索引的文件

有時候,索引同步處理工作執行會標示為「成功」,但沒有新文件或更新的文件在您預期的情況下編製索引。可能的原因包括:

  • 檢查 CloudWatch DocumentsSubmittedForIndexingFailed量度以查看是否有任何文件無法同步處理。如需詳細資訊,請檢查 CloudWatch 記錄。

  • 對於資 Amazon S3 料來源,您可能提供了錯誤 Amazon Kendra 的值區名稱或前置詞。請確定正在使用的值區 Amazon Kendra 是包含要編製索引之文件的值區。

  • 重新索引未能在較早的工作中建立索引的文件時,除非您已變更文件或其關聯的中繼資料檔案,否則 Amazon Kendra 不會對其建立索引。

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我在同步資料來源時遇到檔案格式問題

如果您在將檔案新增至資料來源或同步資料來源時遇到檔案格式問題,請確定 Amazon Kendra 支援您的文件類型。如需支援的文件類型清單, Amazon Kendra 請參閱文件類型或格式

如果您將 BatchPutDocument API 與純文字檔案搭配使用,請指定PLAIN_TEXT為內容類型。

我想要為我的文件產生同步記錄報告

同步資 Amazon Kendra 料來源連接器時, Amazon Kendra 可以為資料來源中的每個文件產生同步狀態報告,並將其複製到 Amazon S3 值區。在此過程中,您的數據使用密 AWS KMS 鑰進行加密,並且只能由您查看。報告的文件狀態可以是下列其中一種:「失敗」、「已完成」或「成功但有錯誤」。

您必須先執行下列動作,才能產生同步狀態報告:

  • 將下列 Amazon Kendra 服務主體新增至您的 Amazon S3 存取原則

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • 建立具有 Amazon S3 存取權限的值區 Amazon Kendra

如果您使用主控台,若要產生同步狀態報告,請從 [資料來源詳細資料] 頁面選擇啟動同步歷史記錄產生選項。然後,輸入 Amazon S3 值區位置,並從可用的配置選項中進行選擇。啟動產生報告後,將從下次同步處理產生報告。

如果刪除 Amazon S3 值區,您將遺失記錄資料,而且必須設定新值區才能儲存新的同步報告。

目前支援Amazon S3 連接器的產生同步報告狀態。

同步資料來源需要多少時間?

如果文件沒有更新, Amazon Kendra 索引的同步時間會隨文件數目成線性比例增加。例如,1,000 份沒有任何更新的文件大約需要 5 分鐘才能同步處理,而 2,000 份文件而沒有任何更新則大約需要 10 分鐘。如果文件有任何更新,則同步時間會根據更新的文件數量而增加。

同步資料來源的費用為何?

當您同步索引時,需要兩分鐘的時間來預熱並啟動, Amazon EC2 以建立必要的連線。在此過程中,您不會收取任何費用。您的使用量計量器只會在同步工作開始後開始。如需 Amazon Kendra 定價的詳細資訊,請參閱Amazon Kendra 定價

我收到 Amazon EC2 授權錯誤

如果在同步虛擬私有雲 (VPC) 資料來源期間發生 Amazon EC2 未經授權的作業錯誤,則可能是您的 VPC IAM 角色缺少必要的權限。請檢查您用於資料來源的 IAM 角色是否具有附加的權限。如需詳細資訊,請參閱虛擬私有雲 IAM 角色

您的 Amazon Kendra 索引只能存取 Amazon S3 資料來源授予其存取權限的檔案。例如, Amazon Kendra 無法修改決 Amazon S3 定物件應為公用還是加密的權限。 Amazon Kendra 也沒有為 Amazon S3 物件建立或傳回已簽署連結的預設權限。如果您想要啟動 Amazon Kendra 索引中 Amazon S3 物件的已簽署連結,您有兩個選項:

  • 在將結果傳回至搜尋頁面之前,您可以使用來源 uri 物件來簽署索引查詢結果。如需此程序的 step-by-step逐步解說,請參閱使用預先簽署的 URL 共用物件

  • 您可以覆寫 Amazon S3 物件中繼資料來源 uri,並透過連線至 Amazon S3 值區的 CloudFront 內容傳遞網路 (CDN) 提供服務。或者,您可以使用 API Gateway 代理端點返回預先簽署的 URL 並重定向到該端點。

我收到「使用 SSL 憑證檔案AccessDenied 時」錯誤訊息

如果您在將 SSL 憑證與資料來源搭配使用時遇到存取遭拒的錯誤,請確定您的 IAM 角色具有存取其指定位置中的 SSL 憑證檔案的權限。如果憑證使用 AWS KMS 金鑰加密,您的 IAM 角色也應具有使用 AWS KMS 金鑰解密的權限。如需詳細資訊,請參閱的驗證和存取控制 AWS KMS

我在使用 SharePoint 資料來源時收到授權錯誤

如果您在同步索引與 SharePoint 資料來源時收到授權錯誤,請確認您在中指派了網站管理員角色 SharePoint。

我的索引不會從我的匯合資料來源抓取文件

如果您的 Amazon Kendra 索引未在同步處理過程中從 Confluence 資料來源探索文件,請確認您是 Confluence 中的系統管理員群組的一部分。