データソースのトラブルシューティング - Amazon Kendra

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データソースのトラブルシューティング

このセクションは、 Amazon Kendra データソースコネクタを設定して使用するときによくある問題の解決に役立ちます。

マイドキュメントにインデックスが作成されませんでした

Amazon Kendra インデックスをデータソースと同期すると、ドキュメントのインデックス作成を妨げる問題が発生する可能性があります。インデックス作成は 2 ステップのプロセスです。まず、データソースは、インデックスを作成する新しいドキュメントと更新されたドキュメントを確認し、インデックスから削除する文書を検出します。次に、ドキュメントレベルで各ドキュメントにアクセスし、インデックスが付けられます。

次のいずれかのステップでエラーが発生する可能性があります。データソースレベルのエラーは、データソースの詳細ページの [Sync run history] (実行履歴を同期) セクションのコンソールに報告されます。同期ジョブのステータスは、[Succeeded] (成功)、[Incomplete] (不完全)、または [Failed] (失敗) になります。ジョブ中にインデックス作成され、削除されたドキュメントの数も確認できます。ステータスが [Failed] (失敗) の場合、メッセージが [Details] (詳細) 列で表示されます。

ドキュメントレベルのエラーはで報告されます。 Amazon CloudWatch Logs CloudWatch コンソールを使用してエラーを確認できます。

ドキュメント同期ステータスレポートを生成するには、「ドキュメントの同期ステータスレポートを生成したい」を参照してください。

同期ジョブが失敗しました

同期ジョブは通常、インデックスまたはデータソースの構成エラーがある場合に失敗します。コンソールで、データソースの詳細ページの [詳細] 列の [実行履歴を同期] セクションにエラーメッセージが表示されます。ドキュメントレベルのエラーは、 Amazon CloudWatch Logsで報告されます。エラーメッセージには、問題点に関する情報が表示されます。問題は通常、 IAM インデックスまたはデータソースに適切な権限がないことです。エラーメッセージには、欠落しているアクセス許可が示されます。受け取る可能性のあるエラーメッセージをいくつか以下に示します。

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

インデックスロールに使用権限がない場合 CloudWatch、 CloudWatch データソースはログを作成できません。このエラーが発生した場合は、 CloudWatch インデックスロールに権限を追加する必要があります。

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

Amazon S3 データソースを使用するときは、 Amazon Kendra ドキュメントを含むバケットにアクセスする権限が必要です。 Amazon Kendra IAM バケットを読み取る権限をデータソースロールに追加する必要があります。

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra IAM インデックスロールとデータソースロールを引き受ける権限が必要です。sts:AssumeRole アクションの許可を持つロールに信頼ポリシーを追加する必要があります。

IAM Amazon Kendra データソースのインデックスを作成する必要があるポリシーについては、「IAM ロール」を参照してください。

ドキュメント同期ステータスレポートを生成するには、「ドキュメントの同期ステータスレポートを生成したい」を参照してください。

同期ジョブが不完全です

通常、ジョブは、データソースレベルのプロセスを完了したが、ドキュメントレベルのプロセス中に何らかのエラーが発生した場合、不完全になります。ジョブが不完全な場合、ドキュメントの一部で正常にインデックスが作成されていない可能性があります。 Amazon S3 データソースの場合、不完全なジョブは通常、次の原因によって引き起こされます。

  • 1 つまたは複数のドキュメントのメタデータが無効だった。

  • インデックス作成のためにドキュメントが送信されたが、少なくとも 1 つのドキュメントが送信されなかった場合。

  • インデックスから削除するドキュメントが送信されたが、少なくとも 1 つのドキュメントが送信されなかった場合。

不完全な同期ジョブのトラブルシューティングを行うには、 CloudWatch まずログを調べてください。

  1. 詳細列から [詳細を表示] を選択します。 CloudWatch

  2. エラーメッセージを確認して、ドキュメントが失敗した原因を確認します。

ドキュメント同期ステータスレポートを生成するには、「ドキュメントの同期ステータスレポートを生成したい」を参照してください。

同期ジョブは成功しましたが、インデックス付きドキュメントがありません

場合によっては、インデックス同期ジョブが [成功] とマークされていても、想定したときに新しいドキュメントや更新されたドキュメントでインデックスが作成されていないことがあります。考えられる理由は以下のとおりです。

  • CloudWatch DocumentsSubmittedForIndexingFailedメトリクスをチェックして、同期に失敗したドキュメントがないか確認します。 CloudWatch 詳細についてはログを確認してください。

  • Amazon S3 データソースには、 Amazon Kendra 間違ったバケット名またはプレフィックスを指定した可能性があります。使用しているバケットが、インデックスを作成するドキュメントを含むバケットであることを確認してください。 Amazon Kendra

  • 以前のジョブでインデックス作成に失敗したドキュメントのインデックスを再作成する場合、 Amazon Kendra はドキュメントまたは関連するメタデータファイルを変更しない限り、そのドキュメントのインデックスを作成しません。

ドキュメント同期ステータスレポートを生成するには、「ドキュメントの同期ステータスレポートを生成したい」を参照してください。

データソースの同期中にファイル形式の問題が発生しました。

データソースへのファイルの追加、またはデータソースの同期中にファイル形式の問題が発生した場合は、使用しているドキュメントタイプで Amazon Kendra がサポートされていることを確認してください。サポートされているドキュメントタイプのリストについては、 Amazon Kendra 「ドキュメントタイプまたはフォーマット」を参照してください。

プレーンテキストファイルで BatchPutDocument API を使用する場合は、PLAIN_TEXT をコンテンツタイプとして指定してください。

ドキュメントの同期履歴レポートを生成したい

Amazon Kendra データソースコネクタを同期すると、データソース内の各ドキュメントの同期ステータスレポートを生成し、 Amazon Kendra Amazon S3 バケットにコピーできます。このプロセス中、データは AWS KMS キーを使用して暗号化され、ユーザーだけが表示できます。報告されたドキュメントのステータスは、[失敗][完了]、または [成功 (エラーあり)] のいずれかになります。

同期ステータスレポートを生成する前に、次の操作を行う必要があります。

  • Amazon Kendra Amazon S3 次のサービスプリンシパルをアクセスポリシーに追加します。

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • Amazon S3 以下のアクセス権限を持つバケットを作成します。 Amazon Kendra

コンソールを使用して同期ステータスレポートを生成する場合は、[データソースの詳細] ページから [同期履歴の生成] オプションの有効化を選択します。次に、 Amazon S3 バケットの場所を入力し、使用可能な設定オプションから選択します。レポート生成を有効にすると、次回の同期からレポートが生成されます。

Amazon S3 バケットを削除するとログデータが失われるため、新しい同期レポートを保存する新しいバケットを設定する必要があります。

現在、同期レポートのステータス生成は Amazon S3 コネクタのみサポートされています。

データソースの同期にはどのくらいの時間がかかりますか?

ドキュメントが更新されていない場合、 Amazon Kendra インデックスの同期時間はドキュメントの数に比例して増加します。例えば、更新されていない 1,000 件のドキュメントの同期には約 5 分かかり、更新されていない 2,000 件のドキュメントの同期には約 10 分かかります。ドキュメントが更新されると、更新されたドキュメントの数に応じて同期時間が長くなります。

データソースの同期にかかる料金はいくらですか?

インデックスを同期すると、ウォームアップして必要な接続が確立されるまで 2 分かかります。 Amazon EC2 この処理中は課金されません。使用量の計測は、同期ジョブが開始してから開始されます。 Amazon Kendra 料金の詳細については、「Amazon Kendra 価格設定」を参照してください。

Amazon EC2 認証エラーが発生します。

仮想プライベートクラウド (VPC) Amazon EC2 データソースの同期中に不正操作エラーが発生した場合、VPC IAM ロールには必要な権限がない可能性があります。 IAM データソースに使用するロールに権限が付与されていることを確認してください。詳細については、「IAM 仮想プライベートクラウドの役割」を参照してください。

Amazon Kendra インデックスは、 Amazon S3 データソースからアクセス権限を付与されたファイルにのみアクセスできます。たとえば、 Amazon Kendra Amazon S3 オブジェクトをパブリックにするか暗号化するかを決定する権限は変更できません。 Amazon Kendra また、 Amazon S3 オブジェクトの署名付きリンクを作成または返すためのデフォルトの権限もありません。 Amazon S3 Amazon Kendra インデックス内のオブジェクトに対して署名付きリンクを有効にする場合は、次の 2 つの方法があります。

  • 検索ページに結果を返す前に、ソース URI オブジェクトでインデックスクエリの結果に署名できます。 step-by-stepこのプロセスの手順については、「署名付き URL を使ったオブジェクトの共有」を参照してください。

  • Amazon S3 オブジェクトメタデータのソース URI をオーバーライドして、 CloudFront バケットに接続されたコンテンツ配信ネットワーク (CDN) を通じてサービスを利用できるようにすることができます。 Amazon S3 または、署名済み URL API Gateway を返してリダイレクトするプロキシエンドポイントを使用することもできます。

SSL AccessDenied 証明書ファイル使用時」というエラーメッセージが表示されます。

データソースで SSL 証明書を使用しているときにアクセス拒否エラーが発生する場合は、指定した場所にある SSL IAM 証明書ファイルにアクセスする権限がロールに付与されていることを確認してください。証明書がキーで暗号化されている場合、 AWS KMS IAM そのキーを使用して復号化する権限もロールに付与する必要があります。 AWS KMS 詳細については、「 AWS KMSに対する認証とアクセスコントロール」を参照してください。

データソースを使用すると認証エラーが発生します。 SharePoint

SharePoint インデックスをデータソースと同期しているときに認証エラーが発生する場合は、にサイト管理者ロールが割り当てられていることを確認してください。 SharePoint

インデックスが Confluence データソースからのドキュメントにクロールされません

Amazon Kendra 同期処理中にインデックスが Confluence データソースからドキュメントをクロールしていない場合は、自分が Confluence の管理者グループに属していることを確認してください。