翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データソースコネクタの作成
のデータソースコネクタを作成できます。 Amazon Kendra ドキュメントに接続し、インデックスを作成します。 Amazon Kendra は、Microsoft SharePoint、Google Drive、およびその他の多くのプロバイダーに接続できます。データソースコネクタを作成するときは、 Amazon Kendra ソースリポジトリへの接続に必要な構成情報。ドキュメントをインデックスに直接追加する場合とは異なり、データソースを定期的にスキャンしてインデックスを更新できます。
例えば、 に保存されている税務書類のリポジトリがあるとします。 Amazon S3 バケット。ときどき、既存のドキュメントが変更され、新しいドキュメントが随時リポジトリに追加されます。リポジトリを に追加した場合 Amazon Kendra データソースとして、データソースとインデックス間の定期的な同期を設定することで、インデックスを最新の状態に保つことができます。
コンソールまたは を使用して、インデックスを手動で更新できますStartDataSourceSyncJobAPI。それ以外の場合は、インデックスを更新してデータソースと同期させるスケジュールを設定します。
インデックスには複数のデータソースを使用できます。各データソースには、独自の更新スケジュールを設定できます。例えば、アーカイブが変更されるたびに、アーカイブされたドキュメントを手動で更新しながら、作業中のドキュメントのインデックスを毎日更新したり、時間ごとに更新したりできます。
ドキュメントの取り込みプロセス中にドキュメントのメタデータまたは属性とコンテンツを変更する場合は、「」を参照してください。 Amazon Kendra カスタムドキュメントエンリッチメント 。
注記
各ドキュメント ID はインデックスごとに一意である必要があります。データソースを作成してドキュメントに一意のインデックスを付けIDs、 を使用して同じドキュメントにBatchPutDocument
APIインデックスを付けることはできません。その逆も同様です。データソースを削除し、 を使用して同じドキュメントのBatchPutDocument
APIインデックスを作成することも、その逆を実行することもできます。BatchPutDocument
と BatchDeleteDocument
APIsを と組み合わせて使用する Amazon Kendra 同じドキュメントセットのデータソースコネクタは、データとの不整合を引き起こす可能性があります。代わりに、 を使用することをお勧めします。 Amazon Kendra カスタムデータソースコネクタ 。
注記
インデックスに追加されるファイルは、UTF-8 でエンコードされたバイトストリームにある必要があります。のドキュメントの詳細については、「」を参照してください。 Amazon Kendra、「 ドキュメント」を参照してください。
更新スケジュールの設定
データソースを作成または更新するときに、コンソールか、または Schedule
パラメータを使用して、データソースを定期的に更新するように構成します。パラメータの内容は、cron
形式スケジュール文字列、またはインデックスをオンデマンドで更新することを示す空の文字列のいずれかを保持する文字列です。cron 式の形式については、「」の「ルールのスケジュール式」を参照してください。 Amazon CloudWatch Events ユーザーガイド。 Amazon Kendra は cron 式のみをサポートします。rate 式はサポートしていません。
言語設定
サポートされている言語で、データソース内のすべてのドキュメントにインデックスを作成できます。を呼び出すときに、データソース内のすべてのドキュメントの言語コードを指定しますCreateDataSource。ドキュメントにメタデータフィールドで指定された言語コードがない場合、データソースレベルですべてのドキュメントに指定された言語コードを使用して、ドキュメントのインデックスが作成されます。言語を指定しない場合は、 Amazon Kendra デフォルトでは、 はデータソース内のドキュメントを英語でインデックス化します。コードを含む、サポートされている言語の詳細については、英語以外の言語でドキュメントを追加するを参照してください。
コンソールを使用するサポートされている言語で、データソース内のすべてのドキュメントにインデックスを作成できます。新しいデータソースを追加する場合、[データソース] に移動してデータソースを編集するか、[データソースを追加] します。[Specify data source details] (データソースの詳細を指定) ページで、[Language] (言語) のドロップダウンから言語を選択します。Update (更新) を選択するか、続けて構成情報を入力してデータソースに接続します。