PostgreSQL

注記

PostgreSQL コネクタは、2026 年 5 月 31 日まで、既存のお客様に対して完全にサポートされます。このコネクタは新しいユーザーには使用できなくなりましたが、現在のユーザーは中断することなく引き続き使用できます。コネクタポートフォリオは、よりスケーラブルでカスタマイズ可能なソリューションを提供するために継続的に進化しています。今後の統合のために、Amazon Kendra Custom Connector Framework[1] を検討することをお勧めします。このフレームワークは、柔軟性を高めながら、より広範なエンタープライズユースケースをサポートするように設計されています。

PostgreSQL は、オープンソースのデータベース管理システムです。PostgreSQL ユーザーの場合は、 Amazon Kendra を使用してPostgreSQLデータソースのインデックスを作成できます。データソースコネクタは Amazon Kendra PostgreSQL PostgreSQL 9.6 をサポートしています。

Amazon Kendra コンソールと TemplateConfiguration API を使用してPostgreSQLデータソース Amazon Kendra に接続できます。

データソースコネクタの Amazon Kendra PostgreSQLトラブルシューティングについては、「」を参照してくださいデータソースのトラブルシューティング。

サポートされている機能

フィールドマッピング
ユーザーコンテキストフィルタリング
包含/除外フィルター
完全および増分コンテンツ同期
仮想プライベートクラウド (VPC)

前提条件

を使用してPostgreSQLデータソース Amazon Kendra のインデックスを作成する前に、 PostgreSQLおよび AWS アカウントでこれらの変更を行います。

PostgreSQL で以下を確認してください。

データベースユーザー名とパスワードを記録済み。

重要
ベストプラクティスとして、 Amazon Kendra に読み取り専用データベース認証情報を指定します。
コピーしたデータベースのホスト URL、ポート、インスタンス。
各ドキュメントが PostgreSQL および同じインデックスを使用予定の他のデータソース間で一意であることが確認されていること。インデックスに使用する各データソースには、データソース全体に同じドキュメントが含まれていてはなりません。ドキュメント ID はインデックス全体に適用され、インデックスごとに一意である必要があります。

で AWS アカウント、以下があることを確認します。

Amazon Kendra インデックスを作成し、API を使用している場合はインデックス ID を記録しました。
データソースの IAM ロールを作成し、 API を使用している場合はロールの ARN を記録しました IAM 。

注記
認証タイプと認証情報を変更する場合は、 IAM ロールを更新して正しい AWS Secrets Manager シークレット ID にアクセスする必要があります。
PostgreSQL の認証情報を AWS Secrets Manager シークレットに保存し、API を使用している場合は、シークレットの ARN を記録済み。

注記
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。

既存の IAM ロールまたはシークレットがない場合は、コンソールを使用して、PostgreSQLデータソースを接続するときに新しい IAM ロールと Secrets Manager シークレットを作成できます Amazon Kendra。API を使用している場合は、既存の IAM ロールと Secrets Manager シークレットの ARN とインデックス ID を指定する必要があります。

接続手順

PostgreSQL データソース Amazon Kendra に接続するには、がデータ Amazon Kendra にアクセスできるように、PostgreSQL認証情報の詳細を指定する必要があります。をまだ設定していない場合は、PostgreSQL Amazon Kendra 「」を参照してください前提条件。

Console

Amazon Kendra に接続するには PostgreSQL

にサインイン AWS Management Console し、 Amazon Kendra コンソールを開きます。
左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。

注記
[インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。
[使用開始] ページで、[データソースを追加] を選択します。
データソースの追加ページで、PostgreSQLコネクタを選択し、コネクタの追加を選択します。バージョン 2 (該当する場合) を使用している場合は、「V2.0」タグが付いたPostgreSQLコネクタを選択します。
[データソースの詳細を指定] ページで、次の情報を入力します。
1. [名前と説明] の [データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。
2. (オプション) [説明] - オプションで、データソースの説明を入力します。
3. デフォルト言語 - インデックスのドキュメントをフィルタリングする言語を選択します。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。
4. タグで新しいタグを追加する - リソースを検索してフィルタリングしたり、 AWS コストを追跡したりするためのオプションのタグを含めます。
5. [次へ] を選択します。
[アクセスとセキュリティの定義] ページで、次の情報を入力します。
1. [ソース] には、次の情報を入力します。
2. [ホスト] - データベースのホスト名を入力します。
3. [ポート] - データベースのポートを入力します。
4. [インスタンス] - データベースインスタンスを入力します。
5. SSL 証明書の場所を有効にする — SSL 証明書ファイルへの Amazon S3 パスを入力する場合に選択します。
6. [認証] には、次の情報を入力します。
  1. AWS Secrets Manager secret — 既存のシークレットを選択するか、PostgreSQL新しい Secrets Manager シークレットを作成して認証情報を保存します。新しいシークレットの作成を選択すると、 AWS Secrets Manager シークレットウィンドウが開きます。
    1. [ AWS Secrets Manager シークレットウィンドウを作成] に次の情報を入力します。
      1. [シークレット名] - シークレットの名前。シークレット名に、プレフィックス「AmazonKendra-PostgreSQL-」が自動的に追加されます。
      2. [データベースユーザー名] と [パスワード] - データベースからコピーした認証情報の値を入力します。
    2. [保存] を選択します。
7. [仮想プライベートクラウド (VPC)] - VPC の使用を選択できます。選択する場合は、[サブネット] と [VPC セキュリティグループ] を追加する必要があります。
8. IAM role — 既存の IAM ロールを選択するか、新しい IAM ロールを作成してリポジトリの認証情報とインデックスコンテンツにアクセスします。
  
  注記
  IAM インデックスに使用されるロールは、データソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。
9. [次へ] を選択します。
[同期設定の構成] ページで、次の情報を入力します。
1. [同期の範囲] で、次のオプションから選択します。
  - [SQL クエリ] - SELECT や JOIN オペレーションなどの SQL クエリステートメントを入力します。SQL クエリは 32 KB 未満にする必要があります。 Amazon Kendra はクエリに一致するすべてのデータベースコンテンツをクロールします。
  - [プライマリキー列] - データベーステーブルのプライマリキーを指定します。これにより、データベース内のテーブルが識別されます。
  - [タイトル列] - データベーステーブル内のドキュメントタイトル列の名前を指定します。
  - 本文列 — データベーステーブル内のドキュメント本文列の名前を指定します。
2. [その他の設定 - オプション] で、すべてのファイルを同期する代わりに特定のコンテンツを同期するには、次のオプションから選択します。
  - 変更検出列 — コンテンツの変更を検出 Amazon Kendra するために使用する列の名前を入力します。これらの列のいずれかに変更があると、はコンテンツのインデックスを再 Amazon Kendra 作成します。
  - [ユーザー ID 列] - コンテンツへのアクセスを許可するユーザー ID を含む列の名前を入力します。
  - [グループ列] - コンテンツへのアクセスを許可するグループを含む列の名前を入力します。
  - [ソース URL 列] - インデックスを作成するソース URL を含む列の名前を入力します。
  - タイムスタンプ列 - タイムスタンプを含む列の名前を入力します。は、タイムスタンプ情報 Amazon Kendra を使用してコンテンツの変更を検出し、変更されたコンテンツのみを同期します。
  - [タイムゾーン列] - クロールするコンテンツのタイムゾーンを含む列の名前を入力します。
  - [タイムスタンプの形式] - コンテンツの変更を検出してコンテンツを再同期するために使用するタイムスタンプの形式を含む列の名前を入力します。
3. [同期モード] - データソースのコンテンツが変更されたときのインデックスの更新方法を選択します。データソースを Amazon Kendra と初めて同期すると、デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとして完全同期を選択しなくても、最初の同期が失敗した場合は、データの完全同期を実行する必要があります。
  - 完全同期: すべてのコンテンツを新しくインデックス化し、データソースがインデックスと同期するたびに既存のコンテンツを置き換えます。
  - 新しい、変更された同期: データソースがインデックスと同期するたびに、新しいコンテンツと変更されたコンテンツのインデックスのみを作成します。 Amazon Kendra は、データソースのメカニズムを使用して、コンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツのインデックスを作成できます。
  - 新規、変更、削除された同期: データソースがインデックスと同期するたびに、新規、変更、削除されたコンテンツのインデックスのみを作成します。 Amazon Kendra は、データソースのメカニズムを使用して、前回の同期以降に変更されたコンテンツの変更とインデックスコンテンツを追跡できます。
4. [同期実行スケジュール] の [頻度] - Amazon Kendra がデータソースと同期する頻度。
5. [次へ] を選択します。
[フィールドマッピングを設定] ページで、次の情報を入力します。
1. Amazon Kendra インデックスにマッピングするドキュメント IDs、ドキュメントタイトル、ソース URLsなど、生成されたデフォルトのデータソースフィールドから選択します。
2. [フィールドを追加] - カスタムデータソースフィールドを追加して、マッピング先のインデックスフィールド名とフィールドデータタイプを作成します。
3. [次へ] を選択します。
[確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。

API

Amazon Kendra に接続するには PostgreSQL

TemplateConfiguration API を使用して、以下を指定する必要があります。

データソース — JSON スキーマJDBCを使用する場合、データソースタイプを TemplateConfiguration として指定します。また、 CreateDataSource API を呼び出すTEMPLATEときにデータソースをとして指定します。
データベースタイプ - データベースタイプを postgresql として指定する必要があります。
SQL クエリ — SELECT オペレーションや JOIN オペレーションなどの SQL クエリステートメントを指定します。SQL クエリは 32 KB 未満にする必要があります。 Amazon Kendra はクエリに一致するすべてのデータベースコンテンツをクロールします。
同期モード — データソースコンテンツが変更されたときに Amazon Kendra がインデックスを更新する方法を指定します。データソースをと Amazon Kendra 初めて同期すると、デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとして完全同期を選択しなくても、最初の同期が失敗した場合は、データの完全同期を実行する必要があります。以下のいずれかから選択できます。
- FORCED_FULL_CRAWL は、すべてのコンテンツの新しいインデックスを作成し、データソースがインデックスと同期するたびに既存のコンテンツを置き換えます。
- FULL_CRAWL は、データソースがインデックスと同期するたびに、新規、変更、削除されたコンテンツのインデックスのみを作成します。 Amazon Kendra は、データソースのメカニズムを使用して、コンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツのインデックスを作成できます。
- CHANGE_LOG は、データソースがインデックスと同期するたびに、新規および変更されたコンテンツのみをインデックス化します。 Amazon Kendra は、データソースのメカニズムを使用して、コンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツのインデックスを作成できます。
シークレット Amazon リソースネーム (ARN) — PostgreSQLアカウントで作成した認証情報を含む Secrets Manager シークレットの Amazon リソースネーム (ARN) を指定します。シークレットは、次のキーを含む JSON 構造に保存されます。
```
{
    "user name": "database user name",
    "password": "password"
}
```
注記
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。
IAM role — を呼び出しCreateDataSourceて、シー Secrets Manager クレットにアクセスするためのアクセス許可を IAM ロールに提供し、PostgreSQLコネクタとに必要なパブリック APIsを呼び出すRoleArnタイミングを指定します Amazon Kendra。詳細については、「IAM roles for PostgreSQL data sources」を参照してください。

オプションで、次の機能を追加することもできます。

[仮想プライベートクラウド (VPC)] - VpcConfiguration で CreateDataSource を呼び出すタイミングを指定します。詳細については、「を使用する Amazon Kendra ようにを設定する Amazon VPC」を参照してください。
包含フィルターと除外フィルター - ユーザー ID、グループ、ソース URL、タイムスタンプ、タイムゾーンを使用して、特定のコンテンツを含めるかどうかを指定できます。
ユーザーコンテキストのフィルタリングとアクセスコントロール —Amazon Kendra ドキュメントの ACL がある場合は、ドキュメントのアクセスコントロールリスト (ACL) をクロールします。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。
フィールドマッピング - 選択すると、PostgreSQL データソースフィールドを Amazon Kendra インデックスフィールドにマッピングします。詳細については、「データソースフィールドのマッピング」を参照してください。

注記
がドキュメント Amazon Kendra を検索するには、ドキュメント本文フィールドまたはドキュメントに対応するドキュメント本文が必要です。データソースのドキュメント本文フィールド名をインデックスフィールド名にマッピングする必要があります_document_body。その他のすべてのフィールドはオプションです。

設定が必要なその他の重要な JSON キーのリストについての詳細は、「PostgreSQL テンプレートスキーマ」を参照してください。

メモ

が更新されたコンテンツ Amazon Kendra をチェックする場合、削除されたデータベース行はで追跡されません。
データベースの 1 行のフィールド名と値のサイズは 400 KB を超えることはできません。
データベースデータソースに大量のデータがあり、最初の同期後にすべてのデータベースコンテンツの Amazon Kendra インデックスを作成しない場合は、新規、変更、または削除されたドキュメントのみを同期できます。
ベストプラクティスとして、 Amazon Kendra に読み取り専用データベース認証情報を指定します。
ベストプラクティスとして、機密データや個人を特定できる情報 (PII) を含むテーブルを追加することは避けてください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

Oracle Database

Quip