翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Gmail
Gmail は Google が開発した E メールクライアントで、添付ファイル付きのメールメッセージを送信できます。Gmail のメッセージは、フォルダやラベルを使用して E メールの受信トレイ内で分類して保存できます。を使用して Amazon Kendra 、E メールメッセージとメッセージ添付ファイルのインデックスを作成できます。インデックス作成のために、特定の E メールメッセージ、メッセージ添付ファイル、ラベルを含めるか除外 Amazon Kendra するように を設定することもできます。
Amazon Kendra コンソールと TemplateConfiguration API を使用して Gmail データソース Amazon Kendra に接続できます。
Amazon Kendra Gmail データソースコネクタのトラブルシューティングについては、「」を参照してくださいデータソースのトラブルシューティング。
サポートされている機能
-
フィールドマッピング
-
ユーザーアクセスコントロール
-
包含/除外フィルター
-
完全および増分コンテンツ同期
-
仮想プライベートクラウド (VPC)
前提条件
を使用して Gmail データソース Amazon Kendra のインデックスを作成する前に、Gmail と AWS アカウントでこれらの変更を行います。
Gmail で以下を確認してください。
-
Google Cloud Platform の管理者アカウントを作成し、Google Cloud プロジェクトを作成しました。
-
管理者アカウントで Gmail API と管理者 SDK API を有効にしました。
-
サービスアカウントを作成し、Gmail の JSON プライベートキーをダウンロードしました。プライベートキーを作成してアクセスする方法については、Google Cloud のドキュメントの「サービスアカウントキーの作成方法」と「サービスアカウントの認証情報」を参照してください。
-
管理者アカウントの E メール、サービスアカウントの E メール、プライベートキーをコピーして、認証情報として使用しました。
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。
-
ユーザーおよびインデックスを作成する共有ディレクトリに、次の OAuth スコープ (管理者ロールを使用) を追加しました。
-
各ドキュメントが Gmail および同じインデックスを使用予定の他のデータソース間で一意であることを確認しました。インデックスに使用する各データソースには、データソース全体に同じドキュメントが含まれていてはなりません。ドキュメント ID はインデックス全体に適用され、インデックスごとに一意である必要があります。
で AWS アカウント、以下があることを確認します。
-
Amazon Kendra インデックスを作成し、API を使用している場合はインデックス ID を記録しました。
-
データソースの IAM ロールを作成し、 API を使用している場合は、 IAM ロールの ARN を記録しました。
認証タイプと認証情報を変更する場合は、 IAM ロールを更新して正しい AWS Secrets Manager シークレット ID にアクセスする必要があります。
-
Gmail の認証情報を AWS Secrets Manager シークレットに保存し、API を使用している場合は、シークレットの ARN を記録済み。
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。
既存の IAM ロールまたはシークレットがない場合は、Gmail データソースを に接続するときに、コンソールを使用して新しい IAM ロールと Secrets Manager シークレットを作成できます Amazon Kendra。API を使用している場合は、既存の IAM ロールと Secrets Manager シークレットの ARN とインデックス ID を指定する必要があります。
接続手順
Gmail データソース Amazon Kendra に接続するには、 がデータ Amazon Kendra にアクセスできるように Gmail 認証情報の詳細を指定する必要があります。に Gmail をまだ設定していない場合は Amazon Kendra、「」を参照してください前提条件。
- Console
-
Gmail Amazon Kendra に接続するには
-
にサインイン AWS Management Console し、Amazon Kendra コンソール を開きます。
-
左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。
[インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。
-
[使用開始] ページで、[データソースを追加] を選択します。
-
データソースの追加ページで、Gmail コネクタ を選択し、コネクタの追加 を選択します。バージョン 2 (該当する場合) を使用している場合は、「V2.0」タグが付いた Gmail コネクタを選択します。
-
[データソースの詳細を指定] ページで、次の情報を入力します。
-
[名前と説明] の [データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。
-
(オプション) [説明] - オプションで、データソースの説明を入力します。
-
デフォルト言語 - ドキュメントをフィルタリングしてインデックスを作成する言語を選択します。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。
-
タグ で、新しいタグを追加 — リソースを検索およびフィルタリングしたり、 AWS コストを追跡したりするためのオプションのタグを含めます。
-
[次へ] をクリックします。
-
[アクセスとセキュリティの定義] ページで、次の情報を入力します。
-
承認 — ACL があり、アクセスコントロールに使用する場合は、ドキュメントのアクセスコントロールリスト (ACL) 情報をオンまたはオフにします。ACL は、ユーザーとグループがアクセスできるドキュメントを指定します。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。
-
AWS Secrets Manager シークレットの認証 — 既存のシークレットを選択するか、新しい Secrets Manager シークレットを作成して Gmail 認証情報を保存します。新しいシークレットを作成すると、 AWS Secrets Manager シークレットウィンドウが開きます。
-
[ AWS
Secrets Manager シークレットウィンドウを作成] に次の情報を入力します。
-
[シークレット名] - シークレットの名前。
-
[クライアント E メール] - Google サービスアカウントからコピーしたクライアント E メール。
-
[管理者アカウント E メール] - 使用する管理者アカウントの E メールです。
-
[プライベートキー] - Google サービスアカウントからコピーしたプライベートキー。
-
シークレットを保存して追加します。
-
[仮想プライベートクラウド (VPC)] - VPC の使用を選択できます。選択する場合は、[サブネット] と [VPC セキュリティグループ] を追加する必要があります。
-
IAM ロール — 既存の IAM ロールを選択するか、新しい IAM ロールを作成してリポジトリ認証情報にアクセスし、コンテンツにインデックスを作成します。
IAM インデックスに使用される ロールは、データソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。
-
[次へ] をクリックします。
-
[同期設定の構成] ページで、次の情報を入力します。
-
ForEntity タイプ — 選択すると、メッセージの添付ファイルが同期されます。
-
(オプション) [追加設定] で、以下の情報を入力します。
-
日付範囲 — クロールする E メールの開始日と終了日を指定する日付範囲を入力します。
-
E メールドメイン — 「to」、「from」、「cc」、「bcc」の E メールドメインに基づいて、特定の E メールを包含または除外します。
-
件名のキーワード — E メールの件名のキーワードに基づいて E メールを包含または除外します。
また、入力した件名のキーワードすべてに一致するドキュメントを含めることもできます。
-
ラベル - 正規表現パターンを追加して、特定の E メールラベルを含めたり除外したりします。
-
添付ファイル — 特定の E メール添付ファイルを含めるか除外する正規表現パターンを追加します。
-
[同期モード] - データソースのコンテンツが変更されたときのインデックスの更新方法を選択します。データソースを Amazon Kendra と初めて同期すると、デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとしてフル同期を選択しなくても、最初の同期が失敗した場合は、データのフル同期を実行する必要があります。
-
完全同期: すべてのコンテンツを新しくインデックス化し、データソースがインデックスと同期するたびに既存のコンテンツを置き換えます。
-
新規、変更、削除された同期: データソースがインデックスと同期するたびに、新規、変更、削除されたコンテンツのインデックスのみを作成します。 Amazon Kendra は、データソースのメカニズムを使用して、前回の同期以降に変更されたコンテンツの変更とインデックスコンテンツを追跡できます。
完全に削除された Gmail メッセージ、新規、変更、または削除されたコンテンツの同期を更新する API がないため、次のようになります。
Gmail のデータソースラベルの変更や完全に削除されたメールメッセージを Amazon Kendra インデックスに同期するには、定期的にフルクロールを実行する必要があります。
-
同期実行スケジュール で、頻度 — データソースコンテンツを同期してインデックスを更新する頻度を選択します。
-
[次へ] をクリックします。
-
[フィールドマッピングを設定] ページで、次の情報を入力します。
-
デフォルトのデータソースフィールド — インデックスにマッピングする Amazon Kendra 生成されたデフォルトのデータソースフィールドから選択します。
Amazon Kendra Gmail データソースコネクタは、API の制限によりカスタムインデックスフィールドの作成をサポートしていません。
-
[次へ] をクリックします。
-
[確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。
- API
-
Gmail Amazon Kendra に接続するには
TemplateConfiguration API を使用してデータソーススキーマの JSON を指定する必要があります。これには、以下の情報を入力する必要があります。
-
データソース — JSON スキーマGMAIL
を使用する場合は、データソースタイプを TemplateConfiguration として指定します。また、CreateDataSourceAPI を呼び出すTEMPLATE
ときにデータソースを として指定します。
-
同期モード — データソースコンテンツが変更されたときに Amazon Kendra がインデックスを更新する方法を指定します。データソースを と Amazon Kendra 初めて同期すると、デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとしてフル同期を選択しなくても、最初の同期が失敗した場合は、データのフル同期を実行する必要があります。以下のいずれかから選択できます。
-
FORCED_FULL_CRAWL
データソースがインデックスと同期するたびに既存のコンテンツを置き換え、すべてのコンテンツに新しいインデックスを付けます。
-
FULL_CRAWL
は、データソースがインデックスと同期するたびに、新規、変更、削除されたコンテンツのみのインデックスを作成します。 Amazon Kendra は、データソースのメカニズムを使用して、コンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツをインデックスできます。
完全に削除された Gmail メッセージ、新規、変更、または削除されたコンテンツの同期を更新する API がないため、次のようになります。
Gmail データソースラベルの変更と完全に削除された E メールメッセージを Amazon Kendra インデックスに同期するには、定期的にフルクロールを実行する必要があります。
-
シークレット Amazon リソースネーム (ARN) - Gmail アカウントの認証情報を含む Secrets Manager シークレットの Amazon リソースネーム (ARN) を指定します。シークレットは、次のキーを含む JSON 構造に保存されます。
{
"adminAccountEmailId": "service account email
",
"clientEmailId": "user account email
",
"privateKey": "private key
"
}
-
IAM role — を呼び出しCreateDataSource
て、 シー Secrets Manager クレットにアクセスするためのアクセス許可を IAM ロールに提供し、Gmail コネクタと に必要なパブリック APIs を呼び出すRoleArn
タイミングを指定します Amazon Kendra。詳細については、「IAM roles for Gmail data sources」を参照してください。
オプションで、次の機能を追加することもできます。
-
[仮想プライベートクラウド (VPC)] - VpcConfiguration
で CreateDataSource
を呼び出すタイミングを指定します。詳細については、「を使用する Amazon Kendra ように を設定する Amazon VPC」を参照してください。
-
包含フィルターと除外フィルター — 特定の「to」、「from」、「cc」、「bcc」の E メールを含めるか除外するかを指定します。
ほとんどのデータソースは、フィルターと呼ばれる包含または除外パターンである正規表現パターンを使用しています。包含フィルターを指定すると、包含フィルターに一致するコンテンツのみのインデックスが作成されます。包含フィルターに一致しないドキュメントのインデックスは作成されません。包含フィルターと除外フィルターを指定した場合、除外フィルターに一致するドキュメントは、包含フィルターと一致してもインデックスは作成されません。
-
ユーザーコンテキストのフィルタリングとアクセスコントロール —Amazon Kendra ドキュメントの ACL がある場合は、ドキュメントのアクセスコントロールリスト (ACL) をクロールします。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。
-
フィールドマッピング - 選択すると、Gmail データソースフィールドを Amazon Kendra インデックスフィールドにマッピングします。詳細については、データソースフィールドのマッピングを参照してください。
がドキュメント Amazon Kendra を検索するには、ドキュメント本文フィールドまたはドキュメントと同等のドキュメント本文が必要です。データソースのドキュメント本文フィールド名をインデックスフィールド名 にマッピングする必要があります_document_body
。その他のすべてのフィールドはオプションです。
Amazon Kendra Gmail データソースコネクタは、API の制限によりカスタムインデックスフィールドの作成をサポートしていません。
設定が必要なその他の重要な JSON キーのリストについては、「Gmail template schema」を参照してください。
詳細はこちら
Amazon Kendra と Gmail データソースとの統合の詳細については、以下を参照してください。
メモ
-
完全に削除された Gmail メッセージを更新する API がないため、FULL_CRAWL
/[新規、変更、削除したコンテンツの同期] は以下のようになります。
Gmail データソースラベルの変更と完全に削除された E メールメッセージを Amazon Kendra インデックスに同期するには、定期的にフルクロールを実行する必要があります。
-
Amazon Kendra Gmail データソースコネクタは、API の制限によりカスタムインデックスフィールドの作成をサポートしていません。