Alfresco - Amazon Kendra

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Alfresco

Alfresco は、お客様のコンテンツの保存と管理を支援するコンテンツ管理サービスです。 Amazon Kendra を使用して、Alfrescoドキュメントライブラリ、Wiki、ブログのインデックスを作成できます。

Amazon Kendra AlfrescoAlfrescoオンプレミスとクラウド (サービスとしてのプラットフォーム) をサポートします。

Amazon Kendra コンソールまたは TemplateConfigurationAPI Amazon Kendra Alfresco を使用してデータソースに接続できます。

Amazon Kendra Alfresco データソースコネクターのトラブルシューティングについては、を参照してください。データソースのトラブルシューティング

サポートされている機能

Amazon Kendra Alfresco データソースコネクタは以下の機能をサポートしています。

  • フィールドマッピング

  • 包含/除外フィルター

  • コンテンツの完全同期と差分同期

  • 仮想プライベートクラウド (VPC)

  • ユーザーコンテキストフィルタリング

  • OAuth 2.0 と基本的な認証

前提条件

Amazon Kendra を使用して Alfresco データソースのインデックスを作成する前に、とでこれらの変更を行ってください。Alfresco AWS アカウント

Alfresco で以下を確認してください。

  • Alfresco リポジトリ URL とウェブアプリケーション URL をコピー済み。特定の Alfresco サイトのみのインデックスを作成する場合は、サイト ID もコピーしてください。

  • 少なくとも読み取りアクセス許可のあるユーザー名とパスワードを含む Alfresco 認証情報を記録しました。OAuth 2.0 認証を使用する場合は、ユーザーを Alfresco 管理者グループに追加する必要があります。

  • オプション: Alfresco で OAuth 2.0 認証情報を生成しました。認証情報には、クライアント ID、クライアントシークレット、およびトークン URL が含まれます。クライアントを Alfresco オンプレミス用に設定する方法について詳しくは、Alfresco のドキュメントを参照してください。Alfresco クラウド (PaaS) を使用している場合は、Hyland サポートに連絡して Alfresco OAuth 2.0 認証を受ける必要があります。

  • 各ドキュメントが Alfresco および同じインデックスに使用する予定の他のデータソース間で一意であることを確認しました。インデックスに使用する各データソースには、データソース全体に同じドキュメントが含まれていてはなりません。ドキュメント ID はインデックス全体に適用され、インデックスごとに一意である必要があります。

には AWS アカウント、以下の内容が揃っていることを確認してください。

  • Amazon Kendra インデックスを作成し、API を使用している場合はインデックス ID を書き留めました。

  • IAM データソース用のロールを作成し、API IAM を使用している場合はロールの ARN を記録しました。

    注記

    認証タイプと認証情報を変更した場合、 AWS Secrets Manager 正しいシークレット ID IAM にアクセスできるようにロールを更新する必要があります。

  • Alfresco 認証情報を AWS Secrets Manager シークレットに保存し、API を使用している場合はシークレットの ARN を記録済み。

    注記

    認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません

IAM 既存のロールやシークレットがない場合は、Alfresco データソースをに接続するときに、 IAM Secrets Manager コンソールを使用して新しいロールとシークレットを作成できます。 Amazon Kendra API を使用している場合は、 IAM Secrets Manager 既存のロールとシークレットの ARN、およびインデックス ID を指定する必要があります。

接続手順

Alfresco Amazon Kendra データソースに接続するには、データにアクセスできるように Amazon Kendra Alfresco データソースの必要な詳細情報を入力する必要があります。まだ Alfresco 用に設定していない場合は、を参照してください。 Amazon Kendra前提条件

Console

に接続するには Amazon Kendra Alfresco

  1. AWS Management Console にログインし、Amazon Kendra コンソールを開きます

  2. 左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。

    注記

    [インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。

  3. [使用開始] ページで、[データソースを追加] を選択します。

  4. [データソースの追加] ページで [Alfresco コネクター] を選択し、[コネクターの追加] を選択します。

  5. [データソースの詳細を指定] ページで、次の情報を入力します。

    1. [名前と説明][データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。

    2. (オプション) [説明] - オプションで、データソースの説明を入力します。

    3. デフォルト言語 — 索引用のドキュメントをフィルターする言語を選択します。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。

    4. [タグ] の [新しいタグの追加] — リソースの検索、絞り込み、コストの追跡を行うためのオプションタグを追加します。 AWS

    5. [次へ] をクリックします。

  6. [アクセスとセキュリティの定義] ページで、次の情報を入力します。

    1. Alfresco タイプ - Alfresco オンプレミスを使用するか Alfresco クラウド (Platform as a Service) を使用するかを選択します。

    2. Alfresco リポジトリ URL - Alfresco リポジトリ URL を入力します。例えば、Alfresco クラウド (PaaS) を使用している場合、リポジトリ URL は、https://company.alfrescocloud.com になる可能性があります。または、Alfresco オンプレミスを使用している場合は、リポジトリ URL は https://company-alfresco-instance.company-domain.suffix:port になる可能性があります。

    3. Alfresco ユーザーアプリケーション。URL - Alfresco ユーザーインターフェイスの URL を入力します。リポジトリ URL は Alfresco 管理者から取得できます。例えば、ユーザーインターフェイス URL は https://example.com とすることができます。

    4. SSL 証明書の場所 — バケットに保存されている SSL 証明書へのパスを入力します。 Amazon S3 これを使用して、安全な SSL 接続で Alfresco オンプレミスに接続します。

    5. 承認 — ACL があり、それをアクセス制御に使用したい場合に、文書のアクセス制御リスト (ACL) 情報をオンまたはオフにします。ACL は、ユーザーとグループがアクセスできるドキュメントを指定します。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。

    6. [認証] - [基本認証] または [OAuth 2.0 認証] を選択します。次に、既存の Secrets Manager シークレットを選択するか、新しいシークレットを作成して Alfresco 認証情報を保存します。新しいシークレットを作成すると、 AWS Secrets Manager シークレットウィンドウが開きます。

      [基本認証] を選択した場合は、シークレットの名前、Alfresco サイトユーザー名、パスワードを入力します。

      [OAuth 2.0 認証]を選択した場合は、シークレットの名前、クライアント ID、クライアントシークレット、トークン URL を入力します。

    7. [仮想プライベートクラウド (VPC)] - VPC の使用を選択できます。選択する場合は、[サブネット][VPC セキュリティグループ] を追加する必要があります。

    8. ID クローラー — の ID Amazon Kendraクローラーを有効にするかどうかを指定します。ID クローラーは、ドキュメントのアクセス制御リスト (ACL) 情報を使用して、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて検索結果をフィルタリングします。ドキュメント用の ACL があり、その ACL を使用することを選択した場合は、 Amazon Kendraの ID クローラーを有効にして、検索結果のユーザーコンテキストフィルタリングを設定することもできます。それ以外の場合、ID クローラーがオフになっていると、すべてのドキュメントをパブリックに検索できます。ID クローラーがオフになっていて、ドキュメントのアクセス制御を使いたい場合は、PutPrincipalMappingAPI を使用してユーザーおよびグループのアクセス情報をアップロードし、ユーザーコンテキストフィルタリングを行うこともできます。

    9. IAM ロール — 既存のロールを選択するか、 IAM IAM 新しいロールを作成して、リポジトリの認証情報とインデックスコンテンツにアクセスします。

      注記

      IAM インデックスに使用されるロールはデータソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。

    10. [次へ] をクリックします。

  7. [同期設定の構成] ページで、次の情報を入力します。

    1. [同期の範囲] - 特定のコンテンツのクロールに制限を設定し、正規表現パターンを使用してコンテンツをフィルタリングします。

      1. [コンテンツ] - Alfresco の「アスペクト」とマークされたコンテンツ、特定の Alfresco サイト内のコンテンツ、またはすべての Alfresco サイトにわたるコンテンツをクロールするかどうかを選択します。

      2. (オプション) [その他の設定] - 以下の設定を設定します。

        • [コメントを含める] - Alfresco ドキュメントライブラリとブログにコメントを含めるかどうかを選択します。

        • [正規表現パターン] - 特定のファイルを含めるまたは除外する正規表現パターン。

    2. [同期モード] - データソースのコンテンツが変更されたときのインデックスの更新方法を選択します。データソースを初めて同期すると、 Amazon Kendra デフォルトではすべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとして完全同期を選択しなくても、初回の同期が失敗した場合は、データの完全同期を実行する必要があります。

      • 完全同期:データソースがインデックスと同期するたびに既存のコンテンツを置き換えて、すべてのコンテンツに新たにインデックスを付けます。

      • 新規、変更、削除済み同期:データソースがインデックスと同期されるたびに、新規、変更、削除されたコンテンツのみをインデックスに登録します。 Amazon Kendra データソースのメカニズムを使用してコンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツにインデックスを付けることができます。

    3. [同期実行スケジュール] の [頻度] で、 Amazon Kendra データソースと同期する頻度を選択します。

    4. [次へ] をクリックします。

  8. [フィールドマッピングを設定] ページで、次の情報を入力します。

    1. Amazon Kendra 生成されたデフォルトのデータソースフィールドの中から、インデックスにマッピングしたいものを選択します。

    2. カスタムデータソースフィールドを追加するには、マッピング先のインデックスフィールド名とフィールドデータタイプを作成します。

    3. [次へ] をクリックします。

  9. [確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。

API

Amazon Kendra に接続するには Alfresco

TemplateConfiguration API を使用してデータソーススキーマの JSON を指定する必要があります。これには、以下の情報を入力する必要があります。

  • データソースTemplateConfigurationJSON ALFRESCO スキーマを使用する場合と同様にデータソースタイプを指定します。また、CreateDataSourceAPI TEMPLATE を呼び出すときと同じようにデータソースを指定します。

  • Alfresco サイト ID - Alfresco サイト ID を指定します。

  • Alfresco リポジトリ URL - Alfresco リポジトリ URL を指定します。リポジトリ URL は Alfresco 管理者から取得できます。例えば、Alfresco クラウド (PaaS) を使用している場合、リポジトリ URL は、https://company.alfrescocloud.com になる可能性があります。または、Alfresco オンプレミスを使用している場合は、リポジトリ URL は https://company-alfresco-instance.company-domain.suffix:port になる可能性があります。

  • Alfresco ウェブアプリケーション URL - Alfresco ユーザーインターフェイス URL を指定します。リポジトリ URL は Alfresco 管理者から取得できます。例えば、ユーザーインターフェイス URL は https://example.com とすることができます。

  • 認証タイプ - 使用する認証タイプを指定します (OAuth2 または Basic)。

  • Alfresco タイプ - 使用する PAAS のタイプを指定します。Alfresco (クラウド/Platform as a Service) または ON_PREM (オンプレミス) のいずれかを使用するかを指定します。

  • シークレットの Amazon リソースネーム (ARN) - 基本認証を使用する場合は、ユーザー名とパスワードの認証情報を保存するシークレットを指定します。 AWS Secrets Manager シークレットの Amazon リソースネーム (ARN) を指定します。シークレットは、次のキーを含む JSON 構造に保存されます。

    { "username": "user name", "password": "password" }

    OAuth 2.0 認証を使用する場合、シークレットは以下のキーを含む JSON 構造に保存されます。

    { "clientId": "client ID", "clientSecret": "client secret", "tokenUrl": "token URL" }
  • IAM roleCreateDataSource IAM Secrets Manager シークレットにアクセスする権限をロールに提供したり、Alfresco コネクタとに必要なパブリック API RoleArn を呼び出したりするタイミングを指定します。 Amazon Kendra詳細については、「IAM roles for Alfresco data sources」を参照してください。

オプションで、次の機能を追加することもできます。

  • [仮想プライベートクラウド (VPC)] - VpcConfigurationCreateDataSource を呼び出すタイミングを指定します。詳細については、「を使用する Amazon Kendra ための の設定 Amazon VPC」を参照してください。

  • コンテンツタイプ - クロールするコンテンツのタイプ。Alfresco の「アスペクト」でマークされたコンテンツ、特定のAlfresco サイト内のコンテンツ、またはすべての Alfresco サイトにわたるコンテンツ。特定の「アスペクト」コンテンツを一覧表示することもできます。

  • 包含フィルターと除外フィルター - 特定のファイルを含めるか除外するかを指定します。

    注記

    ほとんどのデータソースは、フィルターと呼ばれる包含または除外パターンである正規表現パターンを使用しています。包含フィルターを指定すると、包含フィルターに一致するコンテンツのみのインデックスが作成されます。包含フィルターに一致しないドキュメントのインデックスは作成されません。包含フィルターと除外フィルターを指定した場合、除外フィルターに一致するドキュメントは、包含フィルターと一致してもインデックスは作成されません。

  • 同期モード — Amazon Kendra データソースのコンテンツが変更されたときのインデックスの更新方法を指定します。データソースを初めて同期すると、 Amazon Kendra デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとして完全同期を選択しなくても、初回の同期が失敗した場合は、データの完全同期を実行する必要があります。以下のいずれかから選択できます。

    • FORCED_FULL_CRAWLすべてのコンテンツに新たにインデックスを付けるには、データソースがインデックスと同期されるたびに既存のコンテンツを置き換えます。

    • FULL_CRAWLデータソースがインデックスと同期されるたびに、新規、変更、削除されたコンテンツのみにインデックスを付けるようにする。 Amazon Kendra データソースのメカニズムを使用して、コンテンツの変更を追跡したり、前回の同期以降に変更されたコンテンツのインデックスを作成したりできます。

  • ID クローラー — の ID Amazon Kendraクローラーを有効にするかどうかを指定します。ID クローラーは、ドキュメントのアクセス制御リスト (ACL) 情報を使用して、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて検索結果をフィルタリングします。ドキュメント用の ACL があり、その ACL を使用することを選択した場合は、 Amazon Kendraの ID クローラーを有効にして、検索結果のユーザーコンテキストフィルタリングを設定することもできます。それ以外の場合、ID クローラーがオフになっていると、すべてのドキュメントをパブリックに検索できます。ID クローラーがオフになっていて、ドキュメントのアクセス制御を使いたい場合は、PutPrincipalMappingAPI を使用してユーザーおよびグループのアクセス情報をアップロードし、ユーザーコンテキストフィルタリングを行うこともできます。

  • フィールドマッピング - データソースフィールドを Amazon Kendra インデックスフィールドにマッピングします。詳細については、データソースフィールドのマッピングを参照してください。

    注記

    ドキュメントを検索するには、ドキュメント本文フィールドまたはドキュメントに対応するドキュメント本文が必要です。 Amazon Kendra データソース内の文書本文フィールド名をインデックスフィールド名にマップする必要があります_document_body。その他のすべてのフィールドはオプションです。

設定が必要なその他の重要な JSON キーのリストについては、「Alfresco template schema」を参照してください。

詳細はこちら

Alfresco Amazon Kendra データソースとの統合について詳しくは、以下をご覧ください。