Adobe Experience Manager - Amazon Kendra

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Adobe Experience Manager

Adobe Experience Managerest un système de gestion de contenu utilisé pour créer du contenu de sites Web ou d'applications mobiles. Vous pouvez l'utiliser Amazon Kendra pour vous connecter à vos pages Adobe Experience Manager et à vos actifs de contenu et les indexer.

Amazon Kendra prend en charge Adobe Experience Manager (AEM) en tant qu'instance d'auteur du service Adobe Experience Manager cloud et en tant qu'instance de création et de publication sur site.

Vous pouvez vous connecter Amazon Kendra à votre source de Adobe Experience Manager données à l'aide de la Amazon Kendra console ou de l'TemplateConfigurationAPI.

Pour résoudre les problèmes liés à votre connecteur de source de données Amazon Kendra Adobe Experience Manager, consultezDépannage des sources de données.

Fonctionnalités prises en charge

Adobe Experience Managerle connecteur de source de données prend en charge les fonctionnalités suivantes :

  • Mappages de champs

  • Contrôle d'accès des utilisateurs

  • Filtres d'inclusion/exclusion

  • Synchronisation complète et incrémentielle du contenu

  • OAuth 2.0 et authentification de base

  • Cloud privé virtuel (VPC)

Prérequis

Avant de pouvoir Amazon Kendra indexer votre source de Adobe Experience Manager données, apportez ces modifications à vos AWS comptes Adobe Experience Manager and.

DansAdobe Experience Manager, assurez-vous d'avoir :

  • Accès à un compte doté de privilèges administratifs ou à un utilisateur administrateur.

  • Vous avez copié Adobe Experience Manager l'URL de votre hôte.

    Note

    (Sur place/sur serveur) Amazon Kendra vérifie si les informations de point de terminaison incluses sont les mêmes AWS Secrets Manager que celles spécifiées dans les détails de configuration de votre source de données. Cela permet de se protéger contre le problème de confusion des adjoints, qui est un problème de sécurité lorsqu'un utilisateur n'est pas autorisé à effectuer une action mais l'utilise Amazon Kendra comme proxy pour accéder au secret configuré et exécuter l'action. Si vous modifiez ultérieurement les informations de votre point de terminaison, vous devez créer un nouveau secret pour synchroniser ces informations.

  • Vous avez noté vos informations d'authentification de base, à savoir le nom d'utilisateur et le mot de passe de l'administrateur.

    Note

    Nous vous recommandons d'actualiser ou de modifier régulièrement vos informations d'identification et votre code secret. Fournissez uniquement le niveau d'accès nécessaire pour votre propre sécurité. Nous vous déconseillons de réutiliser les informations d'identification et les secrets entre les sources de données et les versions 1.0 et 2.0 du connecteur (le cas échéant).

  • Facultatif : informations d'identification OAuth 2.0 configurées dans Adobe Experience Manager (AEM) en tant que service cloud ou AEM sur site. Si vous utilisez AEM On-Premise, les informations d'identification incluent l'ID client, le secret client et la clé privée. Si vous utilisez AEM en tant que service cloud, les informations d'identification incluent l'identifiant du client, le secret du client, la clé privée, l'identifiant de l'organisation, l'identifiant du compte technique et l'hôte Adobe Identity Management System (IMS). Pour plus d'informations sur la façon de générer ces informations d'identification pour AEM as a Cloud Service, consultez Adobe Experience Managerla documentation. Pour AEM On-Premise, l'implémentation du serveur Adobe Granite OAuth 2.0 (com.adobe.granite.oauth.server) prend en charge les fonctionnalités du serveur OAuth 2.0 dans AEM.

  • Il est vérifié que chaque document est unique dans Adobe Experience Manager et dans les autres sources de données que vous prévoyez d'utiliser pour le même index. Chaque source de données que vous souhaitez utiliser pour un index ne doit pas contenir le même document dans toutes les sources de données. Les identifiants de document sont globaux à un index et doivent être uniques par index.

Dans votre Compte AWS, assurez-vous d'avoir :

  • Création d'un Amazon Kendra index et, si vous utilisez l'API, notez l'ID de l'index.

  • Vous avez créé un IAM rôle pour votre source de données et, si vous utilisez l'API, notez l'ARN du IAM rôle.

    Note

    Si vous modifiez votre type d'authentification et vos informations d'identification, vous devez mettre à jour votre IAM rôle pour accéder au bon identifiant AWS Secrets Manager secret.

  • Stockez vos informations d'authentification Adobe Experience Manager dans un AWS Secrets Manager secret et, si vous utilisez l'API, notez l'ARN du secret.

    Note

    Nous vous recommandons d'actualiser ou de modifier régulièrement vos informations d'identification et votre code secret. Fournissez uniquement le niveau d'accès nécessaire pour votre propre sécurité. Nous vous déconseillons de réutiliser les informations d'identification et les secrets entre les sources de données et les versions 1.0 et 2.0 du connecteur (le cas échéant).

Si vous n'avez pas de IAM rôle ou de secret existant, vous pouvez utiliser la console pour créer un nouveau IAM rôle et un nouveau Secrets Manager secret lorsque vous connectez votre source de données Adobe Experience Manager à Amazon Kendra. Si vous utilisez l'API, vous devez fournir l'ARN d'un IAM rôle et d'un Secrets Manager secret existants, ainsi qu'un identifiant d'index.

Instructions de connexion

Pour vous connecter Amazon Kendra à votre source de Adobe Experience Manager données, vous devez fournir les informations nécessaires sur votre source de Adobe Experience Manager données afin de Amazon Kendra pouvoir accéder à vos données. Si vous n'avez pas encore configuré Adobe Experience Manager pour Amazon Kendra, consultezPrérequis.

Console

Pour vous connecter Amazon Kendra à Adobe Experience Manager

  1. Connectez-vous à la Amazon Kendra console AWS Management Console et ouvrez-la.

  2. Dans le volet de navigation de gauche, choisissez Index, puis choisissez l'index que vous souhaitez utiliser dans la liste des index.

    Note

    Vous pouvez choisir de configurer ou de modifier vos paramètres de contrôle d'accès utilisateur dans les paramètres de l'index.

  3. Sur la page de démarrage, choisissez Ajouter une source de données.

  4. Sur la page Ajouter une source de données, choisissez le connecteur Adobe Experience Manager, puis sélectionnez Ajouter un connecteur. Si vous utilisez la version 2 (le cas échéant), choisissez le connecteur Adobe Experience Manager avec la balise « V2.0 ».

  5. Sur la page Spécifier les détails de la source de données, entrez les informations suivantes :

    1. Dans Nom et description, pour Nom de la source de données : entrez le nom de votre source de données. Vous pouvez inclure des traits d'union, mais pas des espaces.

    2. (Facultatif) Description : entrez une description facultative pour votre source de données.

    3. Dans la langue par défaut : choisissez une langue pour filtrer vos documents pour l'index. Sauf indication contraire, la langue par défaut est l'anglais. La langue spécifiée dans les métadonnées du document remplace la langue sélectionnée.

    4. Dans Balises, pour Ajouter une nouvelle balise : incluez des balises facultatives pour rechercher et filtrer vos ressources ou suivre vos AWS coûts.

    5. Choisissez Suivant.

  6. Sur la page Définir l'accès et la sécurité, entrez les informations suivantes :

    1. Source : choisissez AEM sur site ou AEM en tant que service cloud.

      Entrez l'URL de votre Adobe Experience Manager hôte. Par exemple, si vous utilisez AEM On-Premise, vous devez inclure le nom d'hôte et le port :. https://hostname:port Ou, si vous utilisez AEM en tant que service cloud, vous pouvez utiliser l'URL de l'auteur : https://author-xxxxxx-xxxxxxx.adobeaemcloud.com.

    2. Emplacement du certificat SSL : entrez le chemin d'accès au certificat SSL stocké dans un Amazon S3 compartiment. Vous l'utilisez pour vous connecter à AEM On-Premise avec une connexion SSL sécurisée.

    3. Autorisation : activez ou désactivez les informations de la liste de contrôle d'accès (ACL) pour vos documents, si vous disposez d'une ACL et que vous souhaitez l'utiliser pour le contrôle d'accès. L'ACL indique les documents auxquels les utilisateurs et les groupes peuvent accéder. Les informations ACL sont utilisées pour filtrer les résultats de recherche en fonction de l'accès de l'utilisateur ou de son groupe aux documents. Pour plus d'informations, consultez la section Filtrage du contexte utilisateur.

    4. Authentification —Choisissez l'authentification de base ou l'authentification OAuth 2.0. Choisissez ensuite un AWS Secrets Manager secret existant ou créez-en un nouveau pour stocker vos Adobe Experience Manager informations d'identification. Si vous choisissez de créer un nouveau secret, une fenêtre AWS Secrets Manager secrète s'ouvre.

      Si vous avez choisi l'authentification de base, entrez le nom du secret, le nom d'utilisateur et le mot de passe du Adobe Experience Manager site. L'utilisateur doit disposer d'une autorisation d'administrateur ou être un utilisateur administrateur.

      Si vous avez choisi l'authentification OAuth 2.0 et que vous utilisez AEM On-Premise, entrez un nom pour le secret, l'ID client, le secret client et la clé privée. Si vous utilisez AEM en tant que service cloud, entrez un nom pour le secret, l'identifiant client, le secret client, la clé privée, l'identifiant de l'organisation, l'identifiant du compte technique et l'hôte Adobe Identity Management System (IMS).

      Enregistrez et ajoutez votre secret.

    5. Virtual Private Cloud (VPC) —Vous pouvez choisir d'utiliser un VPC. Dans ce cas, vous devez ajouter des sous-réseaux et des groupes de sécurité VPC.

    6. Identity Crawler : spécifiez s'il faut activer l'explorateur Amazon Kendra d'identité. Le robot d'exploration d'identité utilise les informations de la liste de contrôle d'accès (ACL) de vos documents pour filtrer les résultats de recherche en fonction de l'accès de l'utilisateur ou de son groupe aux documents. Si vous disposez d'une ACL pour vos documents et que vous choisissez de l'utiliser, vous pouvez également choisir d'activer le robot d'exploration Amazon Kendra d'identité pour configurer le filtrage des résultats de recherche par contexte utilisateur. Sinon, si le robot d'identification est désactivé, tous les documents peuvent être consultés publiquement. Si vous souhaitez utiliser le contrôle d'accès pour vos documents et que le robot d'exploration d'identité est désactivé, vous pouvez également utiliser l'PutPrincipalMappingAPI pour télécharger les informations d'accès des utilisateurs et des groupes afin de filtrer le contexte utilisateur.

    7. IAM rôle —Choisissez un IAM rôle existant ou créez-en un nouveau IAM pour accéder aux informations d'identification de votre référentiel et indexer le contenu.

      Note

      IAM les rôles utilisés pour les index ne peuvent pas être utilisés pour les sources de données. Si vous ne savez pas si un rôle existant est utilisé pour un index ou une FAQ, choisissez Créer un nouveau rôle pour éviter les erreurs.

    8. Choisissez Suivant.

  7. Sur la page Configurer les paramètres de synchronisation, entrez les informations suivantes :

    1. Étendue de synchronisation : définissez des limites pour l'exploration de certains types de contenu, composants de page et chemins racines, et filtrez le contenu à l'aide de modèles d'expression regex.

      1. Types de contenu : choisissez d'explorer uniquement les pages ou les ressources, ou les deux.

      2. (Facultatif) Configuration supplémentaire : configurez les paramètres suivants :

        • Composants de page : noms spécifiques des composants de page. Le composant de page est un composant de page extensible conçu pour fonctionner avec l'éditeur de Adobe Experience Manager modèles et permet d'assembler des composants d'en-tête/pied de page et de structure avec l'éditeur de modèles.

        • Variations de fragments de contenu : noms spécifiques des variations de fragments de contenu. Les fragments de contenu vous permettent de concevoir, créer, organiser et publier du contenu indépendant de la page dans. Adobe Experience Manager Ils vous permettent de préparer du contenu prêt à être utilisé sur plusieurs locaux/sur plusieurs canaux.

        • Chemins racines : chemins racines vers un contenu spécifique.

        • Modèles Regex : modèles d'expressions régulières permettant d'inclure ou d'exclure certaines pages et ressources.

    2. Mode de synchronisation : choisissez la manière dont vous souhaitez mettre à jour votre index lorsque le contenu de votre source de données change. Lorsque vous synchronisez votre source de données Amazon Kendra pour la première fois, tout le contenu est analysé et indexé par défaut. Vous devez exécuter une synchronisation complète de vos données en cas d'échec de la synchronisation initiale, même si vous ne choisissez pas l'option de synchronisation complète comme mode de synchronisation.

      • Synchronisation complète : Indexez tout le contenu fraîchement, en remplaçant le contenu existant chaque fois que votre source de données se synchronise avec votre index.

      • Nouvelle synchronisation modifiée : Indexez uniquement le contenu nouveau et modifié chaque fois que votre source de données se synchronise avec votre index. Amazon Kendra peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et indexer le contenu modifié depuis la dernière synchronisation.

      • Synchronisation nouvelle, modifiée ou supprimée : Indexez uniquement le contenu nouveau, modifié et supprimé chaque fois que votre source de données se synchronise avec votre index. Amazon Kendra peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et indexer le contenu modifié depuis la dernière synchronisation.

    3. ID de fuseau horaire : si vous utilisez AEM On-Premise et que le fuseau horaire de votre serveur est différent de celui du connecteur ou de l'index Amazon Kendra AEM, vous pouvez spécifier le fuseau horaire du serveur afin de l'aligner sur le connecteur ou l'index AEM. Le fuseau horaire par défaut pour AEM On-Premise est le fuseau horaire du connecteur ou de l' Amazon Kendra index AEM. Le fuseau horaire par défaut pour AEM en tant que service cloud est l'heure moyenne de Greenwich.

    4. Calendrier d'exécution de synchronisation, pour la fréquence : choisissez la fréquence à laquelle vous souhaitez synchroniser le contenu de votre source de données et mettre à jour votre index.

    5. Choisissez Suivant.

  8. Sur la page Définir les mappages de champs, entrez les informations suivantes :

    1. Sélectionnez parmi les champs de source de données par défaut Amazon Kendra générés que vous souhaitez mapper à votre index. Pour ajouter des champs de source de données personnalisés, créez un nom de champ d'index à mapper et le type de données du champ.

    2. Choisissez Suivant.

  9. Sur la page Réviser et créer, vérifiez que les informations saisies sont correctes, puis sélectionnez Ajouter une source de données. Vous pouvez également choisir de modifier vos informations à partir de cette page. Votre source de données apparaîtra sur la page Sources de données une fois que la source de données aura été ajoutée avec succès.

API

Pour vous connecter Amazon Kendra à Adobe Experience Manager

Vous devez spécifier un JSON du schéma de source de données à l'aide de l'TemplateConfigurationAPI. Vous devez fournir les informations suivantes :

  • Source de données —Spécifiez le type de source de données tel que AEM lorsque vous utilisez le schéma TemplateConfigurationJSON. Spécifiez également la source de données TEMPLATE lorsque vous appelez l'CreateDataSourceAPI.

  • URL de l'hôte AEM : spécifiez l'URL de l'Adobe Experience Managerhôte. Par exemple, si vous utilisez AEM On-Premise, vous devez inclure le nom d'hôte et le port :. https://hostname:port Ou, si vous utilisez AEM en tant que service cloud, vous pouvez utiliser l'URL de l'auteur : https://author-xxxxxx-xxxxxxx.adobeaemcloud.com.

  • Mode de synchronisation : spécifiez comment Amazon Kendra mettre à jour votre index lorsque le contenu de votre source de données change. Lorsque vous synchronisez votre source de données Amazon Kendra pour la première fois, tout le contenu est analysé et indexé par défaut. Vous devez exécuter une synchronisation complète de vos données en cas d'échec de la synchronisation initiale, même si vous ne choisissez pas l'option de synchronisation complète comme mode de synchronisation. Vous pouvez choisir entre :

    • FORCED_FULL_CRAWLpour indexer à nouveau tout le contenu, en remplaçant le contenu existant chaque fois que votre source de données se synchronise avec votre index.

    • FULL_CRAWLpour indexer uniquement le contenu nouveau, modifié et supprimé chaque fois que votre source de données se synchronise avec votre index. Amazon Kendra peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et indexer le contenu modifié depuis la dernière synchronisation.

    • CHANGE_LOGpour indexer uniquement le contenu nouveau et modifié chaque fois que votre source de données se synchronise avec votre index. Amazon Kendra peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et indexer le contenu modifié depuis la dernière synchronisation.

  • Type d'authentification : spécifiez le type d'authentification que vous souhaitez utiliser, Basic soitOAuth2.

  • Type AEM —Spécifiez le type Adobe Experience Manager que vous utilisez, soitCLOUD. ON_PREMISE

  • Nom de ressource Amazon secret (ARN) : si vous souhaitez utiliser l'authentification de base pour AEM sur site ou dans le cloud, vous devez fournir un secret qui stocke vos informations d'authentification, à savoir votre nom d'utilisateur et votre mot de passe. Vous fournissez le Amazon Resource Name (ARN) d'un AWS Secrets Manager secret. Le secret est stocké dans une structure JSON avec les clés suivantes :

    { "aemUrl": "Adobe Experience Manager On-Premise host URL", "username": "user name with admin permissions", "password": "password with admin permissions" }

    Si vous souhaitez utiliser l'authentification OAuth 2.0 pour AEM On-Premise, le secret est stocké dans une structure JSON avec les clés suivantes :

    { "aemUrl": "Adobe Experience Manager host URL", "clientId": "client ID", "clientSecret": "client secret", "privateKey": "private key" }

    Si vous souhaitez utiliser l'authentification OAuth 2.0 pour AEM en tant que service cloud, le secret est stocké dans une structure JSON avec les clés suivantes :

    { "clientId": "client ID", "clientSecret": "client secret", "privateKey": "private key", "orgId": "organization ID", "technicalAccountId": "technical account ID", "imsHost": "Adobe Identity Management System (IMS) host" }
  • IAM role —Spécifiez à quel RoleArn moment vous appelez CreateDataSource pour fournir à un IAM rôle les autorisations d'accéder à votre Secrets Manager secret et pour appeler les API publiques requises pour le connecteur Adobe Experience Manager et Amazon Kendra. Pour plus d'informations, consultez la section IAM Rôles des sources de données Adobe Experience Manager.

Vous pouvez également ajouter les fonctionnalités optionnelles suivantes :

  • Virtual Private Cloud (VPC) VpcConfiguration —Spécifiez le moment de votre appel. CreateDataSource Pour plus d’informations, consultez Configuration Amazon Kendra pour utiliser un Amazon VPC.

  • ID de fuseau horaire : si vous utilisez AEM On-Premise et que le fuseau horaire de votre serveur est différent de celui du connecteur ou de l'index Amazon Kendra AEM, vous pouvez spécifier le fuseau horaire du serveur afin de l'aligner sur le connecteur ou l'index AEM.

    Le fuseau horaire par défaut pour AEM On-Premise est le fuseau horaire du connecteur ou de l' Amazon Kendra index AEM. Le fuseau horaire par défaut pour AEM en tant que service cloud est l'heure moyenne de Greenwich.

    Pour plus d'informations sur les ID de fuseaux horaires pris en charge, consultez le schéma Adobe Experience Manager JSON.

  • Filtres d'inclusion et d'exclusion : spécifiez s'il faut inclure ou exclure certaines pages et ressources.

    Note

    La plupart des sources de données utilisent des modèles d'expressions régulières, qui sont des modèles d'inclusion ou d'exclusion appelés filtres. Si vous spécifiez un filtre d'inclusion, seul le contenu correspondant au filtre d'inclusion est indexé. Tout document qui ne correspond pas au filtre d'inclusion n'est pas indexé. Si vous spécifiez un filtre d'inclusion et d'exclusion, les documents correspondant au filtre d'exclusion ne sont pas indexés, même s'ils correspondent au filtre d'inclusion.

  • Identity Crawler : spécifiez s'il faut activer l'explorateur Amazon Kendra d'identité. Le robot d'exploration d'identité utilise les informations de la liste de contrôle d'accès (ACL) de vos documents pour filtrer les résultats de recherche en fonction de l'accès de l'utilisateur ou de son groupe aux documents. Si vous disposez d'une ACL pour vos documents et que vous choisissez de l'utiliser, vous pouvez également choisir d'activer le robot d'exploration Amazon Kendra d'identité pour configurer le filtrage des résultats de recherche par contexte utilisateur. Sinon, si le robot d'identification est désactivé, tous les documents peuvent être consultés publiquement. Si vous souhaitez utiliser le contrôle d'accès pour vos documents et que le robot d'exploration d'identité est désactivé, vous pouvez également utiliser l'PutPrincipalMappingAPI pour télécharger les informations d'accès des utilisateurs et des groupes afin de filtrer le contexte utilisateur.

  • Mappages de champs : choisissez de mapper les champs de votre source de données Adobe Experience Manager à vos champs d' Amazon Kendra index. Pour plus d'informations, veuillez consulter la rubrique Mappage des champs de source de données.

    Note

    Le champ du corps du document ou l'équivalent du corps du document pour vos documents est requis pour Amazon Kendra effectuer une recherche dans vos documents. Vous devez associer le nom du champ du corps du document dans votre source de données au nom du champ d'index_document_body. Tous les autres champs sont facultatifs.

Pour obtenir la liste des autres clés JSON importantes à configurer, consultez le schéma du Adobe Experience Manager modèle.