Créez une base de connaissances Amazon Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Créez une base de connaissances Amazon Bedrock

Vous pouvez créer une base de connaissances Amazon Bedrock pour récupérer des informations à partir de vos données propriétaires et générer des réponses aux questions en langage naturel. Dans le cadre de la création d'une base de connaissances, vous configurez une source de données et un magasin vectoriel de votre choix.

Note

Vous ne pouvez pas créer une base de connaissances avec un utilisateur root. Connectez-vous avec un IAM utilisateur avant de commencer ces étapes.

Sélectionnez l'onglet correspondant à la méthode de votre choix et suivez les étapes suivantes :

Console
Pour créer une base de connaissances
  1. Connectez-vous à l' AWS Management Console aide d'un IAMrôle avec les autorisations Amazon Bedrock et ouvrez la console Amazon Bedrock à l'adresse. https://console.aws.amazon.com/bedrock/

  2. Dans le volet de navigation de gauche, sélectionnez Bases de connaissances.

  3. Dans la section Bases de connaissances, sélectionnez Créer une base de connaissances.

  4. Sur la page de détails de la base de connaissances Provide, configurez les configurations suivantes :

    1. (Facultatif) Dans la section Détails de la base de connaissances, modifiez le nom par défaut et fournissez une description de votre base de connaissances.

    2. Dans la section IAMdes autorisations, choisissez un rôle AWS Identity and Access Management (IAM) qui autorise Amazon Bedrock à accéder à d'autres AWS services. Vous pouvez laisser Amazon Bedrock créer le rôle de service ou choisir un rôle personnalisé que vous avez créé.

    3. (Facultatif) Ajoutez des balises à votre base de connaissances. Pour de plus amples informations, veuillez consulter Marquer les ressources Amazon Bedrock.

    4. Sélectionnez Suivant.

  5. Sur la page Choisir une source de données, sélectionnez la source de données à utiliser pour la base de connaissances :

    1. Suivez les étapes de configuration de connexion pour la source de données sélectionnée. Consultez la section Sources de données prises en charge pour sélectionner votre source de données et suivre les étapes de configuration de la connexion à la console.

    2. (Facultatif) Pour configurer les paramètres avancés suivants dans le cadre de la configuration de la source de données, développez la section Paramètres avancés - facultatif.

      Pour KMS key les paramètres, vous pouvez choisir une clé personnalisée ou utiliser la clé de chiffrement des données fournie par défaut.

      Lors de la conversion de vos données en données incorporées, Amazon Bedrock chiffre vos données transitoires à l'aide d'une clé qui les AWS possède et les gère par défaut. Vous pouvez utiliser votre propre KMS clé. Pour de plus amples informations, veuillez consulter Chiffrement du stockage des données transitoires lors de l’ingestion de données.

      Pour les paramètres de politique de suppression des données, vous pouvez choisir l'une des options suivantes :

      • Supprimer : Supprime toutes les données de votre source de données qui sont converties en intégrations vectorielles lors de la suppression d'une base de connaissances ou d'une ressource de source de données. Notez que le magasin vectoriel lui-même n'est pas supprimé, seules les données sont supprimées. Ce drapeau est ignoré si un AWS compte est supprimé.

      • Conserver : conserve toutes les données de votre source de données qui sont converties en intégrations vectorielles lors de la suppression d'une base de connaissances ou d'une ressource de source de données. Notez que le magasin vectoriel lui-même n'est pas supprimé si vous supprimez une base de connaissances ou une ressource de source de données.

    3. Pour configurer les paramètres de segmentation et d'analyse du contenu suivants dans le cadre de la configuration de la source de données, accédez à la section Découpage et analyse du contenu.

      Choisissez l'une des options de découpage suivantes :

      • Fragmentation à taille fixe : le contenu est divisé en morceaux de texte de la taille approximative du jeton que vous avez définie. Vous pouvez définir le nombre maximum de jetons qui ne doit pas dépasser pour un bloc et le pourcentage de chevauchement entre des segments consécutifs.

      • Fragmentation par défaut : le contenu est divisé en blocs de texte contenant jusqu'à 300 jetons. Si un seul document ou élément de contenu contient moins de 300 jetons, le document n'est pas scindé davantage.

      • Découpage hiérarchique : contenu organisé en structures imbriquées de segments parent-enfant. Vous définissez la taille maximale du jeton parent et la taille maximale du jeton du fragment enfant. Vous définissez également le nombre absolu de jetons superposés entre les segments parents consécutifs et les segments enfants consécutifs.

      • Découpage sémantique : contenu organisé en blocs de texte ou groupes de phrases sémantiquement similaires. Vous définissez le nombre maximum de phrases entourant la phrase cible/en cours à regrouper (taille de la mémoire tampon). Vous définissez également le seuil du percentile d'arrêt pour diviser le texte en segments significatifs. Le découpage sémantique utilise un modèle de base. Consultez Amazon Bedrock les tarifs pour obtenir des informations sur le coût des modèles de base.

      • Pas de découpage : chaque document est traité comme un bloc de texte unique. Vous souhaiterez peut-être prétraiter vos documents en les divisant en fichiers distincts.

      Note

      Vous ne pouvez pas modifier la stratégie de segmentation après avoir créé la source de données.

      Vous pouvez choisir d'utiliser Amazon Bedrock le modèle de base pour analyser des documents afin d'analyser plus que du texte standard. Vous pouvez analyser des données tabulaires dans des documents avec leur structure intacte, par exemple. Consultez Amazon Bedrock les tarifs pour obtenir des informations sur le coût des modèles de base.

      Vous pouvez choisir d'utiliser une AWS Lambda fonction pour personnaliser votre stratégie de segmentation et la manière dont les attributs/champs de métadonnées de votre document sont traités et ingérés. Indiquez l'emplacement du Amazon S3 compartiment pour l'entrée et la sortie de la fonction Lambda.

    4. Sélectionnez Suivant.

  6. Sur la page Sélectionner le modèle d'intégration et configurer le magasin de vecteurs, choisissez un modèle d'intégration pris en charge pour convertir vos données en intégrations vectorielles pour la base de connaissances.

  7. Dans la section Vector store, choisissez l'une des options suivantes pour stocker les intégrations vectorielles pour votre base de connaissances :

    • Créez rapidement une nouvelle boutique vectorielle : Amazon Bedrock crée pour vous une collection de recherche vectorielle Amazon OpenSearch Serverless. Avec cette option, une collection de recherche vectorielle publique et un index vectoriel sont mis en place pour vous avec les champs obligatoires et les configurations nécessaires. Une fois la collection créée, vous pouvez la gérer dans la console Amazon OpenSearch Serverless ou via le AWS API. Pour plus d'informations, consultez la section Utilisation des collections de recherche vectorielle dans le manuel Amazon OpenSearch Service Developer Guide. Si vous sélectionnez cette option, vous pouvez éventuellement activer les paramètres suivants :

      1. Pour activer les répliques actives redondantes, afin que la disponibilité de votre magasin vectoriel ne soit pas compromise en cas de défaillance de l'infrastructure, sélectionnez Activer la redondance (répliques actives).

        Note

        Nous vous recommandons de laisser cette option désactivée pendant que vous testez votre base de connaissances. Lorsque vous êtes prêt à passer en production, nous vous recommandons d'activer les répliques actives redondantes. Pour plus d'informations sur la tarification, voir Tarification pour les applications OpenSearch sans serveur

      2. Pour chiffrer le magasin vectoriel automatisé à l'aide d'une clé gérée par le client, sélectionnez Ajouter une clé gérée par le client KMS pour le vecteur Amazon OpenSearch Serverless — facultatif, puis choisissez la clé. Pour de plus amples informations, veuillez consulter Chiffrement des informations transmises à Amazon OpenSearch Service.

    • Sélectionnez un magasin de vecteurs que vous avez créé : sélectionnez le service pour le magasin de vecteurs que vous avez déjà créé. Remplissez les champs pour permettre à Amazon Bedrock de mapper les informations de la base de connaissances à votre boutique de vecteurs, afin qu'elle puisse stocker, mettre à jour et gérer les intégrations vectorielles. Pour plus d'informations sur les champs, voir Configurer votre propre magasin de vecteurs pris en charge.

      Note

      Si vous utilisez une base de données dans Amazon OpenSearch Serverless, Amazon Aurora ou MongoDB Atlas, vous devez au préalable configurer les champs sous Field mapping. Si vous utilisez une base de données dans Pinecone or Redis Enterprise Cloud, vous pouvez donner des noms à ces champs ici et Amazon Bedrock les créera dynamiquement dans la boutique vectorielle pour vous.

  8. Sélectionnez Suivant.

  9. Sur la page Vérifier et créer, vérifiez la configuration et les détails de la base de connaissances. Choisissez Modifier dans la section que vous souhaitez modifier. Lorsque vous êtes satisfait, sélectionnez Créer la base de connaissances.

  10. Le temps nécessaire à la création de la base de connaissances dépend de vos configurations spécifiques. Lorsque la création de la base de connaissances est terminée, le statut de la base de connaissances change pour indiquer qu'elle est prête ou disponible.

API

Pour créer une base de connaissances, envoyez une CreateKnowledgeBasedemande à un point de terminaison Agents for Amazon Bedrock au moment de la création et fournissez le nom, la description, les instructions indiquant ce qu'il doit faire et le modèle de base avec lequel il doit être orchestré.

Note

Si vous préférez laisser Amazon Bedrock créer et gérer une boutique vectorielle pour vous dans Amazon OpenSearch Service, utilisez la console. Pour de plus amples informations, veuillez consulter Créez une base de connaissances Amazon Bedrock.

  • Donnez-leur ARN les autorisations nécessaires pour créer une base de connaissances roleArn sur le terrain.

  • Fournissez le modèle d'intégration vectorielle à utiliser dans le embeddingModelArn champ de l'objet. knowledgeBaseConfiguration Consultez les modèles pris en charge pour les bases de connaissances.

    Vous devez activer l'accès au modèle pour utiliser un modèle pris en charge par les bases de connaissances. Prenez note de votre modèle Amazon Resource Name (ARN) qui est requis pour convertir vos données en intégrations vectorielles. Copiez l'ID du modèle que vous avez choisi pour les bases de connaissances et construisez le modèle à ARN l'aide de l'ID du modèle (ressource), en suivant les ARNexemples fournis pour le type de ressource de votre modèle.

  • Fournissez la configuration du stockage vectoriel dans l’objet storageConfiguration. Pour plus d’informations, consultez Prérequis pour votre propre magasin de vecteurs pour une base de connaissances.

    • Pour une base OpenSearch de données Amazon Service, utilisez l'opensearchServerlessConfigurationobjet.

    • Pour un Pinecone base de données, utilisez l'pineconeConfigurationobjet.

    • Pour un Redis Enterprise Cloud base de données, utilisez l'redisEnterpriseCloudConfigurationobjet.

    • Pour une base de données Amazon Aurora, utilisez l'rdsConfigurationobjet.

    • Pour une base de données MongoDB Atlas, utilisez l'mongodbConfigurationobjet.

Après avoir créé une base de connaissances, créez une source de données contenant les documents ou le contenu de votre base de connaissances. Pour créer la source de données, envoyez une CreateDataSourcedemande. Consultez la section Sources de données prises en charge pour sélectionner votre source de données et suivez l'exemple de configuration de API connexion.

  • Fournissez les informations de connexion pour les fichiers de source de données dataSourceConfiguration sur le terrain.

  • Spécifiez comment segmenter les sources de données vectorIngestionConfiguration sur le terrain.

    Note

    Vous ne pouvez pas modifier la configuration du découpage après avoir créé la source de données.

  • Indiquez le dataDeletionPolicy pour votre source de données. Vous pouvez convertir DELETE toutes les données de votre source de données en incorporant des vecteurs lors de la suppression d'une base de connaissances ou d'une ressource de source de données. Ce drapeau est ignoré si un AWS compte est supprimé. Vous pouvez convertir RETAIN toutes les données de votre source de données en incorporant des vecteurs lors de la suppression d'une base de connaissances ou d'une ressource de source de données. Notez que le magasin vectoriel lui-même n'est pas supprimé si vous supprimez une base de connaissances ou une ressource de source de données.

  • (Facultatif) Lors de la conversion de vos données en éléments intégrés, Amazon Bedrock chiffre vos données à l'aide d'une clé qui les AWS possède et les gère par défaut. Pour utiliser votre propre KMS clé, incluez-la dans l'serverSideEncryptionConfigurationobjet. Pour de plus amples informations, veuillez consulter Chiffrement des ressources des bases de connaissances.

Configurez des configurations de sécurité pour votre base de connaissances

Après avoir créé une base de connaissances, vous devrez peut-être configurer les configurations de sécurité suivantes :

Définissez des politiques d'accès aux données pour votre base de connaissances

Si vous utilisez un rôle personnalisé, configurez des configurations de sécurité pour votre nouvelle base de connaissances. Si vous laissez Amazon Bedrock créer un rôle de service pour vous, vous pouvez ignorer cette étape. Suivez les étapes indiquées dans l’onglet correspondant à la base de données que vous avez configurée.

Amazon OpenSearch Serverless

Pour restreindre l'accès à la collection Amazon OpenSearch Serverless au rôle de service de base de connaissances, créez une politique d'accès aux données. Vous pouvez le faire de différentes manières :

Appliquez la politique d'accès aux données suivante, en spécifiant la collection Amazon OpenSearch Serverless et votre rôle de service :

[ { "Description": "${data access policy description}", "Rules": [ { "Resource": [ "index/${collection_name}/*" ], "Permission": [ "aoss:DescribeIndex", "aoss:ReadDocument", "aoss:WriteDocument" ], "ResourceType": "index" } ], "Principal": [ "arn:aws:iam::${account-id}:role/${kb-service-role}" ] } ]
Pinecone, Redis Enterprise Cloud or MongoDB Atlas

Pour intégrer un Pinecone, Redis Enterprise Cloud, index vectoriel MongoDB Atlas, associez la politique d'identité suivante à votre rôle de service de base de connaissances pour lui permettre d'accéder au AWS Secrets Manager secret de l'index vectoriel.

{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "bedrock:AssociateThirdPartyKnowledgeBase" ], "Resource": "*", "Condition": { "StringEquals": { "bedrock:ThirdPartyKnowledgeBaseCredentialsSecretArn": "arn:aws:iam::${region}:${account-id}:secret:${secret-id}" } } }] }

Configurez des politiques d'accès réseau pour votre base de connaissances Amazon OpenSearch Serverless

Si vous utilisez une collection Amazon OpenSearch Serverless privée pour votre base de connaissances, elle n'est accessible que via un AWS PrivateLink VPC point de terminaison. Vous pouvez créer une collection Amazon OpenSearch Serverless privée lorsque vous configurez votre collection vectorielle Amazon OpenSearch Serverless ou vous pouvez rendre privée une collection Amazon OpenSearch Serverless existante (y compris une collection créée pour vous par la console Amazon Bedrock) lorsque vous configurez sa politique d'accès au réseau.

Les ressources suivantes du manuel Amazon OpenSearch Service Developer Guide vous aideront à comprendre la configuration requise pour une collection Amazon OpenSearch Serverless privée :

Pour autoriser une base de connaissances Amazon Bedrock à accéder à une collection privée Amazon OpenSearch Serverless, vous devez modifier la politique d'accès réseau de la collection Amazon OpenSearch Serverless afin d'autoriser Amazon Bedrock en tant que service source. Sélectionnez l'onglet correspondant à la méthode de votre choix et suivez les étapes suivantes :

Console
  1. Ouvrez la console Amazon OpenSearch Service à l'adresse https://console.aws.amazon.com/aos/.

  2. Dans le volet de navigation de gauche, sélectionnez Collections. Choisissez ensuite votre collection.

  3. Dans la section Réseau, sélectionnez la politique associée.

  4. Choisissez Modifier.

  5. Pour Sélectionner la méthode de définition des politiques, effectuez l'une des opérations suivantes :

    • Laissez Select policy definition method comme éditeur visuel et configurez les paramètres suivants dans la section Règle 1 :

      1. (Facultatif) Dans le champ Nom de la règle, entrez le nom de la règle d'accès au réseau.

      2. Sous Accéder aux collections depuis, sélectionnez Privé (recommandé).

      3. Sélectionnez l'accès privé au AWS service. Dans la zone de texte, entrezbedrock.amazonaws.com.

      4. Désélectionnez Activer l'accès aux OpenSearch tableaux de bord.

    • Choisissez JSONet collez la politique suivante dans l'JSONéditeur.

      [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]
  6. Choisissez Mettre à jour.

API

Pour modifier la politique d'accès au réseau de votre collection Amazon OpenSearch Serverless, procédez comme suit :

  1. Envoyez une GetSecurityPolicydemande avec un point de terminaison OpenSearch sans serveur. Spécifiez name la politique et spécifiez le type commenetwork. Notez le policyVersion dans la réponse.

  2. Envoyez une UpdateSecurityPolicydemande avec un point de terminaison OpenSearch sans serveur. Spécifiez au minimum les champs suivants :

    Champ Description
    name Nom de la politique.
    policyVersion Ils vous ont été policyVersion renvoyés suite à la GetSecurityPolicy réponse.
    type Type de stratégie de sécurité. Spécifiez network.
    politique La politique à utiliser. Spécifiez l'JSONobjet suivant
    [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]

Pour un AWS CLI exemple, voir Création de politiques d'accès aux données (AWS CLI).

  • Utilisez la console Amazon OpenSearch Service en suivant les étapes de la section Création de politiques réseau (console). Au lieu de créer une politique réseau, notez la politique associée dans la sous-section Réseau des détails de la collecte.