Créez une base de connaissances en vous connectant à une source de données dans les bases de connaissances Amazon Bedrock

Lorsque vous créez une base de connaissances en vous connectant à une source de données, vous configurez ou spécifiez les éléments suivants :

Informations générales qui définissent et identifient la base de connaissances
Rôle de service avec autorisations d'accès à la base de connaissances.
Configurations pour la base de connaissances, y compris le modèle d'intégration à utiliser lors de la conversion des données à partir de la source de données, les configurations de stockage pour le service dans lequel les intégrations doivent être stockées et, éventuellement, un emplacement S3 pour stocker les données multimodales.

Note

Il n'est pas possible de créer une base de connaissances avec un utilisateur root. Connectez-vous avec un utilisateur IAM avant de commencer ces étapes.

Développez la section correspondant à votre cas d'utilisation :

Pour configurer une base de connaissances

Connectez-vous au AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ouvrez ensuite la console Amazon Bedrock à l'adresse https://console.aws.amazon.com/bedrock.
Dans le volet de navigation de gauche, sélectionnez Knowledge bases.
Dans la section Bases de connaissances, cliquez sur le bouton Créer et sélectionnez cette option pour créer une base de connaissances avec un magasin vectoriel.
(Facultatif) Modifiez le nom par défaut et fournissez une description de votre base de connaissances.
Choisissez un rôle AWS Identity and Access Management (IAM) qui autorise Amazon Bedrock à accéder aux autres services requis. AWS Vous pouvez laisser Amazon Bedrock créer le rôle de service ou choisir d'utiliser votre propre rôle personnalisé que vous avez créé pour Neptune Analytics.
Choisissez une source de données à laquelle connecter votre base de connaissances.
(Facultatif) Ajoutez des balises à votre base de connaissances. Pour de plus amples informations, veuillez consulter Marquer les ressources Amazon Bedrock.
(Facultatif) Configurez les services pour lesquels vous souhaitez fournir des journaux d'activité pour votre base de connaissances.
Passez à la section suivante et suivez les étapes décrites Connect une source de données à votre base de connaissances pour configurer une source de données.
Dans la section Modèle d'intégration, procédez comme suit :
1. Choisissez un modèle d'intégration pour convertir vos données en intégrations vectorielles.
2. (Facultatif) Développez la section Configurations supplémentaires pour voir les options de configuration suivantes (tous les modèles ne prennent pas en charge toutes les configurations) :
  - Type d'intégration : s'il faut convertir les données en intégrations vectorielles à virgule flottante (float32) (plus précises, mais plus coûteuses) ou en intégrations vectorielles binaires (moins précises, mais moins coûteuses). Pour savoir quels modèles d'intégration prennent en charge les vecteurs binaires, reportez-vous à la section Modèles d'intégration pris en charge.
  - Dimensions du vecteur : des valeurs plus élevées améliorent la précision, mais augmentent le coût et la latence.
Dans la section Base de données vectorielle, procédez comme suit :
1. Choisissez un magasin vectoriel pour stocker les intégrations vectorielles qui seront utilisées pour la requête. Vous avez les options suivantes :
  - Créez rapidement une nouvelle boutique vectorielle : choisissez l'une des boutiques vectorielles disponibles pour Amazon Bedrock. Vous pouvez également éventuellement configurer le chiffrement AWS KMS des clés pour votre magasin de vecteurs.
    
    Note
    Lorsque vous utilisez cette option, Amazon Bedrock gère automatiquement le placement des métadonnées pour chaque magasin de vecteurs.
    Amazon OpenSearch Serverless — Amazon Bedrock Knowledge Bases crée une collection et un index de recherche vectorielle Amazon OpenSearch Serverless et les configure avec les champs obligatoires pour vous.
    
    Amazon Aurora PostgreSQL Serverless : Amazon Bedrock met en place un magasin vectoriel Amazon Aurora PostgreSQL Serverless. Ce processus extrait les données texte non structurées d'un compartiment Amazon S3, les transforme en fragments de texte et en vecteurs, puis les stocke dans une base de données PostgreSQL. Pour plus d'informations, consultez Création rapide d'une base de connaissances Aurora PostgreSQL pour Amazon Bedrock.
    
    Amazon Neptune Analytics — Amazon Bedrock utilise des techniques de génération augmentée (RAG) associées à des graphiques pour améliorer les applications d'IA générative afin que les utilisateurs finaux puissent obtenir des réponses plus précises et complètes.
    
    Vecteurs Amazon S3 — Les bases de connaissances Amazon Bedrock créent un compartiment vectoriel S3 et un index vectoriel qui stockeront les intégrations générées à partir de vos sources de données.
    
    Important
    L'intégration d'Amazon S3 Vectors aux bases de connaissances Amazon Bedrock est en version préliminaire et est sujette à modification.
    
    Vous pouvez créer une base de connaissances pour les vecteurs Amazon S3 dans tous les Région AWS sites où Amazon Bedrock et Amazon S3 Vectors sont disponibles. Pour obtenir des informations sur la disponibilité des régions, consultez la section Amazon S3 Vectors dans le guide de l'utilisateur Amazon S3.
    
    Note
    Lorsque les bases de connaissances Amazon Bedrock créent un index vectoriel pour vous, elles peuvent associer un maximum de 40 Ko de métadonnées à chaque vecteur. Dans ces 40 Ko, un maximum de 2 Ko peuvent être utilisés comme métadonnées filtrables.
    Amazon Bedrock stockera le texte dans l'espace non filtrable en tant que clé. AMAZON_BEDROCK_TEXT Les métadonnées ajoutées par Amazon Bedrock sont stockées dans l'espace de métadonnées filtrable. Pour plus d'informations sur les limites des métadonnées des compartiments vectoriels S3, consultez Conditions préalables à l'utilisation des vecteurs Amazon S3 avec les bases de connaissances Amazon Bedrock.
  - Choisissez un magasin de vecteurs que vous avez créé : sélectionnez un magasin de vecteurs pris en charge et identifiez les noms des champs vectoriels et les noms des champs de métadonnées dans l'index vectoriel. Pour de plus amples informations, veuillez consulter Conditions préalables à l'utilisation d'un magasin vectoriel que vous avez créé pour une base de connaissances.
    
    Note
    Si votre source de données est une instance Confluence, Microsoft ou Salesforce SharePoint, le seul service de boutique vectorielle pris en charge est Amazon OpenSearch Serverless.
2. (Facultatif) Développez la section Configurations supplémentaires et modifiez les configurations pertinentes.
Si votre source de données contient des images, spécifiez un URI Amazon S3 dans lequel stocker les images que l'analyseur va extraire des données de la destination de stockage multimodal. Les images peuvent être renvoyées lors de la requête. Vous pouvez également choisir une clé gérée par le client au lieu de la clé par défaut Clé gérée par AWS pour chiffrer vos données.

Note
Les données multimodales ne sont prises en charge qu'avec Amazon S3 et les sources de données personnalisées.
Choisissez Next et passez en revue les détails de votre base de connaissances. Vous pouvez modifier n'importe quelle section avant de créer votre base de connaissances.

Note
Le temps nécessaire à la création de la base de connaissances dépend de vos configurations spécifiques. Lorsque la création de la base de connaissances est terminée, le statut de la base de connaissances change pour indiquer qu'elle est prête ou disponible.
Une fois que votre base de connaissances est prête et disponible, synchronisez votre source de données pour la première fois et chaque fois que vous souhaitez maintenir votre contenu à jour. Sélectionnez votre base de connaissances dans la console, puis sélectionnez Synchroniser dans la section de présentation des sources de données.

Pour créer une base de connaissances, envoyez une CreateKnowledgeBasedemande à un point de terminaison Agents for Amazon Bedrock Build-time.

Note

Si vous préférez laisser Amazon Bedrock créer et gérer une boutique vectorielle pour vous, utilisez la console. Pour plus d'informations, développez la section Utiliser la console de cette rubrique.

Les champs suivants sont obligatoires :

Champ	Description de base
name	Un nom pour la base de connaissances
roleArn	L'ARN d'un rôle de service Amazon Bedrock Knowledge Bases.
knowledgeBaseConfiguration	Contient des configurations pour la base de connaissances. Voir les détails ci-dessous.
Configuration du stockage	(Obligatoire uniquement si vous vous connectez à une source de données non structurée).Contient les configurations du service de source de données que vous choisissez.

Les champs suivants sont facultatifs :

Champ	Cas d’utilisation
description	Description de la base de connaissances.
clientToken	Pour garantir que la demande d'API ne soit terminée qu'une seule fois. Pour plus d'informations, consultez la section Garantir l'idempuissance.
balises	Pour associer des balises au flux. Pour de plus amples informations, veuillez consulter Marquer les ressources Amazon Bedrock.

Dans le knowledgeBaseConfiguration champ, qui correspond à un KnowledgeBaseConfigurationobjet, spécifiez-le VECTOR dans le type champ et incluez un VectorKnowledgeBaseConfigurationobjet. Dans l'objet, incluez les champs suivants :

embeddingModelArn— L'ARN du modèle d'intégration à utiliser.
embeddingModelConfiguration— Configurations pour le modèle d'intégration. Pour voir les valeurs possibles que vous pouvez spécifier pour chaque modèle pris en charge, voirModèles et régions pris en charge pour les bases de connaissances Amazon Bedrock.
(Si vous prévoyez d'inclure des données multimodales, notamment des images, des figures, des graphiques ou des tableaux, dans votre base de connaissances) supplementalDataStorageConfiguration : correspond à un SupplementalDataStorageLocationobjet, dans lequel vous spécifiez l'emplacement S3 dans lequel vous souhaitez stocker les données extraites. Pour de plus amples informations, veuillez consulter Options d'analyse pour votre source de données.

Dans le storageConfiguration champ, qui correspond à un StorageConfigurationobjet, spécifiez le magasin de vecteurs auquel vous souhaitez vous connecter dans le type champ et incluez le champ correspondant à ce magasin de vecteurs. Consultez chaque type de configuration de magasin vectoriel sur StorageConfigurationpour plus de détails sur les informations que vous devez fournir.

Voici un exemple de demande pour créer une base de connaissances connectée à une collection Amazon OpenSearch Serverless. Les données provenant de sources de données connectées seront converties en intégrations vectorielles binaires avec Amazon Titan Text Embeddings V2 et les données multimodales extraites par l'analyseur seront configurées pour être stockées dans un bucket appelé. MyBucket


PUT /knowledgebases/ HTTP/1.1
Content-type: application/json

{
   "name": "MyKB",
   "description": "My knowledge base",
   "roleArn": "arn:aws:iam::111122223333:role/service-role/AmazonBedrockExecutionRoleForKnowledgeBase_123",
   "knowledgeBaseConfiguration": {
      "type": "VECTOR",
      "vectorKnowledgeBaseConfiguration": { 
         "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.titan-embed-text-v2:0",
         "embeddingModelConfiguration": { 
            "bedrockEmbeddingModelConfiguration": { 
               "dimensions": 1024,
               "embeddingDataType": "BINARY"
            }
         },
         "supplementalDataStorageConfiguration": { 
            "storageLocations": [ 
               { 
                  "s3Location": { 
                     "uri": "arn:aws:s3:::MyBucket"
                  },
                  "type": "S3"
               }
            ]
         }
      }
   },
   "storageConfiguration": { 
      "opensearchServerlessConfiguration": { 
         "collectionArn": "arn:aws:aoss:us-east-1:111122223333:collection/abcdefghij1234567890",
         "fieldMapping": { 
            "metadataField": "metadata",
            "textField": "text",
            "vectorField": "vector"
         },
         "vectorIndexName": "MyVectorIndex"
      }
   }
}

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Configuration des OpenSearch autorisations avec un contrôle d'accès précis

Connect une source de données

Créez une base de connaissances en vous connectant à une source de données dans les bases de connaissances Amazon Bedrock

Note

Pour configurer une base de connaissances

Note

Important

Note

Note

Note

Note

Note

Rubriques