Prérequis Préparer Aurora Postgre SQL pour en faire une base de connaissances Création d'une base de connaissances dans la console Bedrock

Utiliser Aurora Postgre SQL comme base de connaissances pour Amazon Bedrock

Vous pouvez utiliser un cluster de base de SQL données Aurora Postgre comme base de connaissances pour Amazon Bedrock. Pour plus d’informations, consultez Création d’un stockage vectoriel dans Amazon Aurora. Une base de connaissances prend automatiquement les données de texte non structurées stockées dans un compartiment Amazon S3, les convertit en fragments de texte et en vecteurs, et les stocke dans une base de données SQL Postgre. Avec les applications d'IA générative, vous pouvez utiliser Agents for Amazon Bedrock pour interroger les données stockées dans la base de connaissances et utiliser les résultats de ces requêtes pour compléter les réponses fournies par les modèles fondamentaux. Ce flux de travail s'appelle Retrieval Augmented Generation (RAG). Pour plus d'informations surRAG, voir Retrieval Augmented Generation (RAG).

Pour obtenir des informations détaillées sur l'utilisation d'Aurora Postgre SQL pour créer des applications d'IA génératives à l'aide d'Aurora PostgreRAG, consultez ce billet de blog.

Rubriques

Prérequis
Préparation d'Aurora Postgre SQL en vue de son utilisation comme base de connaissances pour Amazon Bedrock
Création d'une base de connaissances dans la console Bedrock
Création rapide d'une base de SQL connaissances Aurora Postgre pour Amazon Bedrock

Prérequis

Familiarisez-vous avec les prérequis suivants pour utiliser le SQL cluster Aurora Postgre comme base de connaissances pour Amazon Bedrock. À un niveau supérieur, vous devez configurer les services suivants pour une utilisation avec Bedrock :

Cluster de SQL base de données Amazon Aurora Postgre créé dans l'une des versions suivantes :
- 16.1 et toutes les versions supérieures
- Version 15.4 et versions ultérieures
- Version 14.9 et versions ultérieures
- Versions 13.12 et supérieures
- Versions 12.16 et supérieures
Note
Vous devez activer l'pgvectorextension dans votre base de données cible et utiliser la version 0.5.0 ou supérieure. Pour plus d'informations, consultez pgvector v0.5.0 avec indexation. HNSW
RDSDonnées API
Un utilisateur géré dans AWS Secrets Manager. Pour de plus amples informations, veuillez consulter Gestion des mots de passe avec Amazon Aurora et AWS Secrets Manager.

Préparation d'Aurora Postgre SQL en vue de son utilisation comme base de connaissances pour Amazon Bedrock

Suivez les étapes décrites dans les sections ci-dessous pour préparer Aurora Postgre SQL à être utilisé comme base de connaissances pour Amazon Bedrock.

Création et configuration d'Aurora Postgre SQL

Pour configurer Amazon Bedrock avec un cluster de SQL base de données Aurora Postgre, vous devez d'abord créer un cluster de SQL base de données Aurora Postgre et prendre note des champs importants pour le configurer avec Amazon Bedrock. Pour plus d'informations sur la création d'un cluster de SQL base de données Aurora Postgre, consultezCréation et connexion à un cluster de bases de données Aurora PostgreSQL.

Activez les données API lors de la création du cluster de SQL base de données Aurora Postgre. Pour plus d'informations sur les versions prises en charge, consultezUtilisation de l'API de données RDS.
Assurez-vous de noter les Amazon Resource Names (ARN) de votre cluster de SQL base de données Aurora Postgre. Vous en aurez besoin pour configurer le cluster de base de données à utiliser avec Amazon Bedrock. Pour plus d'informations, consultez Amazon Resource Names (ARNs).

Connexion à une base de données et installation de pgvector

Vous pouvez vous connecter à Aurora Postgre à SQL l'aide de n'importe quel utilitaire de connexion. Pour des informations plus détaillées sur ces utilitaires, consultezConnexion à un cluster de SQL base de données Amazon Aurora Postgre. Vous pouvez également utiliser l'éditeur de requêtes de RDS console pour exécuter les requêtes. Vous avez besoin d'un cluster de base de données Aurora avec les RDS données API activées pour utiliser l'éditeur de requêtes.

Connectez-vous à la base de données avec votre utilisateur principal et configurez pgvector. Utilisez la commande suivante si l'extension n'est pas installée :
```
CREATE EXTENSION IF NOT EXISTS vector;
```
Utilisez la version pgvector 0.5.0 ou supérieure qui prend en charge l'HNSWindexation. Pour plus d'informations, consultez pgvector v0.5.0 avec indexation. HNSW
Utilisez la commande suivante pour vérifier la version du système pg_vector installé :
```
SELECT extversion FROM pg_extension WHERE extname='vector';
```

Configuration des objets et des privilèges de base de données

Créez un schéma spécifique que Bedrock peut utiliser pour interroger les données. Utilisez la commande suivante pour créer un schéma :
```
CREATE SCHEMA bedrock_integration;
```
Créez un nouveau rôle que Bedrock pourra utiliser pour interroger la base de données. Utilisez la commande suivante pour créer un nouveau rôle :
```
CREATE ROLE bedrock_user WITH PASSWORD 'password' LOGIN;
```
Note
Prenez note de ce mot de passe car vous en aurez besoin ultérieurement pour créer un mot de passe Secrets Manager.

Si vous utilisez un psql client, utilisez les commandes suivantes pour créer un nouveau rôle :
```
CREATE ROLE bedrock_user LOGIN;
\PASSWORD password;
```
Accordez les bedrock_user autorisations nécessaires pour gérer le bedrock_integration schéma. Cela permettra de créer des tables ou des index dans le schéma.
```
GRANT ALL ON SCHEMA bedrock_integration to bedrock_user;
```
Connectez-vous en tant que bedrock_user et créez une table dans lebedrock_integration schema.
```
CREATE TABLE bedrock_integration.bedrock_kb (id uuid PRIMARY KEY, embedding vector(n), chunks text, metadata json);
```
Cette commande créera la bedrock_kb table dans le bedrock_integration schéma avec les intégrations Titan.

Remplacez n dans le type de vector(n) données par la dimension appropriée pour le modèle d'intégration que vous utilisez. Utilisez les recommandations ci-dessous pour vous aider à sélectionner vos dimensions :
- Pour le modèle Titan v2vector(1024), utilisezvector(512), ouvector (256). Pour en savoir plus, consultez le texte d'intégration d'Amazon Titan.
- Pour le modèle Titan v1.2, utilisezvector(1536). Pour en savoir plus, consultez Amazon Titan Multimodal Embeddings G1.
- Pour le modèle Cohere Embed, utilisez. vector(1024) Pour en savoir plus, consultez la section Modèles Cohere Embed.
- Pour le Cohere Embed Multilingual v3, utilisez. vector(1024)
Nous vous recommandons de créer un index avec l'opérateur cosinus que le socle rocheux peut utiliser pour interroger les données.
```
CREATE INDEX ON bedrock_integration.bedrock_kb USING hnsw (embedding vector_cosine_ops);
```
Nous vous recommandons de définir la valeur 256 ef_construction pour les pgvector versions 0.6.0 et supérieures qui utilisent la création d'index en parallèle.
```
CREATE INDEX ON bedrock_integration.bedrock_kb USING hnsw (embedding vector_cosine_ops) WITH (ef_construction=256);
```

Création d'un secret dans Secrets Manager

Secrets Manager vous permet de stocker vos informations d'identification Aurora afin qu'elles puissent être transmises en toute sécurité aux applications. Si vous n'avez pas choisi l'option du gestionnaire de AWS secrets lors de la création du cluster de SQL base de données Aurora Postgre, vous pouvez créer un secret maintenant. Pour plus d'informations sur la création d'un secret AWS Secrets Manager de base de données, consultez la section Secret de base de données AWS Secrets Manager.

Création d'une base de connaissances dans la console Bedrock

Lors de la préparation SQL d'Aurora Postgre en vue de son utilisation comme magasin vectoriel pour une base de connaissances, vous devez rassembler les informations suivantes que vous devez fournir à la console Amazon Bedrock.

Cluster de base de données Amazon Aurora ARN : celui ARN de votre cluster de bases de données.
Secret ARN — La clé ARN du Gestionnaire de AWS Secrets pour votre cluster de base de données.
Nom de la base de données : nom de votre base de données. Par exemple, vous pouvez utiliser la base de données par défautpostgres.
Nom de la table : nous vous recommandons de fournir un nom qualifié de schéma lors de la création de la table à l'aide d'une commande similaire à la suivante :
```
CREATE TABLE bedrock_integration.bedrock_kb;
```
Cette commande créera la bedrock_kb table dans le bedrock_integration schéma.

Lorsque vous créez la table, assurez-vous de la configurer avec les colonnes et les types de données spécifiés. Vous pouvez utiliser les noms de colonne de votre choix au lieu de ceux répertoriés dans le tableau. N'oubliez pas de prendre note des noms que vous avez choisis comme référence lors de la configuration de la base de connaissances.

Nom de la colonne	Type de données	Description
id	UUIDclé primaire	Contient des identifiants uniques pour chaque enregistrement.
morceaux	Texte	Contient les segments de texte brut provenant de vos sources de données.
embedding	Vector	Contient les intégrations vectorielles des sources de données.
métadonnées	JSON	Contient les métadonnées nécessaires pour effectuer l'attribution de la source et pour permettre l'ingestion et l'interrogation des données.

Avec ces informations, vous pouvez désormais créer une base de connaissances dans la console Bedrock. Pour des informations plus détaillées sur la configuration d'un index vectoriel et la création d'une base de connaissances, consultez les sections Création d'un magasin de vecteurs dans Amazon Aurora et Création d'un magasin de vecteurs dans Amazon Aurora.

Après avoir ajouté Aurora comme base de connaissances, vous pouvez désormais ingérer vos sources de données pour effectuer des recherches et des requêtes. Pour plus d'informations, voir Ingérer vos sources de données dans la base de connaissances.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Surveillance du transfert d'écriture local dans Aurora Postgre SQL

Création rapide d'une base de SQL connaissances Aurora Postgre pour Amazon Bedrock