

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Création d'une base de connaissances gérée
<a name="kb-managed-create"></a>

Lorsque vous créez une base de connaissances gérée, Amazon Bedrock AgentCore gère l'infrastructure de stockage, d'indexation et de récupération pour vous. Par défaut, un modèle d'intégration géré par le service est utilisé et aucune sélection ou configuration de modèle n'est requise. Vous pouvez éventuellement fournir votre propre modèle d'intégration Bedrock à la place. Vous pouvez également éventuellement fournir une clé KMS pour le chiffrement du magasin vectoriel géré.

Après avoir créé la base de connaissances, connectez-la à une source de données et lancez l'ingestion. Pour plus de détails sur la connexion d'une source de données, voir [Connecter une source de données](kb-managed-connect-ds.md). Pour synchroniser une source de données, utilisez l'`StartIngestionJob`API. Pour en savoir plus, consultez [Synchronisation de vos données avec votre base de connaissances Amazon Bedrock](kb-data-source-sync-ingest.md).

Pour savoir comment créer une base de connaissances gérée, choisissez l'onglet correspondant à votre méthode préférée :

------
#### [ Console ]

**Pour créer une base de connaissances gérée**

1. Connectez-vous au AWS Management Console et accédez à Amazon Bedrock AgentCore > **Built-in outils** > **Base de connaissances**.

1. Choisissez **Créer une base de connaissances gérée**.

1. (Facultatif) Développez la section **Configurations supplémentaires** des **détails de la base de connaissances** pour configurer les éléments suivants :
   + Ajoutez une description.
   + Choisissez un type de modèle d'intégration :
     + **Géré** (par défaut) : un modèle d'intégration géré par le service est utilisé. Aucune sélection ou configuration de modèle n'est requise.
     + **Personnalisé** : Sélectionnez un modèle d'intégration Bedrock. Choisissez le modèle pour ouvrir le sélecteur de modèles, qui indique les fournisseurs (Amazon, Cohere) et les modèles disponibles.
   + Configurez les autorisations IAM : choisissez **Créer et utiliser un nouveau rôle de service** (recommandé) ou sélectionnez un rôle existant.
   + Configurez le AWS KMS chiffrement pour le magasin vectoriel AWS géré (clé gérée par défaut, ou sélectionnez une clé KMS personnalisée).

1. Sous **Source de données**, indiquez le nom de la source de données.

1. Sélectionnez votre type de source de données dans la liste déroulante : Amazon S3, Confluence, Custom, Google Drive ou Web SharePoint Crawler. OneDrive

1. Configurez les paramètres de connexion à la source de données pour le type de source de données sélectionné.

1. (Facultatif) Développez l'**analyse et le découpage du contenu pour** configurer les éléments suivants :
   + La stratégie d'analyse est définie sur **Managed parser par défaut**.
   + Sélectionnez une stratégie de découpage du texte dans la liste déroulante :
     + **Découpage par défaut (recommandé) : divise le texte en segments** de taille fixe.
     + **Fixed-size découpage :** divise le texte selon la taille approximative du jeton que vous avez définie.
     + **Pas de découpage :** pour les documents prétraités ou pré-divisés.

1. (Facultatif) Développez **les configurations avancées** pour configurer l'indexation avancée. Sous **Indexation du contenu**, le contenu textuel par défaut indexe les documents courants. Activez l'indexation avancée pour des modalités supplémentaires :
   + **Contenu visuel des documents** : traite les éléments visuels intégrés dans des fichiers .pdf, .docx, .ppt, .pptx.
   + **Fichiers audio** : traite les fichiers .mp3, .wav, .m4a, .flac, .ogg.
   + **Fichiers vidéo** : traite les fichiers .mp4, .mov, .m4v.

   Définissez éventuellement une taille de fichier maximale (Mo) et configurez le dispositif de protection contre la suppression des documents.

1. (Facultatif) Configurez la livraison des journaux pour envoyer les journaux d'ingestion de la base de connaissances vers une destination telle que CloudWatch Logs, Amazon S3 ou Firehose.

1. Choisissez **Créer une base de connaissances**.

1. Attendez que la base de connaissances et la source de données soient créées (2 à 5 minutes). Si vous créez une base de connaissances gérée à l'aide d'une clé gérée par le client, la création peut prendre plus de temps.

------
#### [ API ]

Voici un exemple de création d'une base de connaissances gérée et de configuration de votre source de données à l'aide de l'API avec le SDK compatible AWS CLI ou compatible, tel que Python. Après avoir appelé [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html), vous appelez [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)pour créer votre source de données avec vos informations de connexion`dataSourceConfiguration`.

Pour en savoir plus sur les personnalisations que vous pouvez appliquer à l’ingestion en incluant le champ facultatif `vectorIngestionConfiguration`, consultez [Personnalisation de l’ingestion pour une source de données](kb-managed-customize-ingestion.md).

**AWS Command Line Interface**

**Étape 1 : Création de la base de connaissances**

Avec un modèle d'intégration géré (par défaut) :

```
aws bedrock-agent create-knowledge-base \
 --name "{{my-managed-kb}}" \
 --role-arn "{{arn:aws:iam::123456789012:role/BedrockKBRole}}" \
 --description "{{My managed knowledge base}}" \
 --knowledge-base-configuration file://kb-config.json

kb-config.json
{
    "type": "MANAGED",
    "managedKnowledgeBaseConfiguration": {
        "embeddingModelType": "MANAGED"
    }
}
```

Avec un modèle d'intégration personnalisé (modèle Bedrock fourni par le client) :

```
aws bedrock-agent create-knowledge-base \
 --name "{{my-custom-embed-kb}}" \
 --role-arn "{{arn:aws:iam::123456789012:role/BedrockKBRole}}" \
 --description "{{My managed knowledge base with custom embedding}}" \
 --knowledge-base-configuration file://kb-config.json

kb-config.json
{
    "type": "MANAGED",
    "managedKnowledgeBaseConfiguration": {
        "embeddingModelType": "CUSTOM",
        "embeddingModelArn": "{{arn:aws:bedrock:us-west-2::foundation-model/amazon.titan-embed-text-v2:0}}",
        "embeddingModelConfiguration": {
            "bedrockEmbeddingModelConfiguration": {
                "dimensions": 1024
            }
        }
    }
}
```

**Note**  
Lorsqu'il `embeddingModelType` est omis, la valeur par défaut est. `MANAGED` Lors de l'utilisation`MANAGED`, vous ne devez pas spécifier `embeddingModelArn` ou`embeddingModelConfiguration`. Lors de l'utilisation`CUSTOM`, les deux champs sont obligatoires.

**Étape 2 : Création d'une source de données**

```
aws bedrock-agent create-data-source \
 --name "{{S3-connector}}" \
 --description "{{S3 data source connector for Amazon Bedrock to use content in S3}}" \
 --knowledge-base-id "{{your-knowledge-base-id}}" \
 --data-source-configuration file://bedrock-s3-managed-connector-configuration.json \
 --data-deletion-policy "DELETE" \
 --vector-ingestion-configuration '{"parsingConfiguration":{"parsingStrategy":"SMART_PARSING"}}'

bedrock-s3-managed-connector-configuration.json
{
    "type": "MANAGED_KNOWLEDGE_BASE_CONNECTOR",
    "managedKnowledgeBaseConnectorConfiguration": {
        "mediaExtractionConfiguration": {
            "imageExtractionConfiguration": {
                "imageExtractionStatus": "ENABLED"
            }
        },
        "connectorParameters": {
            "type": "S3",
            "version": "1",
            "connectionConfiguration": {
                "bucketName": "{{your-test-s3-bucket}}",
                "bucketOwnerAccountId": "{{123456789012}}"
            },
            "deletionProtectionConfiguration": {
                "enableDeletionProtection": false
            }
        }
    }
}
```

------

## Intégration d'options de modèle
<a name="kb-managed-embedding-models"></a>

Les bases de connaissances gérées prennent en charge deux types de modèles d'intégration :
+ **Intégration gérée** (par défaut) : un modèle d'intégration géré par le service est utilisé automatiquement. Vous n'avez pas besoin de sélectionner un modèle, de configurer les dimensions ou de gérer les limites de service Bedrock pour l'intégration. Le service gère la sélection, l'hébergement et le dimensionnement des modèles de manière transparente.
+ **Intégration personnalisée** — Vous fournissez votre propre modèle d'intégration Bedrock ARN. Lorsque vous utilisez un modèle d'intégration personnalisé, vous devez spécifier les dimensions du modèle (1024) et le type de données d'intégration float32. Les modèles d'intégration Bedrock suivants sont pris en charge :
  + Plongement lexical Amazon Titan V2
  + Cohere Embed English v3
  + Cohere Embed Multilingual v3
  + Cohere Embed v4
  + Intégrations multimodales Amazon Nova

**Note**  
Vous ne pouvez pas modifier le type de modèle d'intégration après avoir créé la base de connaissances. Pour passer de l'intégration gérée à l'intégration personnalisée, vous devez créer une nouvelle base de connaissances.

**Important**  
Si vous créez une base de connaissances avec un modèle d'intégration personnalisé, le reclassement géré n'est pas disponible pour cette base de connaissances. Pour utiliser le reclassement géré, créez votre base de connaissances avec le modèle d'intégration géré par défaut.

## Connecteurs de source de données pris en charge
<a name="kb-managed-connectors"></a>

Les bases de connaissances gérées prennent en charge les connecteurs de source de données suivants :
+ Amazon S3
+ Confluence
+ Microsoft SharePoint
+ Google Drive
+ Microsoft OneDrive
+ Robot Web
+ Connecteur personnalisé

Pour plus d'informations sur la configuration des connecteurs de source de données, voir [Connecter une source de données](kb-managed-connect-ds.md).