Gérer une source de données - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Gérer une source de données

Après avoir créé une source de données, vous pouvez en afficher les détails, la mettre à jour ou la supprimer.

Afficher les informations relatives à une source de données

Vous pouvez consulter les informations relatives à votre source de données et à son historique de synchronisation. Sélectionnez l'onglet correspondant à la méthode de votre choix et suivez les étapes.

Console
Pour afficher les informations relatives à une source de données
  1. Connectez-vous à la AWS Management Console console Amazon Bedrock et ouvrez-la à l'adresse https://console.aws.amazon.com/bedrock/.

  2. Dans le volet de navigation de gauche, sélectionnez Base de connaissances.

  3. Dans la section Source de données, sélectionnez la source de données dont vous souhaitez afficher les détails.

  4. La vue d'ensemble de la source de données contient des informations détaillées sur la source de données.

  5. L'historique de synchronisation contient des informations sur le moment où la source de données a été synchronisée. Pour connaître les raisons de l'échec d'un événement de synchronisation, sélectionnez un événement de synchronisation et choisissez Afficher les avertissements.

API

Pour obtenir des informations sur une source de données, envoyez une GetDataSourcedemande à un point de terminaison Agents for Amazon Bedrock et spécifiez le dataSourceId et le knowledgeBaseId de la base de connaissances à laquelle elle appartient.

Pour répertorier les informations relatives aux sources de données d'une base de connaissances, envoyez une ListDataSourcesdemande à un point de terminaison Agents for Amazon Bedrock Build-time et spécifiez l'ID de la base de connaissances.

  • Pour définir le nombre maximum de résultats à renvoyer dans une réponse, utilisez le maxResults champ.

  • S'il y a plus de résultats que le nombre que vous avez défini, la réponse renvoie unnextToken. Vous pouvez utiliser cette valeur dans une autre ListDataSources demande pour voir le prochain lot de résultats.

Pour obtenir des informations sur un événement de synchronisation pour une source de données, envoyez une GetIngestionJobdemande à un point de terminaison Agents for Amazon Bedrock Build-time. Spécifiez le dataSourceIdknowledgeBaseId, etingestionJobId.

Pour répertorier l'historique de synchronisation d'une source de données dans une base de connaissances, envoyez une ListIngestionJobsdemande à un point de terminaison Agents for Amazon Bedrock au moment de la création. Spécifiez l’ID de la base de connaissances et de la source de données. Vous pouvez définir les spécifications suivantes.

  • Filtrez les résultats en spécifiant le statut à rechercher dans l’objet filters.

  • Pour effectuer un tri en fonction de l’heure à laquelle la tâche a été lancée ou du statut d’une tâche, spécifiez l’objet sortBy. Vous pouvez spécifier un ordre de tri croissant ou décroissant.

  • Spécifiez le nombre maximum de résultats à renvoyer en réponse dans le champ maxResults. S'il y a plus de résultats que le nombre que vous avez défini, la réponse renvoie un nextToken que vous pouvez envoyer dans une autre ListIngestionJobsdemande pour voir le prochain lot de tâches.

Met à jour une source de données

Vous pouvez mettre à jour une source de données de différentes manières :

  • Ajoutez, modifiez ou supprimez des fichiers du compartiment S3 qui contient les fichiers de la source de données.

  • Modifiez le nom ou le compartiment S3 de la source de données, ou la clé KMS à utiliser pour chiffrer les données transitoires lors de l'ingestion des données.

  • Définissez votre politique de suppression des sources de données en les supprimant ou en les conservant. Si cette option est définie sur Supprimer, toutes les données sous-jacentes appartenant à la source de données provenant du magasin vectoriel sont supprimées lorsque vous supprimez une base de connaissances ou une ressource de source de données. Si cette option est définie sur Conserver, toutes les données sous-jacentes appartenant à la source de données issues du magasin vectoriel sont conservées lorsque vous supprimez une base de connaissances ou une ressource de source de données.

Chaque fois que vous ajoutez, modifiez ou supprimez des fichiers du compartiment S3 pour une source de données, vous devez synchroniser la source de données afin qu'elle soit réindexée dans la base de connaissances. La synchronisation étant incrémentielle, Amazon Bedrock traite uniquement les objets de votre compartiment S3 qui ont été ajoutés, modifiés ou supprimés depuis la dernière synchronisation. Avant de commencer l'ingestion, vérifiez que votre source de données remplit les conditions suivantes :

  • Les fichiers sont dans des formats pris en charge. Pour plus d’informations, consultez Configurez un index vectoriel pour votre base de connaissances dans un magasin de vecteurs compatible.

  • Les fichiers ne dépassent pas la taille maximale de 50 Mo. Pour plus d’informations, consultez Quotas de base de connaissances.

  • Si votre source de données contient des fichiers de métadonnées, vérifiez les conditions suivantes pour vous assurer que les fichiers de métadonnées ne sont pas ignorés :

    • Chaque .metadata.json fichier porte le même nom que le fichier source auquel il est associé.

    • Si l'index vectoriel de votre base de connaissances se trouve dans un magasin de vecteurs Amazon OpenSearch Serverless, vérifiez qu'il est configuré avec le faiss moteur. Si l'index vectoriel est configuré avec le nmslib moteur, vous devrez effectuer l'une des opérations suivantes :

    • Si l'index vectoriel de votre base de connaissances se trouve dans un cluster de bases de données Amazon Aurora, vérifiez que la table de votre index contient une colonne pour chaque propriété de métadonnées de vos fichiers de métadonnées avant de commencer l'ingestion.

Pour savoir comment mettre à jour une source de données, sélectionnez l'onglet correspondant à la méthode de votre choix et suivez les étapes.

Console
Pour mettre à jour une source de données
  1. (Facultatif) Apportez les modifications nécessaires aux fichiers du compartiment S3 qui contient les fichiers de la source de données.

  2. Connectez-vous à la AWS Management Console console Amazon Bedrock et ouvrez-la à l'adresse https://console.aws.amazon.com/bedrock/.

  3. Dans le volet de navigation de gauche, sélectionnez Base de connaissances.

  4. Dans la section Source de données, sélectionnez le bouton radio à côté de la source de données que vous souhaitez synchroniser.

  5. (Facultatif) Choisissez Modifier, modifiez les configurations nécessaires, puis sélectionnez Soumettre.

  6. (Facultatif) Choisissez de modifier la politique de suppression des données de votre source de données dans le cadre des paramètres avancés :

    • Supprimer : Supprime toutes les données sous-jacentes appartenant à la source de données du magasin vectoriel lors de la suppression d'une base de connaissances ou d'une ressource de source de données. Notez que le magasin vectoriel lui-même n'est pas supprimé, seules les données sous-jacentes sont supprimées. Ce drapeau est ignoré si un AWS compte est supprimé.

    • Conserver : conserve toutes les données sous-jacentes dans votre magasin vectoriel lors de la suppression d'une base de connaissances ou d'une ressource de source de données.

  7. Choisissez Sync.

  8. Une bannière verte apparaît lorsque la synchronisation est terminée et que le statut devient Prêt.

API
Pour mettre à jour une source de données
  1. (Facultatif) Apportez les modifications nécessaires aux fichiers du compartiment S3 qui contient les fichiers de la source de données.

  2. (Facultatif) Modifiez le dataDeletionPolicy pour votre source de données. Vous pouvez accéder à DELETE toutes les données sous-jacentes appartenant à la source de données depuis le magasin vectoriel lors de la suppression d'une base de connaissances ou d'une ressource de source de données. Notez que le magasin vectoriel lui-même n'est pas supprimé, seules les données sous-jacentes sont supprimées. Ce drapeau est ignoré si un AWS compte est supprimé. Vous pouvez accéder à RETAIN toutes les données sous-jacentes de votre magasin vectoriel lors de la suppression d'une base de connaissances ou d'une ressource de source de données.

  3. (Facultatif) Envoyez une UpdateDataSourcedemande à un point de terminaison Agents for Amazon Bedrock au moment de la création, en modifiant les configurations nécessaires et en spécifiant les mêmes configurations que vous ne souhaitez pas modifier.

    Note

    Tu ne peux pas changer lechunkingConfiguration. Envoyez la demande avec l'existantchunkingConfiguration.

  4. Envoyez une StartIngestionJobdemande à un agent pour le point de terminaison Amazon Bedrock au moment de la création, en spécifiant le et ledataSourceId. knowledgeBaseId

Supprimer une source de données

Si vous n'avez plus besoin d'une source de données, vous pouvez la supprimer. Sélectionnez l'onglet correspondant à la méthode de votre choix et suivez les étapes.

Console
Pour supprimer une source de données
  1. Connectez-vous à la AWS Management Console console Amazon Bedrock et ouvrez-la à l'adresse https://console.aws.amazon.com/bedrock/.

  2. Dans le volet de navigation de gauche, sélectionnez Base de connaissances.

  3. Dans la section Source de données, sélectionnez le bouton radio à côté de la source de données que vous souhaitez supprimer.

  4. Sélectionnez Delete (Supprimer).

  5. Une bannière verte apparaît lorsque la source de données est correctement supprimée.

    Note

    Votre politique de suppression des données pour votre source de données est définie sur Supprimer (supprime toutes les données sous-jacentes lorsque vous supprimez votre source de données) ou sur Conserver (conserve toutes les données sous-jacentes lorsque vous supprimez votre source de données). Si la politique de suppression des données de la source de données est définie sur Supprimer, il est possible que la source de données termine le processus de suppression sans succès en raison de problèmes liés à la configuration ou à l'accès au magasin vectoriel. Vous pouvez passer le curseur sur le statut « DELETE_SUCCESSFUL » pour connaître la raison pour laquelle la source de données n'a pas pu être supprimée correctement.

API

Pour supprimer une source de données d'une base de connaissances, envoyez une DeleteDataSourcedemande en spécifiant le dataSourceId etknowledgeBaseId.

Note

Votre politique de suppression des données pour votre source de données est définie soit sur DELETE (supprime toutes les données sous-jacentes lorsque vous supprimez votre source de données), soit sur RETAIN (conserve toutes les données sous-jacentes lorsque vous supprimez votre source de données). Si la politique de suppression des données de la source de données est définie surDELETE, il est possible que la source de données termine le processus de suppression sans succès en raison de problèmes liés à la configuration ou à l'accès au magasin vectoriel. Vous pouvez voir failureReasons si l'état de la source de données est DELETE_UNSUCCESSFUL de connaître la raison pour laquelle la source de données n'a pas pu être supprimée avec succès.