Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Amazon S3 est un service de stockage d’objets qui stocke les données en tant qu’objets dans des compartiments. Vous pouvez vous connecter à votre compartiment Amazon S3 pour accéder à votre base de connaissances Amazon Bedrock en utilisant la console de AWS gestion d'Amazon Bedrock
Vous pouvez charger un petit lot de fichiers dans un compartiment Amazon S3 à l'aide de la console ou de l'API Amazon S3. Vous pouvez également l'utiliser AWS DataSyncpour télécharger plusieurs fichiers sur S3 en continu et transférer des fichiers selon un calendrier depuis un site, un périphérique, un autre cloud ou un AWS stockage.
Actuellement, seuls les compartiments S3 à usage général sont pris en charge.
Le nombre de fichiers et le nombre de Mo par fichier pouvant être analysés sont limités. Voir Quotas pour les bases de connaissances.
Fonctionnalités prises en charge
-
Champs de métadonnées du document
-
Filtres de contenu d'inclusion
-
Synchronisation incrémentielle du contenu pour le contenu ajouté, mis à jour et supprimé
Prérequis
Dans Amazon S3, assurez-vous de :
-
Notez l'URI du compartiment Amazon S3, le nom de ressource Amazon (ARN) et l'ID de AWS compte du propriétaire du compartiment. Vous trouverez l'URI et l'ARN dans la section des propriétés de la console Amazon S3. Votre bucket doit se trouver dans la même région que votre base de connaissances Amazon Bedrock. Vous devez être autorisé à accéder au bucket.
Dans votre AWS compte, assurez-vous de :
-
Incluez les autorisations nécessaires pour vous connecter à votre source de données dans votre politique de rôle/d'autorisations AWS Identity and Access Management (IAM) pour votre base de connaissances. Pour plus d'informations sur les autorisations requises pour que cette source de données soit ajoutée à votre IAM rôle dans la base de connaissances, consultez la section Autorisations d'accès aux sources de données.
Note
Si vous utilisez la console, le IAM rôle doté de toutes les autorisations requises peut être créé pour vous dans le cadre des étapes de création d'une base de connaissances. Une fois que vous avez configuré votre source de données et les autres configurations, le IAM rôle doté de toutes les autorisations requises est appliqué à votre base de connaissances spécifique.
Configuration de connexion
Pour vous connecter à votre compartiment Amazon S3, vous devez fournir les informations de configuration nécessaires afin qu'Amazon Bedrock puisse accéder à vos données et les analyser. Vous devez également suivre lePrérequis.
Un exemple de configuration pour cette source de données est inclus dans cette section.
Pour plus d'informations sur les filtres d'inclusion, les champs de métadonnées des documents, la synchronisation incrémentielle et leur fonctionnement, sélectionnez ce qui suit :
Vous pouvez inclure un fichier distinct qui spécifie les champs/attributs des métadonnées du document pour chaque fichier de votre source de données Amazon S3 et indiquant s'il convient de les inclure dans les intégrations lors de l'indexation de la source de données dans le magasin vectoriel. Par exemple, vous pouvez créer un fichier au format suivant, le nommer example.metadata.json
et le télécharger dans votre compartiment S3.
{
"metadataAttributes": {
"company": {
"value": {
"type": "STRING",
"stringValue": "BioPharm Innovations"
},
"includeForEmbedding": true
},
"created_date": {
"value": {
"type": "NUMBER",
"numberValue": 20221205
},
"includeForEmbedding": true
},
"author": {
"value": {
"type": "STRING",
"stringValue": "Lisa Thompson"
},
"includeForEmbedding": true
},
"origin": {
"value": {
"type": "STRING",
"stringValue": "Overview"
},
"includeForEmbedding": true
}
}
}
Le fichier de métadonnées doit porter le même nom que le fichier de document source associé, avec .metadata.json
un ajout à la fin du nom du fichier. Le fichier de métadonnées doit être stocké dans le même dossier ou au même emplacement que le fichier source dans votre compartiment Amazon S3. Le fichier ne doit pas dépasser la limite de 10 Ko. Pour plus d'informations sur les types de données d'attribut/champ pris en charge et sur les opérateurs de filtrage que vous pouvez appliquer à vos champs de métadonnées, voir Métadonnées et filtrage.
Vous pouvez spécifier un préfixe d'inclusion, qui est un préfixe de chemin Amazon S3, dans lequel vous pouvez utiliser un fichier ou un dossier S3 au lieu de l'intégralité du compartiment pour créer le connecteur de source de données S3. Par exemple, votre préfixe peut être « .* \ \ .pdf ».
Le connecteur de source de données analyse le contenu nouveau, modifié et supprimé chaque fois que votre source de données se synchronise avec votre base de connaissances. Amazon Bedrock peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et explorer le contenu modifié depuis la dernière synchronisation. Lorsque vous synchronisez votre source de données avec votre base de connaissances pour la première fois, tout le contenu est analysé par défaut.
Pour synchroniser votre source de données avec votre base de connaissances, utilisez l'StartIngestionJobAPI ou sélectionnez votre base de connaissances dans la console et sélectionnez Synchroniser dans la section de présentation de la source de données.
Important
Toutes les données que vous synchronisez à partir de votre source de données sont accessibles à bedrock:Retrieve
toute personne autorisée à les récupérer. Cela peut également inclure toutes les données dont les autorisations de source de données sont contrôlées. Pour plus d'informations, consultez la section Autorisations de la base de connaissances.
Pour connecter un compartiment Amazon S3 à votre base de connaissances
-
Suivez les étapes décrites Créez une base de connaissances en vous connectant à une source de données dans les bases de connaissances Amazon Bedrock et choisissez Amazon S3 comme source de données.
-
Donnez un nom à la source de données.
-
Spécifiez si le compartiment Amazon S3 se trouve dans votre AWS compte actuel ou dans un autre AWS compte. Votre compartiment doit se trouver dans la même région que la base de connaissances.
-
(Facultatif) Si le compartiment Amazon S3 est chiffré à l'aide d'une clé KMS, incluez la clé. Pour de plus amples informations, veuillez consulter Autorisations pour déchiffrer votre AWS KMS clé pour vos sources de données dans Amazon S3.
-
(Facultatif) Dans la section Analyse et segmentation du contenu, vous pouvez personnaliser le mode d'analyse et de segmentation de vos données. Consultez les ressources suivantes pour en savoir plus sur ces personnalisations :
-
Pour plus d'informations sur les options d'analyse, consultezOptions d'analyse pour votre source de données.
-
Pour plus d'informations sur les stratégies de segmentation, consultezComment fonctionne le découpage du contenu pour les bases de connaissances.
Avertissement
Vous ne pouvez pas modifier la stratégie de segmentation après vous être connecté à la source de données.
-
Pour plus d'informations sur la façon de personnaliser le découpage de vos données et le traitement de vos métadonnées à l'aide d'une fonction Lambda, consultez. Utilisez une fonction Lambda de transformation personnalisée pour définir la manière dont vos données sont ingérées
-
-
Dans la section Paramètres avancés, vous pouvez éventuellement configurer les éléments suivants :
-
Clé KMS pour le stockage de données transitoires. — Vous pouvez chiffrer les données transitoires tout en les convertissant en données intégrées à l'aide de la clé KMS par défaut Clé gérée par AWS ou de votre propre clé. Pour de plus amples informations, veuillez consulter Chiffrement du stockage des données transitoires lors de l’ingestion de données.
-
Politique de suppression des données — Vous pouvez supprimer les intégrations vectorielles de votre source de données qui sont stockées dans le magasin vectoriel par défaut, ou choisir de conserver les données du magasin vectoriel.
-
-
Continuez à choisir un modèle d'intégration et un magasin vectoriel. Pour voir les étapes restantes, revenez à l'étape Créez une base de connaissances en vous connectant à une source de données dans les bases de connaissances Amazon Bedrock et poursuivez après avoir connecté votre source de données.