Utilisation d’une commande COPY pour charger les données - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation d’une commande COPY pour charger les données

La commande COPY s’appuie sur l’architecture Amazon Redshift du traitement hautement parallèle (MPP) pour lire et charger les données en parallèle à partir de fichiers sur Amazon S3, d’une table DynamoDB ou de la sortie de texte d’un ou de plusieurs hôtes distants.

Note

Nous vous recommandons vivement d’utiliser la commande COPY pour charger de grandes quantités de données. La lenteur liée à l’utilisation d’instructions INSERT pour remplir une table peut être prohibitive. Sinon, si vos données existent déjà dans d’autres tables de bases de données Amazon Redshift, utilisez INSERT INTO ... SELECT ou CREATE TABLE AS pour améliorer les performances. Pour plus d’informations, consultez INSERT ou CREATE TABLE AS.

Pour charger des données depuis une autre AWS ressource, votre cluster doit être autorisé à accéder à la ressource et à effectuer les actions nécessaires.

Pour accorder ou révoquer le privilège de charger les données dans une table à l’aide d’une commande COPY, accordez ou révoquez le privilège INSERT.

Vos données doivent être au format approprié pour le chargement dans votre table Amazon Redshift. Cette section présente les directives de préparation et de vérification de vos données avant le chargement, et de validation d’une instruction COPY avant son exécution.

Pour protéger les informations contenues dans vos fichiers, vous pouvez chiffrer les fichiers de données avant de les charger sur votre compartiment Amazon S3 ; la commande COPY déchiffre les données pendant le chargement. Vous pouvez aussi limiter l’accès à vos données de chargement en fournissant des informations d’identification de sécurité temporaires aux utilisateurs. Les informations d’identification de sécurité temporaires offrent une sécurité améliorée parce qu’elles sont de courte durée et ne peuvent pas être réutilisées après leur expiration.

Amazon Redshift dispose de fonctions intégrées à COPY pour charger rapidement des données délimitées et non compressées. Vous pouvez toutefois compresser vos fichiers à l’aide de gzip, lzop ou bzip2 pour gagner du temps lors du téléchargement des fichiers.

Si les mots clés suivants figurent dans la requête COPY, le fractionnement automatique des données non compressées n’est pas pris en charge : ESCAPE, REMOVEQUOTES et FIXEDWIDTH. Mais le mot-clé CSV est pris en charge.

Pour garantir la sécurité de vos données en transit dans le AWS cloud, Amazon Redshift utilise le protocole SSL accéléré par matériel pour communiquer avec Amazon S3 ou Amazon DynamoDB pour les opérations de copie, de déchargement, de sauvegarde et de restauration.

Lorsque vous chargez directement votre table depuis une table Amazon DynamoDB, vous avez la possibilité de contrôler la quantité de débit provisionné Amazon DynamoDB que vous consommez.

Vous pouvez, le cas échéant, laisser la commande COPY analyser vos données d’entrée et appliquer automatiquement les encodages de compression optimale à votre table dans le cadre du processus de chargement.