Copier des données vers Amazon Redshift à l'aide de la ligne de commande - AWS Data Pipeline

AWS Data Pipeline n'est plus disponible pour les nouveaux clients. Les clients existants de AWS Data Pipeline peut continuer à utiliser le service normalement. En savoir plus

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Copier des données vers Amazon Redshift à l'aide de la ligne de commande

Ce didacticiel explique comment copier des données depuis Amazon S3 vers Amazon Redshift. Vous allez créer une nouvelle table dans Amazon Redshift, puis vous l'utiliserez AWS Data Pipeline pour transférer des données vers cette table à partir d'un compartiment Amazon S3 public, qui contient des exemples de données d'entrée au format CSV. Les journaux sont enregistrés dans un compartiment Amazon S3 dont vous êtes le propriétaire.

Amazon S3 est un service Web qui vous permet de stocker des données dans le cloud. Pour en savoir plus, consultez Guide de l'utilisateur Amazon Simple Storage Service. Amazon Redshift est un service d'entrepôt de données dans le cloud. Pour plus d'informations, consultez le guide de gestion Amazon Redshift.

Prérequis

Avant de commencer, exécutez les étapes suivantes :

  1. Installez et configurez une interface de ligne de commande (CLI). Pour plus d'informations, veuillez consulter Accès AWS Data Pipeline.

  2. Assurez-vous que les rôles IAM sont nommés DataPipelineDefaultRoleet DataPipelineDefaultResourceRoleexistent. La AWS Data Pipeline console crée automatiquement ces rôles pour vous. Si vous n'avez pas utilisé la AWS Data Pipeline console au moins une fois, vous devez créer ces rôles manuellement. Pour plus d'informations, veuillez consulter Rôles IAM pour AWS Data Pipeline.

  3. Configurez la COPY commande dans Amazon Redshift, car ces mêmes options devront fonctionner lorsque vous effectuerez la copie dans AWS Data Pipeline Amazon Redshift. Pour plus d'informations, consultez Avant de commencer : configurer les options COPY et charger des données.

  4. Configurez une base de données Amazon Redshift. Pour plus d'informations, veuillez consulter Configuration du pipeline, création d'un groupe de sécurité et création d'un cluster Amazon Redshift.