Mise en route avec Amazon Redshift Spectrum - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Mise en route avec Amazon Redshift Spectrum

Dans ce tutoriel, vous apprenez à utiliser Amazon Redshift Spectrum pour interroger des données directement à partir de fichiers sur Amazon S3. Si vous disposez déjà d’un cluster et d’un client SQL, vous pouvez effectuer ce tutoriel avec un effort de configuration minimal.

Note

Les requêtes Redshift Spectrum engendrent des frais supplémentaires. Le coût inhérent à l’exécution des exemples de requêtes de ce tutoriel est minime. Pour plus d’informations sur la tarification, consultez Tarification Amazon Redshift Spectrum.

Prérequis

Pour utiliser Redshift Spectrum, vous avez besoin d’un cluster Amazon Redshift et d’un client SQL qui est connecté à votre cluster afin que vous puissiez exécuter des commandes SQL. Le cluster et les fichiers de données dans Amazon S3 doivent se trouver dans la même Région AWS.

Pour plus d'informations sur la création d'un cluster Amazon Redshift, consultez les clusters provisionnés Amazon Redshift dans le guide de démarrage Amazon Redshift. Pour plus d'informations sur les méthodes de connexion à un cluster, consultez la section Connexion aux entrepôts de données Amazon Redshift dans le guide de démarrage Amazon Redshift.

Dans certains des exemples qui suivent, les données d’exemple se trouvent dans la région USA Est (Virginie du Nord) (us-east-1) et vous avez donc besoin d’un cluster qui figure également dans us-east-1. Vous pouvez également utiliser Amazon S3 pour copier des objets de données depuis les compartiments et dossiers suivants vers votre compartiment Région AWS où se trouve votre cluster :

  • s3://redshift-downloads/tickit/spectrum/customers/*

  • s3://redshift-downloads/tickit/spectrum/sales_partition/*

  • s3://redshift-downloads/tickit/spectrum/sales/*

  • s3://redshift-downloads/tickit/spectrum/salesevent/*

Exécutez une commande Amazon S3 similaire à la suivante pour copier les données d’exemple situées dans la région USA Est (Virginie du Nord) vers votre Région AWS. Avant d’exécuter cette commande, créez votre compartiment et vos dossiers dans votre compartiment pour qu’ils correspondent à votre commande de copie Amazon S3. La sortie de la commande de copie Amazon S3 confirme que les fichiers sont copiés dans bucket-name, dans la Région AWS de votre choix.

aws s3 cp s3://redshift-downloads/tickit/spectrum/ s3://bucket-name/tickit/spectrum/ --copy-props none --recursive

Commencer à utiliser Redshift Spectrum en utilisant AWS CloudFormation

Comme alternative aux étapes suivantes, vous pouvez accéder au DataLake AWS CloudFormation modèle Redshift Spectrum pour créer une pile avec un compartiment Amazon S3 que vous pouvez interroger. Pour plus d’informations, consultez Lancez votre AWS CloudFormation stack, puis interrogez vos données dans Amazon S3.

Mise en route avec Amazon Redshift Spectrum étape par étape

Suivez ces étapes pour commencer à utiliser Amazon Redshift Spectrum :