Prérequis CloudFormation Mise en route avec Amazon Redshift Spectrum étape par étape

Mise en route avec Amazon Redshift Spectrum

Dans ce tutoriel, vous apprenez à utiliser Amazon Redshift Spectrum pour interroger des données directement à partir de fichiers sur Amazon S3. Si vous possédez déjà un cluster et un SQL client, vous pouvez suivre ce didacticiel avec une configuration minimale.

Note

Les requêtes Redshift Spectrum engendrent des frais supplémentaires. Le coût inhérent à l’exécution des exemples de requêtes de ce tutoriel est minime. Pour plus d’informations sur la tarification, consultez Tarification Amazon Redshift Spectrum.

Prérequis

Pour utiliser Redshift Spectrum, vous avez besoin d'un cluster Amazon Redshift et SQL d'un client connecté à votre cluster afin de pouvoir exécuter des commandes. SQL Le cluster et les fichiers de données dans Amazon S3 doivent se trouver dans la même Région AWS.

Pour plus d'informations sur la création d'un cluster Amazon Redshift, consultez la section Commencer avec les entrepôts de données provisionnés Amazon Redshift dans le guide de démarrage Amazon Redshift. Pour plus d'informations sur les méthodes de connexion à un cluster, consultez la section Connexion aux entrepôts de données Amazon Redshift dans le guide de démarrage Amazon Redshift.

Dans certains des exemples qui suivent, les données d’exemple se trouvent dans la région USA Est (Virginie du Nord) (us-east-1) et vous avez donc besoin d’un cluster qui figure également dans us-east-1. Vous pouvez également utiliser Amazon S3 pour copier des objets de données depuis les compartiments et dossiers suivants vers votre compartiment Région AWS où se trouve votre cluster :

s3://redshift-downloads/tickit/spectrum/customers/*
s3://redshift-downloads/tickit/spectrum/sales_partition/*
s3://redshift-downloads/tickit/spectrum/sales/*
s3://redshift-downloads/tickit/spectrum/salesevent/*

Exécutez une commande Amazon S3 similaire à la suivante pour copier les données d’exemple situées dans la région USA Est (Virginie du Nord) vers votre Région AWS. Avant d’exécuter cette commande, créez votre compartiment et vos dossiers dans votre compartiment pour qu’ils correspondent à votre commande de copie Amazon S3. Le résultat de la commande de copie d'Amazon S3 confirme que les fichiers sont copiés dans bucket-name dans le format que vous souhaitez Région AWS.


aws s3 cp s3://redshift-downloads/tickit/spectrum/ s3://bucket-name/tickit/spectrum/ --copy-props none --recursive

Commencer à utiliser Redshift Spectrum en utilisant AWS CloudFormation

Comme alternative aux étapes suivantes, vous pouvez accéder au DataLake AWS CloudFormation modèle Redshift Spectrum pour créer une pile avec un compartiment Amazon S3 que vous pouvez interroger. Pour de plus amples informations, veuillez consulter Lancez votre AWS CloudFormation stack, puis interrogez vos données dans Amazon S3.

Mise en route avec Amazon Redshift Spectrum étape par étape

Suivez ces étapes pour commencer à utiliser Amazon Redshift Spectrum :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Interroger des données externes avec Amazon Redshift Spectrum

Étape 1. créer un rôle IAM ;