Mise en route avec Amazon Redshift Spectrum
Dans ce tutoriel, vous apprenez à utiliser Amazon Redshift Spectrum pour interroger des données directement à partir de fichiers sur Amazon S3. Si vous disposez déjà d'un cluster et d'un client SQL, vous pouvez effectuer ce tutoriel avec un effort de configuration minimal.
Note
Les requêtes Redshift Spectrum engendrent des frais supplémentaires. Le coût inhérent à l'exécution des exemples de requêtes de ce tutoriel est minime. Pour plus d'informations sur la tarification, consultez Tarification Amazon Redshift Spectrum
Prérequis
Pour utiliser Redshift Spectrum, vous avez besoin d'un cluster Amazon Redshift et d'un client SQL qui est connecté à votre cluster afin que vous puissiez exécuter des commandes SQL. Le cluster et les fichiers de données dans Amazon S3 doivent se trouver dans la même Région AWS.
Pour savoir comment créer un cluster Amazon Redshift, consultez Clusters Amazon Redshift et chargement de données dans le Guide de démarrage Amazon Redshift. Pour connaître les différentes méthodes de connexion à un cluster, consultez Connexion aux clusters provisionnés Amazon Redshift dans le Guide de démarrage Amazon Redshift.
Dans certains des exemples qui suivent, les données d'exemple se trouvent dans la région USA Est (Virginie du Nord) (us-east-1
) et vous avez donc besoin d'un cluster qui figure également dans us-east-1
. Vous pouvez également utiliser Amazon S3 pour copier des objets de données des compartiments et dossiers suivants vers votre compartiment dans la Région AWS où se trouve votre cluster :
s3://redshift-downloads/tickit/spectrum/customers/*
s3://redshift-downloads/tickit/spectrum/sales_partition/*
s3://redshift-downloads/tickit/spectrum/sales/*
s3://redshift-downloads/tickit/spectrum/salesevent/*
Exécutez une commande Amazon S3 similaire à la suivante pour copier les données d'exemple situées dans la région USA Est (Virginie du Nord) vers votre Région AWS. Avant d'exécuter cette commande, créez votre compartiment et vos dossiers dans votre compartiment pour qu'ils correspondent à votre commande de copie Amazon S3. La sortie de la commande de copie Amazon S3 confirme que les fichiers sont copiés dans bucket-name
, dans la Région AWS de votre choix.
aws s3 cp s3://redshift-downloads/tickit/spectrum/ s3://
bucket-name
/tickit/spectrum/ --copy-props none --recursive
Mise en route avec Amazon Redshift Spectrum à l'aide de AWS CloudFormation
Au lieu des étapes suivantes, vous pouvez accéder au modèle AWS CloudFormation Redshift Spectrum DataLake pour créer une pile avec un compartiment Amazon S3 que vous pouvez interroger. Pour de plus amples informations, consultez Lancer votre pile AWS CloudFormation, puis interroger vos données dans Amazon S3.
Mise en route avec Amazon Redshift Spectrum étape par étape
Suivez ces étapes pour commencer à utiliser Amazon Redshift Spectrum :