Clusters Amazon Redshift provisionnés - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Clusters Amazon Redshift provisionnés

Dans les sections suivantes, vous pouvez apprendre les bases de la création d’un entrepôt des données en lançant un ensemble de nœuds de calcul, appelé cluster Amazon Redshift.

Présentation d'Amazon Redshift

Un entrepôt des données Amazon Redshift est un ensemble de ressources informatiques appelées nœuds, qui sont organisées en un groupe appelé cluster. Chaque cluster exécute un moteur Amazon Redshift et contient une ou plusieurs bases de données.

Note

À ce jour, le moteur Amazon Redshift version 1.0 est disponible. Toutefois, à mesure que le moteur est mis à jour, plusieurs versions du moteur Amazon Redshift peuvent être disponibles pour la sélection.

Clusters et nœuds dans Amazon Redshift

Un cluster Amazon Redshift est constitué de nœuds. Chaque cluster possède un nœud principal et un ou plusieurs nœuds de calcul. Le nœud principal reçoit les requêtes d’applications clientes, analyse les requêtes et développe les plans d’exécution de requête. Le nœud principal coordonne ensuite l’exécution parallèle de ces plans avec les nœuds de calcul et regroupe les résultats intermédiaires de ces nœuds. Enfin, il renvoie ensuite les résultats aux applications clientes.

Les nœuds de calcul exécutent les plans d’exécution de requête et communiquent les données entre eux afin de traiter ces requêtes. Les résultats intermédiaires sont renvoyés au nœud « leader » afin d’être compilés, puis transmis aux applications clientes. Pour plus d’informations sur les nœuds principaux et les nœuds de calcul, consultez Architecture du système d’entrepôt des données dans le Guide du développeur de la base de données Amazon Redshift.

Note

Lorsque vous créez un cluster sur la console Amazon Redshift (https://console.aws.amazon.com/redshiftv2/), vous pouvez obtenir une recommandation concernant la configuration de votre cluster en fonction de la taille de vos données et des caractéristiques des requêtes. Pour utiliser ce calculateur de dimensionnement, recherchez Aidez-moi à choisir sur la console dans AWS Régions prenant en charge les types de nœuds RA3. Pour plus d’informations, consultez Création d’un cluster.

Lorsque vous lancez un cluster, vous spécifiez notamment l’option correspondant au type de nœud. Le type de nœud détermine l’UC, la RAM, la capacité de stockage et le type de disque de stockage de chaque nœud.

Amazon Redshift propose différents types de nœuds pour s’adapter à vos charges de travail, et nous vous recommandons de choisir RA3 ou DC2 en fonction des performances requises, de la taille des données et de la croissance prévue des données.

Les nœuds RA3 avec stockage géré vous permettent d’optimiser votre entrepôt des données en dimensionnant et en payant le calcul et le stockage géré indépendamment. Avec RA3, vous choisissez le nombre de nœuds en fonction de vos exigences de performances et vous ne payez que pour le stockage géré que vous utilisez. Dimensionnez votre cluster RA3 en fonction de la quantité de données que vous traitez quotidiennement. Les clusters utilisant les types de nœuds RA3 sont lancés dans un cloud privé virtuel (VPC). Vous ne pouvez pas lancer de clusters RA3 en mode EC2 Classic. Pour plus d'informations, consultez Création d’un cluster dans un VPC.

Le stockage géré par Amazon Redshift utilise de grands disques SSD haute performance dans chaque nœud RA3 pour un stockage local rapide et Amazon S3 pour un stockage durable à plus long terme. Si les données d’un nœud dépassent la taille des grands SSD locaux, le stockage géré d’Amazon Redshift décharge automatiquement ces données sur Amazon S3. Vous payez le même tarif avantageux pour le stockage géré par Amazon Redshift, que les données se trouvent dans des disques SSD haute performance ou dans Amazon S3. Pour les charges de travail qui nécessitent un stockage en constante augmentation, le stockage géré vous permet d'adapter automatiquement la capacité de stockage de votre entrepôt de données indépendamment des nœuds de calcul.

Les nœuds DC2 vous permettent de posséder des entrepôts des données gourmands en calcul avec stockage SSD local inclus. Vous choisissez le nombre de nœuds dont vous avez besoin en fonction de la taille des données et des exigences en matière de performance. Les nœuds DC2 stockent vos données localement pour des performances élevées et, alors que la taille des données grandit, vous pouvez ajouter plus de nœuds de calcul afin d’augmenter la capacité de stockage du cluster. Pour les ensembles de données de 1 To (compressé), nous vous recommandons les types de nœuds DC2 qui vous permettent de bénéficier des meilleures performances au prix le plus bas. Si vous souhaitez voir vos données grandir, nous vous recommandons d’utiliser les nœuds RA3. De cette manière, vous pouvez dimensionner le calcul et le stockage indépendamment afin de bénéficier de tarifs et de performances amélioré(s). Les clusters utilisant les types de nœuds DC2 sont lancés dans un cloud privé virtuel (VPC). Vous ne pouvez pas lancer de clusters DC2 dans EC2-Classic. Pour plus d'informations, consultez Création d’un cluster dans un VPC.

Les nœuds DS2 vous permettent de créer de grands entrepôts des données basés sur des disques durs et nous vous recommandons plutôt d’utiliser des nœuds RA3. Si vous utilisez des nœuds DS2, consultez Mise à niveau vers des types de nœuds RA3 pour des instructions de mise à niveau. Si vous utilisez huit nœuds minimum de ds2.xlarge ou plus, ou de tout autre nombre de nœuds ds2.8xlarge, vous pouvez dès à présent effectuer une mise à niveau vers RA3 et obtenir 2 fois plus de stockage ainsi que de meilleures performances pour le même coût à la demande.

Les types de nœuds sont disponibles en différentes tailles. La taille de nœud et le nombre de nœuds de déterminent le stockage total d’un cluster. Pour plus d'informations, consultez Détails de type de nœud.

Certains types de nœud autorisent un nœud (type à nœud unique) ou deux ou plusieurs nœuds (type à plusieurs nœuds). Le nombre minimum de nœuds pour les clusters de certains types de nœuds est de deux nœuds. Sur un cluster à un seul nœud, le nœud est partagé pour les fonctionnalités « principal » et « calcul ». Les clusters à nœud unique ne sont pas recommandés pour l’exécution de charges de travail de production. Sur un cluster à plusieurs nœuds, le nœud principal est distinct des nœuds de calcul. Le nœud de ligne est le même type de nœud que les nœuds de calcul. Vous ne payez que pour les nœuds de calcul.

Amazon Redshift applique des quotas aux ressources pour chaque AWS compte dans chaque AWS région. Un quota limite le nombre de ressources que votre compte peut créer pour un type de ressource donné, comme les nœuds ou les instantanés, au sein d'une AWS région. Pour plus d’informations sur les quotas par défaut qui s’appliquent aux ressources Amazon Redshift, consultez Limites d’Amazon Redshift dans Référence générale d'Amazon Web Services. Pour demander une augmentation, soumettez-nous un Formulaire d’augmentation de limite Amazon Redshift.

Le coût de votre cluster dépend de la AWS région, du type de nœud, du nombre de nœuds et du fait que les nœuds sont réservés à l'avance ou non. Pour plus d’informations sur le coût des nœuds, consultez la page de Tarification d’Amazon Redshift.

Détails de type de nœud

Les tableaux suivants résument les spécifications de nœud de chaque type de nœud et taille. Les en-têtes dans les tableaux ont les significations suivantes :

  • vCPU correspond au nombre de processeurs virtuels de chaque nœud.

  • RAM correspond à la quantité de mémoire en gibioctets (Gio) de chaque nœud.

  • Tranches par nœud est le nombre de tranches dans lesquelles un nœud de calcul est partitionné lorsqu’un cluster est créé ou redimensionné avec un redimensionnement classique.

    Le nombre de sections par nœud peut changer si le cluster est redimensionné à l’aide du redimensionnement Elastic. Cependant, le nombre total de tranches sur tous les nœuds de calcul dans le cluster reste le même après le redimensionnement élastique.

    Lorsque vous créez un cluster avec l’opération de restauration à partir d’un instantané, le nombre de tranches du cluster résultant peut changer par rapport au cluster d’origine si vous modifiez le type de nœud.

  • Stockage correspond à la capacité et au type de stockage de chaque nœud.

  • La plage de nœuds est le nombre minimum et maximum de nœuds qu’Amazon Redshift prend en charge pour le type et la taille de nœud.

    Note

    Il se peut que vous soyez limité à un nombre de nœuds inférieur en fonction du quota appliqué à votre AWS compte dans la AWS région sélectionnée. Pour demander une augmentation, soumettez-nous un Formulaire d’augmentation de limite Amazon Redshift.

  • Capacité totale correspond à la capacité de stockage totale du cluster si vous déployez le nombre maximal de nœuds spécifié dans la plage de nœuds.

Types de nœuds RA3
Type de nœud vCPU RAM (Gio) Tranches par défaut par nœud Limite de stockage géré par nœud 1 Plage de nœuds avec la création d’un cluster Capacité de stockage géré totale 2
ra3.xlplus (nœud unique) 4 32 2 4 To 1 4 To3
ra3.xlplus (multi-nœuds) 4 32 2 32 To 2–164 1 024 To4
ra3.4xlarge 12 96 4 128 To 2–325 8 192 To5
ra3.16xlarge 48 384 16 128 To 2–128 16 384 To

1 La limite de stockage pour le stockage géré Amazon Redshift. Il s’agit d’une limite stricte.

2 La limite de stockage géré totale correspond au nombre maximal de nœuds multiplié par la limite de stockage géré par nœud.

3 Pour redimensionner un cluster à nœud unique en cluster à plusieurs nœuds, seul le redimensionnement classique est pris en charge.

4 Vous pouvez créer un cluster avec le type de nœud ra3.xlplus (multi-nœuds) qui a jusqu’à 16 nœuds. Pour les clusters à plusieurs nœuds, vous pouvez redimensionner avec le redimensionnement Elastic jusqu’à 32 nœuds maximum.

5 Vous pouvez créer un cluster avec le type de nœud ra3.4xlarge qui a jusqu’à 32 nœuds. Vous pouvez le redimensionner avec un redimensionnement Elastic jusqu’à un maximum de 64 nœuds.

Types de nœud de stockage dense
Type de nœud vCPU RAM (Gio) Tranches par défaut par nœud Stockage par nœud Plage de nœuds Capacité totale
ds2.xlarge 4 31 2 2 To HDD 1–32 64 To
ds2.8xlarge 36 244 16 16 To HDD 2–128 2 Po
Types de nœud de calcul dense
Type de nœud vCPU RAM (Gio) Tranches par défaut par nœud Stockage par nœud Plage de nœuds Capacité totale
dc2.large 2 15 2 SSD NVMe de 160 Go 1–32 5.12 To
dc2.8xlarge 32 244 16 SSD NVMe de 2,56 To 2–128 326 To
dc1.large1 2 15 2 160 Go SSD 1–32 5.12 To
dc1.8xlarge1 32 244 32 2,56 To SSD 2–128 326 To

1 Nous recommandons les types de nœuds DC2 sur les types de nœuds DC1. Pour plus d’informations sur la mise à niveau, consultez Mise à niveau de nœuds de type DC1 vers des nœuds de type DC2.

Noms précédents des types de nœud

Dans les versions précédentes d’Amazon Redshift, certains types de nœuds avaient des noms différents. Vous pouvez utiliser les anciens noms dans l'API Amazon Redshift et. AWS CLI Néanmoins, nous vous recommandons de mettre à jour tous les scripts qui font référence à ces noms afin d’utiliser les noms actuels à la place. Les noms anciens et actuels sont les suivants.

Nom actuel Noms précédents
ds2.xlarge ds1.xlarge, dw.hs1.xlarge, dw1.xlarge
ds2.8xlarge ds1.8xlarge, dw.hs1.8xlarge, dw1.8xlarge
dc1.large dw2.large
dc1.8xlarge dw2.8xlarge

Détermination du nombre de nœuds

Étant donné qu’Amazon Redshift distribue et exécute les requêtes en parallèle sur l’ensemble des nœuds de calcul d’un cluster, vous pouvez augmenter les performances des requêtes en ajoutant des nœuds à votre cluster. Lorsque vous exécutez un cluster équipé d’au moins deux nœuds de calcul, les données présentes sur chaque nœud sont toujours mises en miroir sur les disques de l’autre nœud, réduisant ainsi le risque de perte de données.

Vous pouvez surveiller les performances des requêtes dans la console Amazon Redshift et à l'aide des métriques Amazon CloudWatch . Vous pouvez également ajouter ou supprimer des nœuds si nécessaire pour atteindre l’équilibre entre le prix et les performances de votre cluster. Lorsque vous demandez un nœud supplémentaire, Amazon Redshift prend en charge tous les détails du déploiement, de l’équilibrage de charge et de la maintenance des données. Pour plus d’informations sur les performances des clusters, consultez Surveiller les performances de cluster Amazon Redshift.

Les nœuds réservés conviennent aux charges de travail régulières en production et vous permettent de réaliser d’importantes économies par rapport aux nœuds à la demande. Vous pouvez acheter des nœuds réservés après avoir effectué des tests et proof-of-concepts pour valider votre configuration de production. Pour plus d’informations, consultez Achat de nœuds réservés pour Amazon Redshift.

Lorsque vous mettez en pause un cluster, vous suspendez la facturation à la demande pendant la période de mise en pause du cluster. Pendant cette période de pause, vous ne payez que pour le stockage de sauvegarde. Vous n’avez donc pas à vous soucier de la planification et de l’achat de capacités pour l’entrepôt des données en amont, ce qui vous permet de gérer de manière rentable vos environnements à des fins de test ou de développement.

Pour plus d’informations sur la tarification des nœuds à la demande et réservés, consultez la Tarification Amazon Redshift.

Utilisez EC2-VPC lorsque vous créez votre cluster

Les clusters Amazon Redshift s’exécutent dans des instances Amazon EC2 configurées pour le type et la taille de nœud Amazon Redshift que vous sélectionnez. Créez votre cluster à l’aide d’EC2-VPC. Si vous utilisez toujours EC2-Classic, nous vous recommandons d’utiliser EC2-VPC pour améliorer les performances et la sécurité. Pour plus d’informations sur ces plateformes réseau, consultez Plateformes prises en charge dans le Guide de l’utilisateur Amazon EC2 pour les instances Linux. Les paramètres de votre AWS compte déterminent si EC2-VPC ou EC2-Classic sont disponibles pour vous.

Note

Afin d’éviter les problèmes de connexion entre les outils clients SQL et la base de données Amazon Redshift, nous vous conseillons d’opter pour l’une des deux approches suivantes. Vous pouvez configurer une règle de trafic entrant qui permet aux hôtes de négocier la taille des paquets. Vous pouvez également désactiver les trames jumbo TCP/IP en réglant l’unité de transmission maximale (MTU) sur 1500 sur l’interface réseau (NIC) de vos instances Amazon EC2. Pour plus d’informations sur ces approches, consultez Des requêtes semblent se bloquer et parfois échouent à atteindre le cluster.

EC2-VPC

Lorsque vous utilisez EC2-VPC, votre cluster s'exécute dans un cloud privé virtuel (VPC) qui est logiquement isolé de votre compte. AWS Si vous allouez votre cluster dans EC2-VPC, vous contrôlez l’accès à votre cluster en associant un ou plusieurs groupes de sécurité VPC au cluster. Pour plus d’informations, consultez Groupes de sécurité pour votre VPC dans le manuel Amazon VPC Guide de l’utilisateur.

Pour créer un cluster dans un VPC, vous devez d’abord créer un groupe de sous-réseau de cluster Amazon Redshift en fournissant les informations de sous-réseau de votre VPC, puis renseigner le groupe de sous-réseau lors du lancement du cluster. Pour plus d'informations, consultez Groupes de sous-réseaux du cluster Amazon Redshift.

Pour plus d’informations sur Amazon Virtual Private Cloud (Amazon VPC), consultez la Page détaillée du produit Amazon VPC.

EC2-Classic

La plateforme EC2-Classic sera mise hors service le 15 août 2022. Nous vous recommandons de migrer vos clusters de la plateforme EC2-Classic vers une plateforme EC2-VPC. Pour plus d’informations, consultez Mise à niveau d’un cluster DS2 sur EC2-Classic vers EC2-VPC et le billet de blog EC2-Classic Networking is Retiring – Here’s How to Prepare.

Dans EC2-Classic, votre cluster fonctionne sur un réseau unique et plat que vous partagez avec d'autres AWS clients. Si vous allouez votre cluster dans l’EC2-Classic, vous contrôlez l’accès à votre cluster en associant un ou plusieurs groupes de sécurité de cluster Amazon Redshift au cluster. Pour plus d'informations, consultez Groupes de sécurité du cluster Amazon Redshift.

Lancez un cluster.

Votre AWS compte peut soit lancer des instances d'EC2-VPC et d'EC2-Classic, soit uniquement d'EC2-VPC, sur une base. region-by-region Pour déterminer la plateforme de mise en réseau que votre compte prend en charge, puis lancer un cluster, procédez comme suit :

  1. Décidez AWS dans quelle région vous souhaitez déployer un cluster. Pour obtenir la liste des AWS régions dans lesquelles Amazon Redshift est disponible, consultez la section Points de terminaison Amazon Redshift dans le. Référence générale d'Amazon Web Services

  2. Découvrez quelles plateformes Amazon EC2 votre compte prend en charge dans la région AWS choisie. Vous pouvez trouver ces informations dans la console Amazon EC2. Pour step-by-step obtenir des instructions, consultez la section Plateformes prises en charge dans le guide de l'utilisateur Amazon EC2 pour les instances Linux.

  3. Si votre compte prend en charge les deux plateformes, nous recommandons EC2-VPC. Si votre compte ne prend en charge qu’EC2-VPC, vous devez déployer votre cluster dans VPC.

  4. Lancez votre cluster Amazon Redshift. Vous pouvez créer un cluster à l'aide de la console Amazon Redshift, de l'API Amazon Redshift ou des bibliothèques du AWS CLI SDK. Pour plus d’informations sur ces options et sur les liens vers la documentation associée, consultez Qu’est-ce qu’Amazon Redshift ?.

Alarme d’espace disque par défaut

Lorsque vous créez un cluster Amazon Redshift, vous pouvez éventuellement configurer une CloudWatch alarme Amazon pour surveiller le pourcentage moyen d'espace disque utilisé sur tous les nœuds de votre cluster. Nous nous référons à cette alarme comme alarme d’espace disque par défaut.

Le but d’une alarme d’espace disque par défaut consiste à vous aider à surveiller la capacité de stockage de votre cluster. Vous pouvez configurer cette alarme selon les besoins de votre entrepôt des données. Par exemple, vous pouvez utiliser l’avertissement comme indicateur vous signalant que vous devez redimensionner le cluster. Vous pouvez redimensionner votre cluster soit en un type de nœud différent, soit pour ajouter des nœuds, ou encore pour acheter des nœuds réservés en vue d’une expansion future.

L’alarme d’espace disque par défaut se déclenche lorsque l’utilisation du disque atteint ou dépasse un pourcentage spécifié un certain nombre de fois et sur une durée spécifiée. Par défaut, l’alarme se déclenche lorsque le pourcentage que vous spécifiez est atteint, puis demeure à cette valeur ou à une valeur supérieure pendant cinq minutes ou plus. Vous pouvez modifier les valeurs par défaut après que vous avez lancé le cluster.

Lorsque l' CloudWatch alarme se déclenche, Amazon Simple Notification Service (Amazon SNS) envoie une notification aux destinataires spécifiés pour les avertir que le seuil de pourcentage est atteint. Amazon SNS utilise une rubrique pour spécifier les destinataires et le message transmis dans une notification. Vous pouvez utiliser une rubrique Amazon SNS existant ; sinon, une rubrique est créée en fonction des paramètres que vous spécifiez lorsque vous lancez le cluster. Vous pouvez modifier la rubrique de cette alarme après avoir lancé le cluster. Pour plus d’informations sur la création de sujets Amazon SNS, consultez Démarrage avec Amazon Simple Notification Service.

Après avoir lancé le cluster, vous pouvez afficher et modifier l'alarme depuis la fenêtre État du cluster sous CloudWatch Alarmes. Le nom est percentage-disk-space-used-default-< string >. Vous pouvez ouvrir l’alarme pour afficher la rubrique Amazon SNS à laquelle elle est associée et modifier les paramètres de l’alarme. Si vous n'avez pas sélectionné de rubrique Amazon SNS existante à utiliser, celle créée pour vous s'appelle < clustername >-default-alarm (< recipient >) ; par exemple, (notify@example.com). examplecluster-default-alarms

Pour plus d’informations sur la configuration et la modification de l’alarme d’espace disque par défaut, consultez Création d’un cluster et Création ou modification d’une alarme d’espace disque.

Note

Si vous supprimez votre cluster, l’alarme associée au cluster n’est pas supprimée, mais elle ne se déclenchera pas. Vous pouvez supprimer l'alarme de la CloudWatch console si vous n'en avez plus besoin.

Statut du cluster

L’état actuel du cluster s’affiche. Le tableau suivant fournit une description de chaque état du cluster.

État Description
available Le cluster est en cours d’exécution et disponible.
available, prep-for-resize Le cluster est préparé pour le redimensionnement Elastic. Le cluster est exécuté et disponible pour les requêtes d’écriture et de lecture, mais les opérations du cluster, comme la création d’un instantané, ne sont pas disponibles.
available, resize-cleanup L’opération de redimensionnement Elastic finalise le transfert des données vers les nouveaux nœuds du cluster. Le cluster est exécuté et disponible pour les requêtes d’écriture et de lecture, mais les opérations du cluster, comme la création d’un instantané, ne sont pas disponibles.
cancelling-resize L’opération de redimensionnement est en cours d’annulation.
creating Amazon Redshift crée le cluster. Pour plus d'informations, consultez Création d’un cluster.
deleting Amazon Redshift supprime le cluster. Pour plus d'informations, consultez Suppression d’un cluster.
final-snapshot Amazon Redshift prend un instantané final du cluster avant de le supprimer. Pour plus d'informations, consultez Suppression d’un cluster.
hardware-failure

Le cluster subit une défaillance matérielle.

Si vous avez un cluster à nœud unique, le nœud ne peut pas être remplacé. Pour récupérer votre cluster, restaurez un instantané. Pour plus d'informations, consultez Instantanés et sauvegardes Amazon Redshift.

incompatible-hsm Amazon Redshift ne peut pas se connecter au module de sécurité matérielle (HSM). Vérifiez la configuration du HSM entre le cluster et le module de sécurité matérielle. Pour plus d'informations, consultez Chiffrement pour Amazon Redshift à l'aide de modules de sécurité matérielle.
incompatible-network Il y a un problème avec la configuration du réseau sous-jacent. Assurez-vous que le VPC dans lequel vous avez lancé le cluster existe et que ses paramètres sont corrects. Pour plus d'informations, consultez Gestion des clusters dans un VPC.
incompatible-parameters Problème avec une ou plusieurs valeurs du groupe de paramètres associé, et la ou les valeurs de paramètre ne peuvent pas s’appliquer. Modifiez le groupe de paramètres et mettez à jour les valeurs non valides. Pour plus d'informations, consultez Groupes de paramètres Amazon Redshift.
incompatible-restore Problème de restauration du cluster à partir de l’instantané. Essayez de restaurer le cluster à nouveau avec un autre instantané. Pour plus d'informations, consultez Instantanés et sauvegardes Amazon Redshift.
modifying Amazon Redshift applique les modifications au cluster. Pour plus d'informations, consultez Modification d’un cluster.
paused Le cluster est mis en pause. Pour plus d'informations, consultez Suspension et reprise des clusters.
rebooting Amazon Redshift redémarre le cluster. Pour plus d'informations, consultez Redémarrage d’un cluster.
renaming Amazon Redshift applique un nouveau nom au cluster. Pour plus d'informations, consultez Renommer les clusters.
resizing Amazon Redshift redimensionne le cluster. Pour plus d'informations, consultez Redimensionnement d’un cluster.
rotating-keys Amazon Redshift effectue une rotation des clés de chiffrement pour le cluster. Pour plus d'informations, consultez Rotation des clés de chiffrement dans Amazon Redshift.
storage-full Le cluster a atteint sa capacité de stockage. Redimensionnez le cluster pour ajouter des nœuds ou choisir une autre taille de nœud. Pour plus d'informations, consultez Redimensionnement d’un cluster.
updating-hsm Amazon Redshift met à jour la configuration HSM. .