Clusters et nœuds Utilisation EC2 : VPC lorsque vous créez votre cluster Alarme d’espace disque par défaut Statut du cluster

Clusters Amazon Redshift provisionnés

Un entrepôt des données Amazon Redshift est un ensemble de ressources informatiques appelées nœuds, qui sont organisées en un groupe appelé cluster. Chaque cluster exécute un moteur Amazon Redshift et contient une ou plusieurs bases de données.

Note

À ce jour, le moteur Amazon Redshift version 1.0 est disponible. Toutefois, à mesure que le moteur est mis à jour, plusieurs versions du moteur Amazon Redshift peuvent être disponibles pour la sélection.

Clusters et nœuds dans Amazon Redshift

Un cluster Amazon Redshift est constitué de nœuds. Chaque cluster possède un nœud principal et un ou plusieurs nœuds de calcul. Le nœud principal reçoit les requêtes d’applications clientes, analyse les requêtes et développe les plans d’exécution de requête. Le nœud principal coordonne ensuite l’exécution parallèle de ces plans avec les nœuds de calcul et regroupe les résultats intermédiaires de ces nœuds. Enfin, il renvoie ensuite les résultats aux applications clientes.

Les nœuds de calcul exécutent les plans d’exécution de requête et communiquent les données entre eux afin de traiter ces requêtes. Les résultats intermédiaires sont renvoyés au nœud « leader » afin d’être compilés, puis transmis aux applications clientes. Pour plus d’informations sur les nœuds principaux et les nœuds de calcul, consultez Architecture du système d’entrepôt des données dans le Guide du développeur de la base de données Amazon Redshift.

Note

Lorsque vous créez un cluster sur la console Amazon Redshift (https://console.aws.amazon.com/redshiftv2/), vous pouvez obtenir une recommandation concernant la configuration de votre cluster en fonction de la taille de vos données et des caractéristiques de vos requêtes. Pour utiliser ce calculateur de dimensionnement, recherchez Aidez-moi à choisir sur la console dans AWS Régions qui prennent en charge les types de RA3 nœuds. Pour de plus amples informations, veuillez consulter Création d’un cluster.

Lorsque vous lancez un cluster, vous spécifiez notamment l’option correspondant au type de nœud. Le type de nœud détermine la CPU capacité de stockage et le type de lecteur de stockage pour chaque nœud. RAM

Amazon Redshift propose différents types de nœuds adaptés à vos charges de travail, et nous vous recommandons de choisir RA3 ou DC2 de vous fier aux performances requises, à la taille des données et à la croissance attendue des données.

RA3les nœuds avec stockage géré vous permettent d'optimiser votre entrepôt de données en dimensionnant et en payant indépendamment le calcul et le stockage géré. AvecRA3, vous choisissez le nombre de nœuds en fonction de vos exigences de performance et vous ne payez que pour le stockage géré que vous utilisez. Dimensionnez votre RA3 cluster en fonction de la quantité de données que vous traitez quotidiennement. Vous lancez des clusters qui utilisent les types de RA3 nœuds d'un cloud privé virtuel (VPC). Vous ne pouvez pas lancer de RA3 clusters dans EC2 -Classic. Pour de plus amples informations, veuillez consulter Création d'un cluster provisionné par Redshift ou d'un groupe de travail Amazon Redshift Serverless dans un VPC.

Le stockage géré Amazon Redshift utilise une grande capacité de stockage SSDs à hautes performances dans chaque RA3 nœud pour un stockage local rapide et Amazon S3 pour un stockage durable à long terme. Si les données d'un nœud dépassent la taille d'un nœud local de grande tailleSSDs, le stockage géré par Amazon Redshift transfère automatiquement ces données vers Amazon S3. Vous payez le même tarif modique pour le stockage géré par Amazon Redshift, que les données se trouvent sur Amazon S3 SSDs ou à hautes performances. Pour les charges de travail qui nécessitent un stockage en constante augmentation, le stockage géré vous permet d'adapter automatiquement la capacité de stockage de votre entrepôt de données indépendamment des nœuds de calcul.

DC2les nœuds vous permettent de disposer d'entrepôts de données gourmands en calcul avec SSD stockage local inclus. Vous choisissez le nombre de nœuds dont vous avez besoin en fonction de la taille des données et des exigences en matière de performance. DC2les nœuds stockent vos données localement pour des performances élevées, et à mesure que la taille des données augmente, vous pouvez ajouter d'autres nœuds de calcul pour augmenter la capacité de stockage du cluster. Pour les ensembles de données de moins de 1 To (compressés), nous recommandons les types de DC2 nœuds pour obtenir les meilleures performances au prix le plus bas. Si vous pensez que vos données augmenteront, nous vous recommandons d'utiliser des RA3 nœuds afin de pouvoir dimensionner le calcul et le stockage de manière indépendante afin d'améliorer le prix et les performances. Vous lancez des clusters qui utilisent les types de DC2 nœuds d'un cloud privé virtuel (VPC). Vous ne pouvez pas lancer de DC2 clusters dans EC2 -Classic. Pour de plus amples informations, veuillez consulter Création d'un cluster provisionné par Redshift ou d'un groupe de travail Amazon Redshift Serverless dans un VPC.

Les types de nœuds sont disponibles en différentes tailles. La taille de nœud et le nombre de nœuds de déterminent le stockage total d’un cluster. Pour plus d'informations, consultez Détails de type de nœud.

Certains types de nœud autorisent un nœud (type à nœud unique) ou deux ou plusieurs nœuds (type à plusieurs nœuds). Le nombre minimum de nœuds pour les clusters de certains types de nœuds est de deux nœuds. Sur un cluster à un seul nœud, le nœud est partagé pour les fonctionnalités « principal » et « calcul ». Les clusters à nœud unique ne sont pas recommandés pour l’exécution de charges de travail de production. Sur un cluster à plusieurs nœuds, le nœud principal est distinct des nœuds de calcul. Le nœud de ligne est le même type de nœud que les nœuds de calcul. Vous ne payez que pour les nœuds de calcul.

Amazon Redshift applique des quotas aux ressources pour chaque AWS compte dans chaque AWS région. Un quota limite le nombre de ressources que votre compte peut créer pour un type de ressource donné, comme les nœuds ou les instantanés, au sein d'une AWS région. Pour plus d'informations sur les quotas par défaut qui s'appliquent aux ressources Amazon Redshift, consultez. Quotas et limites d’Amazon Redshift

Le coût de votre cluster dépend de la AWS région, du type de nœud, du nombre de nœuds et du fait que les nœuds sont réservés à l'avance ou non. Pour plus d’informations sur le coût des nœuds, consultez la page de Tarification d’Amazon Redshift.

Détails de type de nœud

Les tableaux suivants résument les spécifications de nœud de chaque type de nœud et taille. Les en-têtes dans les tableaux ont les significations suivantes :

v CPU est le nombre de virtuels CPUs pour chaque nœud.
RAMest la quantité de mémoire en gibioctets (GiB) pour chaque nœud.
Tranches par nœud est le nombre de tranches dans lesquelles un nœud de calcul est partitionné lorsqu’un cluster est créé ou redimensionné avec un redimensionnement classique.

Le nombre de sections par nœud peut changer si le cluster est redimensionné à l’aide du redimensionnement Elastic. Cependant, le nombre total de tranches sur tous les nœuds de calcul dans le cluster reste le même après le redimensionnement élastique.

Lorsque vous créez un cluster avec l’opération de restauration à partir d’un instantané, le nombre de tranches du cluster résultant peut changer par rapport au cluster d’origine si vous modifiez le type de nœud.
Stockage correspond à la capacité et au type de stockage de chaque nœud.
La plage de nœuds est le nombre minimum et maximum de nœuds qu’Amazon Redshift prend en charge pour le type et la taille de nœud.

Note
Il se peut que vous soyez limité à un nombre de nœuds inférieur en fonction du quota appliqué à votre AWS compte dans la AWS région sélectionnée. Pour plus d'informations sur les quotas par défaut qui s'appliquent aux ressources Amazon Redshift, consultez. Quotas et limites d’Amazon Redshift
Capacité totale correspond à la capacité de stockage totale du cluster si vous déployez le nombre maximal de nœuds spécifié dans la plage de nœuds.

Le tableau suivant décrit les spécifications relatives RA3 aux nœuds.

Type de nœud	v CPU	RAM(GiB)	Tranches par défaut par nœud	Limite de stockage géré par nœud ¹	Plage de nœuds avec la création d’un cluster	Capacité de stockage géré totale ²
ra3.large (nœud unique)	2	16	2	1 To	1	1 To ³
ra3.large (multi-nœuds)	2	16	2	8 TO	2-16	128 To
ra3.xlplus (nœud unique)	4	32	2	4 To	1	4 To³
ra3.xlplus (multi-nœuds)	4	32	2	32 To	2–16⁴	1 024 To⁴
ra3.4xlarge	12	96	4	128 To	2–32⁵	8 192 To⁵
ra3.16xlarge	48	384	16	128 To	2–128	16 384 To

¹ La limite de stockage pour le stockage géré Amazon Redshift. Il s’agit d’une limite stricte.

² La limite de stockage géré totale correspond au nombre maximal de nœuds multiplié par la limite de stockage géré par nœud.

³ Pour redimensionner un cluster à nœud unique en cluster à plusieurs nœuds, seul le redimensionnement classique est pris en charge.

⁴ Vous pouvez créer un cluster avec le type de nœud ra3.xlplus (multi-nœuds) qui a jusqu’à 16 nœuds. Pour les clusters à plusieurs nœuds, vous pouvez redimensionner avec le redimensionnement Elastic jusqu’à 32 nœuds maximum.

⁵ Vous pouvez créer un cluster avec le type de nœud ra3.4xlarge qui a jusqu’à 32 nœuds. Vous pouvez le redimensionner avec un redimensionnement Elastic jusqu’à un maximum de 64 nœuds.

Le tableau suivant décrit les spécifications relatives aux nœuds de calcul denses.

Type de nœud	v CPU	RAM(GiB)	Tranches par défaut par nœud	Stockage par nœud	Plage de nœuds	Capacité totale
dc2.large	2	15	2	160 Go NVMe - SSD	1–32	5.12 To
dc2.8xlarge	32	244	16	2,56 To - NVMe SSD	2–128	326 To

Note

Les types de nœuds de stockage dense (DS2) ne sont plus disponibles.

Noms précédents des types de nœud

Dans les versions précédentes d’Amazon Redshift, certains types de nœuds avaient des noms différents. Vous pouvez utiliser les anciens noms dans Amazon Redshift API et. AWS CLI Néanmoins, nous vous recommandons de mettre à jour tous les scripts qui font référence à ces noms afin d’utiliser les noms actuels à la place. Les noms anciens et actuels sont les suivants.

Nom actuel	Noms précédents
ds2.xlarge	ds1.xlarge, dw.hs1.xlarge, dw1.xlarge
ds2.8xlarge	ds1.8xlarge, dw.hs1.8xlarge, dw1.8xlarge
dc1.large	dw2.large
dc1.8xlarge	dw2.8xlarge

Détermination du nombre de nœuds

Étant donné qu’Amazon Redshift distribue et exécute les requêtes en parallèle sur l’ensemble des nœuds de calcul d’un cluster, vous pouvez augmenter les performances des requêtes en ajoutant des nœuds à votre cluster. Lorsque vous exécutez un cluster équipé d’au moins deux nœuds de calcul, les données présentes sur chaque nœud sont toujours mises en miroir sur les disques de l’autre nœud, réduisant ainsi le risque de perte de données.

Vous pouvez surveiller les performances des requêtes dans la console Amazon Redshift et à l'aide des métriques Amazon CloudWatch . Vous pouvez également ajouter ou supprimer des nœuds si nécessaire pour atteindre l’équilibre entre le prix et les performances de votre cluster. Lorsque vous demandez un nœud supplémentaire, Amazon Redshift prend en charge tous les détails du déploiement, de l’équilibrage de charge et de la maintenance des données. Pour plus d’informations sur les performances des clusters, consultez Surveiller les performances de cluster Amazon Redshift.

Les nœuds réservés conviennent aux charges de travail régulières en production et vous permettent de réaliser d’importantes économies par rapport aux nœuds à la demande. Vous pouvez acheter des nœuds réservés après avoir effectué des tests et proof-of-concepts pour valider votre configuration de production. Pour de plus amples informations, veuillez consulter Nœuds réservés.

Lorsque vous mettez en pause un cluster, vous suspendez la facturation à la demande pendant la période de mise en pause du cluster. Pendant cette période de pause, vous ne payez que pour le stockage de sauvegarde. Vous n’avez donc pas à vous soucier de la planification et de l’achat de capacités pour l’entrepôt des données en amont, ce qui vous permet de gérer de manière rentable vos environnements à des fins de test ou de développement.

Pour plus d’informations sur la tarification des nœuds à la demande et réservés, consultez la Tarification Amazon Redshift.

Utilisation EC2 : VPC lorsque vous créez votre cluster

Les clusters Amazon Redshift s'exécutent dans des EC2 instances Amazon configurées pour le type et la taille du nœud Amazon Redshift que vous sélectionnez. Créez votre cluster à l'aide de EC2 -VPC. Si vous utilisez toujours EC2 -Classic, nous vous recommandons d'utiliser EC2 - VPC pour améliorer les performances et la sécurité. Pour plus d'informations sur ces plateformes réseau, consultez la section Plateformes prises en charge dans le guide de EC2 l'utilisateur Amazon. Les paramètres de votre AWS compte déterminent si EC2 - VPC ou EC2 -Classic sont disponibles pour vous.

Note

Pour éviter les problèmes de connexion entre les outils SQL client et la base de données Amazon Redshift, nous vous recommandons de procéder de l'une des deux manières suivantes. Vous pouvez configurer une règle de trafic entrant qui permet aux hôtes de négocier la taille des paquets. Vous pouvez également désactiver les trames jumbo TCP /IP en réglant l'unité de transmission maximale (MTU) à 1500 sur l'interface réseau (NIC) de vos instances AmazonEC2. Pour plus d’informations sur ces approches, consultez Des requêtes semblent se bloquer et parfois échouent à atteindre le cluster.

EC2-VPC

Lorsque vous utilisez EC2 -VPC, votre cluster s'exécute dans un cloud privé virtuel (VPC) qui est logiquement isolé de votre AWS compte. Si vous configurez votre cluster dans le EC2 -VPC, vous contrôlez l'accès à votre cluster en lui associant un ou plusieurs groupes de VPC sécurité. Pour plus d'informations, consultez la section Security Groups for Your VPC dans le guide de VPC l'utilisateur Amazon.

Pour créer un cluster dans unVPC, vous devez d'abord créer un groupe de sous-réseaux du cluster Amazon Redshift en fournissant les informations de votre sous-réseauVPC, puis fournir le groupe de sous-réseaux lors du lancement du cluster. Pour de plus amples informations, veuillez consulter Sous-réseaux pour les ressources Redshift.

Pour plus d'informations sur Amazon Virtual Private Cloud (AmazonVPC), consultez la page détaillée VPC du produit Amazon.

Alarme d’espace disque par défaut

Lorsque vous créez un cluster Amazon Redshift, vous pouvez éventuellement configurer une CloudWatch alarme Amazon pour surveiller le pourcentage moyen d'espace disque utilisé sur tous les nœuds de votre cluster. Nous nous référons à cette alarme comme alarme d’espace disque par défaut.

Le but d’une alarme d’espace disque par défaut consiste à vous aider à surveiller la capacité de stockage de votre cluster. Vous pouvez configurer cette alarme selon les besoins de votre entrepôt des données. Par exemple, vous pouvez utiliser l’avertissement comme indicateur vous signalant que vous devez redimensionner le cluster. Vous pouvez redimensionner votre cluster soit en un type de nœud différent, soit pour ajouter des nœuds, ou encore pour acheter des nœuds réservés en vue d’une expansion future.

L’alarme d’espace disque par défaut se déclenche lorsque l’utilisation du disque atteint ou dépasse un pourcentage spécifié un certain nombre de fois et sur une durée spécifiée. Par défaut, l’alarme se déclenche lorsque le pourcentage que vous spécifiez est atteint, puis demeure à cette valeur ou à une valeur supérieure pendant cinq minutes ou plus. Vous pouvez modifier les valeurs par défaut après que vous avez lancé le cluster.

Lorsque l' CloudWatch alarme se déclenche, Amazon Simple Notification Service (AmazonSNS) envoie une notification aux destinataires spécifiés pour les avertir que le seuil de pourcentage est atteint. Amazon SNS utilise un sujet pour spécifier les destinataires et le message à envoyer dans une notification. Vous pouvez utiliser un SNS sujet Amazon existant ; sinon, un sujet est créé en fonction des paramètres que vous spécifiez lorsque vous lancez le cluster. Vous pouvez modifier la rubrique de cette alarme après avoir lancé le cluster. Pour plus d'informations sur la création de SNS rubriques Amazon, consultez Getting Started with Amazon Simple Notification Service.

Après avoir lancé le cluster, vous pouvez afficher et modifier l'alarme depuis la fenêtre État du cluster sous CloudWatch Alarmes. Le nom est percentage-disk-space-used -default-<string>. Vous pouvez ouvrir l'alarme pour consulter la SNS rubrique Amazon à laquelle elle est associée et modifier les paramètres de l'alarme. Si vous n'avez pas sélectionné de SNS sujet Amazon existant à utiliser, celui créé pour vous s'appelle <clustername>-alarmes par défaut (<recipient>) ; par exemple, examplecluster-default-alarms (notify@example.com).

Pour plus d’informations sur la configuration et la modification de l’alarme d’espace disque par défaut, consultez Création d’un cluster et Création d'une alarme d'espace disque.

Note

Si vous supprimez votre cluster, l’alarme associée au cluster n’est pas supprimée, mais elle ne se déclenchera pas. Vous pouvez supprimer l'alarme de la CloudWatch console si vous n'en avez plus besoin.

Statut du cluster

L’état actuel du cluster s’affiche. Le tableau suivant fournit une description de chaque état du cluster.

État	Description
`available`	Le cluster est en cours d’exécution et disponible.
`available, prep-for-resize`	Le cluster est préparé pour le redimensionnement Elastic. Le cluster est exécuté et disponible pour les requêtes d’écriture et de lecture, mais les opérations du cluster, comme la création d’un instantané, ne sont pas disponibles.
`available, resize-cleanup`	L’opération de redimensionnement Elastic finalise le transfert des données vers les nouveaux nœuds du cluster. Le cluster est exécuté et disponible pour les requêtes d’écriture et de lecture, mais les opérations du cluster, comme la création d’un instantané, ne sont pas disponibles.
`cancelling-resize`	L’opération de redimensionnement est en cours d’annulation.
`creating`	Amazon Redshift crée le cluster. Pour plus d'informations, consultez Création d’un cluster.
`deleting`	Amazon Redshift supprime le cluster. Pour de plus amples informations, veuillez consulter Arrêt et suppression d'un cluster.
`final-snapshot`	Amazon Redshift prend un instantané final du cluster avant de le supprimer. Pour de plus amples informations, veuillez consulter Arrêt et suppression d'un cluster.
`hardware-failure`	Le cluster subit une défaillance matérielle. Si vous avez un cluster à nœud unique, le nœud ne peut pas être remplacé. Pour récupérer votre cluster, restaurez un instantané. Pour de plus amples informations, veuillez consulter Instantanés et sauvegardes Amazon Redshift.
`incompatible-hsm`	Amazon Redshift ne peut pas se connecter au module de sécurité matériel ()HSM. Vérifiez la HSM configuration entre le cluster etHSM. Pour de plus amples informations, veuillez consulter Chiffrement à l'aide de modules de sécurité matériels.
`incompatible-network`	Il y a un problème avec la configuration du réseau sous-jacent. Assurez-vous que le cluster VPC dans lequel vous avez lancé existe et que ses paramètres sont corrects. Pour de plus amples informations, veuillez consulter Ressources Redshift dans un VPC.
`incompatible-parameters`	Problème avec une ou plusieurs valeurs du groupe de paramètres associé, et la ou les valeurs de paramètre ne peuvent pas s’appliquer. Modifiez le groupe de paramètres et mettez à jour les valeurs non valides. Pour plus d'informations, consultez Groupes de paramètres Amazon Redshift.
`incompatible-restore`	Problème de restauration du cluster à partir de l’instantané. Essayez de restaurer le cluster à nouveau avec un autre instantané. Pour plus d'informations, consultez Instantanés et sauvegardes Amazon Redshift.
`modifying`	Amazon Redshift applique les modifications au cluster. Pour plus d'informations, consultez Modification d’un cluster.
`paused`	Le cluster est mis en pause. Pour plus d'informations, consultez Suspension et reprise d'un cluster.
`rebooting`	Amazon Redshift redémarre le cluster. Pour plus d'informations, consultez Redémarrage d’un cluster.
`renaming`	Amazon Redshift applique un nouveau nom au cluster. Pour plus d'informations, consultez Modification du nom d'un cluster.
`resizing`	Amazon Redshift redimensionne le cluster. Pour plus d'informations, consultez Redimensionnement d’un cluster.
`rotating-keys`	Amazon Redshift effectue une rotation des clés de chiffrement pour le cluster. Pour plus d'informations, consultez Rotation des clés de chiffrement.
`storage-full`	Le cluster a atteint sa capacité de stockage. Redimensionnez le cluster pour ajouter des nœuds ou choisir une autre taille de nœud. Pour de plus amples informations, veuillez consulter Redimensionnement d’un cluster.
`updating-hsm`	Amazon Redshift est en train de mettre à jour la HSM configuration.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Balisage des ressources

Considérations relatives à l'utilisation de clusters provisionnés