Gestion du cluster Accès et sécurité des clusters Surveillance des clusters Bases de données

Amazon Redshift ne prendra plus en charge la création de nouveaux Python UDFs à compter du 1er novembre 2025. Si vous souhaitez utiliser Python UDFs, créez la version UDFs antérieure à cette date. Le Python existant UDFs continuera à fonctionner normalement. Pour plus d'informations, consultez le billet de blog.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vue d’ensemble des clusters provisionnés Amazon Redshift

Le service Amazon Redshift gère toutes les tâches de configuration, d’exploitation et de mise à l’échelle d’un entrepôt des données. Ces tâches incluent la capacité d’allocation, de surveillance et de sauvegarde du cluster, ainsi que l’application de correctifs et de mises à niveau au moteur Amazon Redshift.

La vidéo suivante explique comment créer un cluster et interroger des données à l’aide de l’éditeur de requêtes Amazon Redshift v2.

Gestion du cluster

Un cluster Amazon Redshift est un ensemble de nœuds qui se compose d’un nœud principal et d’un ou de plusieurs nœuds de calcul. Le type et le nombre de nœuds de calcul dont vous avez besoin dépend de la taille de vos données, du nombre de requêtes que vous exécutez et des performances d’exécution des requêtes dont vous avez besoin.

Création et gestion de clusters

En fonction de vos besoins en entrepôt des données, vous pouvez commencer par un petit cluster à un seul nœud et facile à agrandir en un cluster plus grand et à plusieurs nœuds, au fur et à mesure que vos besoins évoluent. Vous pouvez ajouter des nœuds de calcul au cluster ou en supprimer sans interrompre le service. Pour plus d'informations, consultez Clusters Amazon Redshift provisionnés.

Réservation de nœuds de calcul

Si vous souhaitez que votre cluster s’exécute pendant un an ou plus, vous pouvez économiser de l’argent en réservant des nœuds de calcul pour une période d’un an ou de trois ans. La réservation de nœuds de calcul offre des économies importantes par rapport aux taux horaires que vous payez lorsque vous mettez en service des nœuds de calcul à la demande. Pour plus d'informations, consultez Nœuds réservés.

Création d’instantanés de cluster

Les snapshots sont point-in-time des sauvegardes d'un cluster. Il existe deux types d’instantanés : automatiques et manuels. Amazon Redshift stocke ces instantanés en interne dans Amazon Simple Storage Service (Amazon S3) à l’aide d’une connexion chiffrée Secure Sockets Layer (SSL). Si vous devez restaurer à partir d’un instantané, Amazon Redshift crée un nouveau cluster et importe les données à partir de l’instantané que vous spécifiez. Pour plus d’informations sur les instantanés, consultez Instantanés et sauvegardes Amazon Redshift.

Accès et sécurité des clusters

Il existe plusieurs fonctions liées à l’accès au cluster et à la sécurité dans Amazon Redshift. Ces fonctionnalités vous permettent de contrôler l’accès à votre cluster, de définir des règles de connectivité et de chiffrer les données et les connexions. Ces fonctions viennent en complément des fonctions liées à l’accès aux bases de données et à leur sécurité dans Amazon Redshift. Pour plus d’informations sur la sécurité de la base de données, consultez Gestion de la sécurité de la base de données du Manuel du développeur de base de données Amazon Redshift.

AWS comptes et informations d'identification IAM

Par défaut, un cluster Amazon Redshift n'est accessible qu'au AWS compte qui le crée. Le cluster est verrouillé afin que personne d’autre n’y ait accès. Dans votre AWS compte, vous utilisez le service AWS Identity and Access Management (IAM) pour créer des comptes utilisateurs et gérer les autorisations associées à ces comptes afin de contrôler les opérations du cluster. Pour de plus amples informations, veuillez consulter Sécurité dans Amazon Redshift. Pour plus d’informations sur la gestion des identités IAM, y compris les conseils et les bonnes pratiques pour les rôles IAM, consultez Identity and Access Management dans Amazon Redshift.

Groupes de sécurité

Par défaut, les clusters que vous créez sont privés. Les informations d’identification IAM contrôlent uniquement l’accès aux ressources liées à l’API Amazon Redshift : la console Amazon Redshift, l’interface de ligne de commande (CLI), l’API et le kit SDK. Pour autoriser l’accès au cluster à partir d’outils clients SQL via ODBC ou JDBC, vous utilisez des groupes de sécurité :

Si vous utilisez la plate-forme EC2 -VPC pour votre cluster Amazon Redshift, vous devez utiliser des groupes de sécurité VPC. Nous vous recommandons de lancer votre cluster sur une plateforme EC2 -VPC.

Vous ne pouvez pas déplacer un cluster vers un VPC une fois qu'il a été lancé avec EC2 -Classic. Cependant, vous pouvez restaurer un instantané EC2 -Classic sur un cluster EC2 -VPC à l'aide de la console Amazon Redshift. Pour de plus amples informations, veuillez consulter Restauration d’un cluster à partir d’un instantané.
Si vous utilisez la plateforme EC2 -Classic pour votre cluster Amazon Redshift, vous devez utiliser les groupes de sécurité Amazon Redshift.

Dans les deux cas, vous ajoutez des règles au groupe de sécurité pour accorder un accès entrant explicite à une plage d' CIDR/IP adresses spécifique ou à un groupe de sécurité Amazon Elastic Compute Cloud (Amazon EC2) si votre client SQL s'exécute sur une EC2 instance Amazon. Pour de plus amples informations, veuillez consulter Groupes de sécurité Amazon Redshift.

Outre les règles de l’accès entrant, vous créez des utilisateurs de base de données pour fournir les informations d’identification afin de s’authentifier auprès de la base de données au sein du cluster lui-même. Pour plus d’informations, consultez Bases de données dans cette rubrique.

Chiffrement

Lorsque vous mettez en service le cluster, vous pouvez choisir, le cas échéant, de chiffrer le cluster pour plus de sécurité. Lorsque vous activez le chiffrement, Amazon Redshift stocke toutes les données des tables créées par l’utilisateur en un format chiffré. Vous pouvez utiliser AWS Key Management Service (AWS KMS) pour gérer vos clés de chiffrement Amazon Redshift.

Le chiffrement est une propriété immuable du cluster. Le seul moyen de passer d’un cluster chiffré à un cluster non chiffré consiste à décharger les données et à les recharger dans un nouveau cluster. Le chiffrement s’applique au cluster et à toutes les sauvegardes. Lors de la restauration d’un cluster à partir d’un instantané chiffré, le nouveau cluster est également chiffré.

Pour plus d’informations sur le chiffrement, les clés et les modules de sécurité matérielle, consultez Chiffrement de base de données Amazon Redshift.

Connexions SSL

Vous pouvez utiliser le chiffrement SSL (Secure Sockets Layer) pour chiffrer la connexion entre votre client SQL et votre cluster. Pour plus d'informations, consultez Configuration des options de sécurité des connexions.

Surveillance des clusters

Il existe plusieurs fonctions liées à la surveillance dans Amazon Redshift. Vous pouvez utiliser la journalisation d’audit afin de générer des journaux d’activités, de configurer des événements et des abonnements aux notifications pour suivre les informations intéressantes. Utilisez les statistiques d'Amazon Redshift et d'Amazon CloudWatch pour en savoir plus sur l'état et les performances de vos clusters et de vos bases de données.

Journalisation des audits de base de données

Vous pouvez utiliser la journalisation des audits de base de données pour suivre les informations sur les tentatives d’authentification, les connexions, les déconnexions, les modifications apportées aux définitions des utilisateurs de la base de données et les requêtes s’exécutant dans la base de données. Ces informations sont utiles pour la sécurité et le dépannage d’Amazon Redshift. Les journaux sont stockés dans des compartiments Amazon S3. Pour plus d'informations, consultez Journalisation des audits de base de données.

Événements et notifications

Amazon Redshift suit les événements et conserve les informations les concernant pendant plusieurs semaines dans votre AWS compte. Pour chaque événement, Amazon Redshift prend en charge les informations telles que la date à laquelle l’événement s’est produit, une description, la source de l’événement (un cluster, un groupe de paramètres ou un instantané, par exemple) et l’ID source. Vous pouvez créer des abonnements aux notifications d’événements Amazon Redshift qui spécifient un ensemble de filtres d’événement. Quand se produit un événement qui correspond aux critères de filtre, Amazon Redshift utilise Amazon Simple Notification Service pour vous informer que l’événement a eu lieu. Pour plus d’informations sur les événements et les notifications, consultez Événements Amazon Redshift.

Performances

Amazon Redshift fournit les métriques de performance et les données de telle sorte que vous puissiez suivre l’état et les performances de vos clusters et bases de données. Amazon Redshift utilise CloudWatch les métriques Amazon pour surveiller les aspects physiques du cluster, tels que l'utilisation du processeur, la latence et le débit. Amazon Redshift fournit également des données de performances de requête et de chargement pour vous aider à surveiller l’activité de la base de données dans votre cluster. Pour plus d’informations sur les métriques de performance et leur surveillance, consultez Surveiller les performances de cluster Amazon Redshift.

Bases de données

Amazon Redshift crée une base de données lorsque vous allouez un cluster. Il s’agit de la base de données que vous utilisez pour charger les données et exécuter des requêtes sur vos données. Vous pouvez créer des bases de données supplémentaires en fonction des besoins en exécutant une commande SQL. Pour plus d’informations, consultez Étape 1 : Création d’une base de données dans le Manuel du développeur de base de données Amazon Redshift.

Lorsque vous allouez un cluster, vous spécifiez un utilisateur administrateur qui a accès à toutes les bases de données créées au sein du cluster. Cet utilisateur administrateur est un super-utilisateur, qui est le seul utilisateur ayant accès initialement à la base de données, même si cet utilisateur peut créer des utilisateurs et des super-utilisateurs supplémentaires. Pour plus d’informations, consultez Super-utilisateurs et Utilisateurs dans le Manuel du développeur de base de données Amazon Redshift.

Amazon Redshift utilise les groupes de paramètres pour définir le comportement de toutes les bases de données d’un cluster, comme le style de présentation des dates et la précision en virgule flottante. Si vous ne spécifiez pas un groupe de paramètres lorsque vous allouez votre cluster, Amazon Redshift associe un groupe de paramètres par défaut au cluster. Pour plus d'informations, consultez Groupes de paramètres Amazon Redshift.

Pour plus d’informations sur les bases de données dans Amazon Redshift, consultez le Manuel du développeur de base de données Amazon Redshift.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Présentation des fonctions d’Amazon Redshift sans serveur

Comparaison entre Amazon Redshift sans serveur et un entrepôt des données mis en service par Amazon Redshift sans serveur