Vue d’ensemble des clusters provisionnés Amazon Redshift - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vue d’ensemble des clusters provisionnés Amazon Redshift

Le service Amazon Redshift gère toutes les tâches de configuration, d’exploitation et de mise à l’échelle d’un entrepôt des données. Ces tâches incluent la capacité d’allocation, de surveillance et de sauvegarde du cluster, ainsi que l’application de correctifs et de mises à niveau au moteur Amazon Redshift.

La vidéo suivante explique comment créer un cluster et interroger des données à l’aide de l’éditeur de requêtes Amazon Redshift v2.

Gestion du cluster

Un cluster Amazon Redshift est un ensemble de nœuds qui se compose d’un nœud principal et d’un ou de plusieurs nœuds de calcul. Le type et le nombre de nœuds de calcul dont vous avez besoin dépend de la taille de vos données, du nombre de requêtes que vous exécutez et des performances d’exécution des requêtes dont vous avez besoin.

Création et gestion de clusters

En fonction de vos besoins en entrepôt des données, vous pouvez commencer par un petit cluster à un seul nœud et facile à agrandir en un cluster plus grand et à plusieurs nœuds, au fur et à mesure que vos besoins évoluent. Vous pouvez ajouter des nœuds de calcul au cluster ou en supprimer sans interrompre le service. Pour plus d'informations, consultez Clusters Amazon Redshift provisionnés.

Réservation de nœuds de calcul

Si vous souhaitez que votre cluster s’exécute pendant un an ou plus, vous pouvez économiser de l’argent en réservant des nœuds de calcul pour une période d’un an ou de trois ans. La réservation de nœuds de calcul offre des économies importantes par rapport aux taux horaires que vous payez lorsque vous mettez en service des nœuds de calcul à la demande. Pour plus d'informations, consultez Nœuds réservés.

Création d’instantanés de cluster

Les snapshots sont point-in-time des sauvegardes d'un cluster. Il existe deux types d’instantanés : automatisé et manuel. Amazon Redshift stocke ces instantanés en interne dans Amazon Simple Storage Service (Amazon S3) à l'aide d'une connexion Secure Sockets Layer () cryptée. SSL Si vous devez restaurer à partir d’un instantané, Amazon Redshift crée un nouveau cluster et importe les données à partir de l’instantané que vous spécifiez. Pour plus d’informations sur les instantanés, consultez Instantanés et sauvegardes Amazon Redshift.

Accès et sécurité des clusters

Il existe plusieurs fonctions liées à l’accès au cluster et à la sécurité dans Amazon Redshift. Ces fonctionnalités vous permettent de contrôler l’accès à votre cluster, de définir des règles de connectivité et de chiffrer les données et les connexions. Ces fonctions viennent en complément des fonctions liées à l’accès aux bases de données et à leur sécurité dans Amazon Redshift. Pour plus d’informations sur la sécurité de la base de données, consultez Gestion de la sécurité de la base de données du Manuel du développeur de base de données Amazon Redshift.

AWS comptes et IAM informations d'identification

Par défaut, un cluster Amazon Redshift n'est accessible qu'aux AWS compte qui crée le cluster. Le cluster est verrouillé afin que personne d’autre n’y ait accès. Au sein de votre AWS compte, vous utilisez le AWS Identity and Access Management (IAM) service permettant de créer des comptes utilisateurs et de gérer les autorisations pour ces comptes afin de contrôler les opérations du cluster. Pour de plus amples informations, veuillez consulter Sécurité dans Amazon Redshift. Pour plus d'informations sur la gestion IAM des identités, notamment des conseils et les meilleures pratiques relatives aux IAM rôles, consultezIdentity and Access Management dans Amazon Redshift.

Groupes de sécurité

Par défaut, les clusters que vous créez sont privés. IAMles informations d'identification contrôlent uniquement l'accès aux ressources API liées à Amazon Redshift : la console Amazon Redshift, l'interface de ligne de commande CLI () API et. SDK Pour activer l'accès au cluster à partir des outils SQL clients via JDBC ouODBC, vous utilisez des groupes de sécurité :

  • Si vous utilisez la VPC plateforme EC2 - pour votre cluster Amazon Redshift, vous devez utiliser des groupes de VPC sécurité. Nous vous recommandons de lancer votre cluster sur une EC2 VPC plate-forme.

    Vous ne pouvez pas déplacer un cluster vers un VPC après son lancement avec EC2 -Classic. Cependant, vous pouvez restaurer un instantané EC2 -Classic sur un VPC cluster EC2 - à l'aide de la console Amazon Redshift. Pour de plus amples informations, veuillez consulter Restauration d’un cluster à partir d’un instantané.

  • Si vous utilisez la plateforme EC2 -Classic pour votre cluster Amazon Redshift, vous devez utiliser les groupes de sécurité Amazon Redshift.

Dans les deux cas, vous ajoutez des règles au groupe de sécurité pour accorder un accès entrant explicite à une plage spécifique d'adresses CIDR /IP ou à un groupe de sécurité Amazon Elastic Compute Cloud EC2 (Amazon) si votre SQL client s'exécute sur une instance AmazonEC2. Pour de plus amples informations, veuillez consulter Groupes de sécurité Amazon Redshift.

Outre les règles de l’accès entrant, vous créez des utilisateurs de base de données pour fournir les informations d’identification afin de s’authentifier auprès de la base de données au sein du cluster lui-même. Pour plus d’informations, consultez Bases de données dans cette rubrique.

Chiffrement

Lorsque vous mettez en service le cluster, vous pouvez choisir, le cas échéant, de chiffrer le cluster pour plus de sécurité. Lorsque vous activez le chiffrement, Amazon Redshift stocke toutes les données des tables créées par l’utilisateur en un format chiffré. Vous pouvez utiliser … AWS Key Management Service (AWS KMS) pour gérer vos clés de chiffrement Amazon Redshift.

Le chiffrement est une propriété immuable du cluster. Le seul moyen de passer d’un cluster chiffré à un cluster non chiffré consiste à décharger les données et à les recharger dans un nouveau cluster. Le chiffrement s’applique au cluster et à toutes les sauvegardes. Lors de la restauration d’un cluster à partir d’un instantané chiffré, le nouveau cluster est également chiffré.

Pour plus d’informations sur le chiffrement, les clés et les modules de sécurité matérielle, consultez Chiffrement de base de données Amazon Redshift.

SSLconnexions

Vous pouvez utiliser le chiffrement Secure Sockets Layer (SSL) pour chiffrer la connexion entre votre SQL client et votre cluster. Pour de plus amples informations, veuillez consulter Configuration des options de sécurité des connexions.

Surveillance des clusters

Il existe plusieurs fonctions liées à la surveillance dans Amazon Redshift. Vous pouvez utiliser la journalisation d’audit afin de générer des journaux d’activités, de configurer des événements et des abonnements aux notifications pour suivre les informations intéressantes. Utilisez les statistiques d'Amazon Redshift et d'Amazon CloudWatch pour en savoir plus sur l'état et les performances de vos clusters et de vos bases de données.

Journalisation des audits de base de données

Vous pouvez utiliser la journalisation des audits de base de données pour suivre les informations sur les tentatives d’authentification, les connexions, les déconnexions, les modifications apportées aux définitions des utilisateurs de la base de données et les requêtes s’exécutant dans la base de données. Ces informations sont utiles pour la sécurité et le dépannage d’Amazon Redshift. Les journaux sont stockés dans des compartiments Amazon S3. Pour plus d'informations, consultez Journalisation des audits de base de données.

Événements et notifications

Amazon Redshift suit les événements et conserve les informations les concernant pendant plusieurs semaines dans votre AWS . Pour chaque événement, Amazon Redshift prend en charge les informations telles que la date à laquelle l’événement s’est produit, une description, la source de l’événement (un cluster, un groupe de paramètres ou un instantané, par exemple) et l’ID source. Vous pouvez créer des abonnements aux notifications d’événements Amazon Redshift qui spécifient un ensemble de filtres d’événement. Quand se produit un événement qui correspond aux critères de filtre, Amazon Redshift utilise Amazon Simple Notification Service pour vous informer que l’événement a eu lieu. Pour plus d’informations sur les événements et les notifications, consultez Événements Amazon Redshift.

Performance

Amazon Redshift fournit les métriques de performance et les données de telle sorte que vous puissiez suivre l’état et les performances de vos clusters et bases de données. Amazon Redshift utilise CloudWatch les métriques Amazon pour surveiller les aspects physiques du cluster, tels que l'CPUutilisation, la latence et le débit. Amazon Redshift fournit également des données de performances de requête et de chargement pour vous aider à surveiller l’activité de la base de données dans votre cluster. Pour plus d’informations sur les métriques de performance et leur surveillance, consultez Surveiller les performances de cluster Amazon Redshift.

Bases de données

Amazon Redshift crée une base de données lorsque vous allouez un cluster. Il s’agit de la base de données que vous utilisez pour charger les données et exécuter des requêtes sur vos données. Vous pouvez créer des bases de données supplémentaires selon vos besoins en exécutant une SQL commande. Pour plus d’informations, consultez Étape 1 : Création d’une base de données dans le Manuel du développeur de base de données Amazon Redshift.

Lorsque vous allouez un cluster, vous spécifiez un utilisateur administrateur qui a accès à toutes les bases de données créées au sein du cluster. Cet utilisateur administrateur est un super-utilisateur, qui est le seul utilisateur ayant accès initialement à la base de données, même si cet utilisateur peut créer des utilisateurs et des super-utilisateurs supplémentaires. Pour plus d’informations, consultez Super-utilisateurs et Utilisateurs dans le Manuel du développeur de base de données Amazon Redshift.

Amazon Redshift utilise les groupes de paramètres pour définir le comportement de toutes les bases de données d’un cluster, comme le style de présentation des dates et la précision en virgule flottante. Si vous ne spécifiez pas un groupe de paramètres lorsque vous allouez votre cluster, Amazon Redshift associe un groupe de paramètres par défaut au cluster. Pour plus d'informations, consultez Groupes de paramètres Amazon Redshift.

Pour plus d’informations sur les bases de données dans Amazon Redshift, consultez le Manuel du développeur de base de données Amazon Redshift.