Información general de los clústeres de Amazon Redshift aprovisionados - Amazon Redshift

Información general de los clústeres de Amazon Redshift aprovisionados

El servicio Amazon Redshift administra todo el trabajo de configuración, operación y escalado del almacenamiento de datos. Entre estas tareas, se incluyen el aprovisionamiento de capacidad, la supervisión y la creación de copias de seguridad del clúster, además de la aplicación de parches y actualizaciones al motor de Amazon Redshift.

El siguiente vídeo muestra cómo crear un clúster y consultar datos mediante el editor de consultas v2 de Amazon Redshift.

Administración de clústeres

Un clúster de Amazon Redshift es un conjunto de nodos que consiste en un nodo principal y uno o más nodos informáticos. El tipo y la cantidad de nodos de computación que necesita dependen del tamaño de los datos, la cantidad de consultas que ejecutará y el rendimiento de tiempo de ejecución de consultas que necesite.

Creación y administración de clústeres

Según sus necesidades de data warehouse, puede comenzar con un clúster pequeño, de nodo único, y escalar con facilidad a un clúster más grande de nodos múltiples, a medida que cambien sus requisitos. Puede agregar o eliminar nodos de computación al clúster sin que se interrumpa el servicio. Para obtener más información, consulte Clústeres aprovisionados de Amazon Redshift.

Reserva de nodos de computación

Si desea que el clúster se siga ejecutando durante un año o más, puede ahorrar dinero si reserva los nodos de computación por un periodo de uno o tres años. La reserva de nodos de computación le ofrece ahorros significativos en comparación con las tasas por hora que se pagan al aprovisionar nodos de computación bajo demanda. Para obtener más información, consulte Adquisición de nodos reservados de Amazon Redshift.

Creación de instantáneas de un clúster

Las snapshots son backups de un momento determinado de un clúster. Existen dos tipos de instantáneas: automatizadas y manuales. Amazon Redshift guarda estas instantáneas internamente en Amazon Simple Storage Service (Amazon S3) con una conexión de capa de conexión segura (SSL) cifrada. Si tiene que restaurar datos a partir de una instantánea, Amazon Redshift crea un nuevo clúster e importa los datos de la instantánea que usted especifique. Para obtener más información acerca de las instantáneas, consulte Instantáneas y copias de seguridad de Amazon Redshift.

Obtención de acceso a clústeres y seguridad

Hay varias características relacionadas con el acceso a los clústeres y la seguridad en Amazon Redshift. Estas características lo ayudan a controlar la obtención de acceso a su clúster, definir reglas de conectividad y cifrar datos y conexiones. Estas características se suman a las relacionadas con el acceso a la base de datos y la seguridad en Amazon Redshift. Para obtener más información acerca de la seguridad de bases de datos, consulte Administración de la seguridad de bases de datos en la Guía para desarrolladores de bases de datos de Amazon Redshift.

Cuentas de AWS y credenciales de IAM

De forma predeterminada, solo la cuenta de AWS que crea el clúster de Amazon Redshift puede acceder a él. El clúster se encuentra bloqueado de manera tal que nadie más obtenga acceso. En su cuenta de AWS, utiliza el servicio AWS Identity and Access Management (IAM) para crear cuentas de usuario y administrar los permisos de esas cuentas para controlar las operaciones del clúster. Para obtener más información, consulte Seguridad en Amazon Redshift. Para obtener más información sobre cómo administrar las identidades de IAM, incluida la orientación y las prácticas recomendadas para los roles de IAM, consulte Administración de identidades y accesos en Amazon Redshift.

Grupos de seguridad

De forma predeterminada, nadie podrá acceder a cualquier clúster que cree. Las credenciales de IAM solo controlan el acceso a los recursos relacionados con la API de Amazon Redshift: la consola de Amazon Redshift, la interfaz de línea de comandos (CLI), la API y el SDK. Para habilitar el acceso al clúster desde herramientas de cliente SQL mediante JDBC u ODBC, se usan grupos de seguridad:

  • Si utiliza la plataforma EC2-VPC para su clúster de Amazon Redshift, debe usar grupos de seguridad de la VPC. Le recomendamos que lance el clúster en una plataforma EC2-VPC.

    No se puede mover un clúster a una VPC después de haberse lanzado con EC2-Classic. No obstante, puede restaurar una instantánea de EC2-Classic en un clúster EC2-VPC a través de la consola de Amazon Redshift. Para obtener más información, consulte Restauración de un clúster desde una instantánea.

  • Si utiliza la plataforma EC2-Classic en su clúster de Amazon Redshift, debe usar grupos de seguridad de Amazon Redshift.

En cualquiera de los casos, se agregan reglas al grupo de seguridad para otorgar acceso de entrada explícito a un rango específico de direcciones IP/CIDR o a un grupo de seguridad de Amazon Elastic Compute Cloud (Amazon EC2), si el cliente SQL se ejecuta en una instancia de Amazon EC2. Para obtener más información, consulte Grupos de seguridad del clúster de Amazon Redshift.

Además de las reglas de acceso de entrada, crea usuarios de base de datos para brindar credenciales que se autentique para la base de datos dentro del mismo clúster. Para obtener más información, consulte Bases de datos en este tema.

Cifrado

Al aprovisionar el clúster, tiene la opción de cifrarlo para obtener seguridad adicional. Cuando se habilita el cifrado, Amazon Redshift almacena todos los datos en las tablas creadas por el usuario en un formato cifrado. Puede usar AWS Key Management Service (AWS KMS) para administrar las claves de cifrado de Amazon Redshift.

El cifrado es una propiedad inmutable del clúster. La única forma de cambiar de un clúster cifrado a uno no cifrado es descargar los datos y volverlos a cargar en un clúster nuevo. El cifrado se aplica al clúster y a todos los backups. Cuando los datos se restauran desde una snapshot cifrada, el nuevo clúster también se cifra.

Para obtener más información acerca del cifrado, las claves y los módulos de seguridad de hardware, consulte Cifrado de la base de datos de Amazon Redshift.

Conexiones SSL

Puede usar un Secure Sockets Layer (SSL, Cifrado de capa de conexión segura) para cifrar la conexión entre el cliente SQL y el clúster. Para obtener más información, consulte Configuración de las opciones de seguridad para las conexiones.

Supervisión de clústeres

Hay varias características relacionadas con la supervisión en Amazon Redshift. Puede utilizar el registro de auditoría de base de datos para generar registros de actividad, configurar eventos y suscripciones a notificaciones para realizar un seguimiento de información de interés. Utilice las métricas de Amazon Redshift y Amazon CloudWatch para obtener más información sobre el estado y el rendimiento de sus clústeres y bases de datos.

Registro de auditoría de bases de datos

Puede usar la característica de registro de auditoría de bases de datos para realizar un seguimiento de información relacionada con los intentos de autentificación, las conexiones, las desconexiones, los cambios en las definiciones de usuario de la base de datos y las consultas ejecutadas en esta última. Esta información es útil en términos de seguridad y solución de problemas en Amazon Redshift. Los registros se almacenan en buckets de Amazon S3. Para obtener más información, consulte Registro de auditoría de bases de datos.

Eventos y notificaciones

Amazon Redshift realiza un seguimiento de los eventos y retiene información sobre ellos durante varias semanas en su cuenta de AWS. Amazon Redshift brinda información sobre cada evento, como la fecha en la que se produjo, una descripción de él, su fuente (por ejemplo, un clúster, un grupo de parámetros o una instantánea) y el ID de la fuente. Puede crear suscripciones de notificaciones de eventos de Amazon Redshift que especifiquen un conjunto de filtros de eventos. Cuando se produce un evento que coincide con los criterios de filtro, Amazon Redshift usa Amazon Simple Notification Service para informarle de que se ha producido el evento. Para obtener más información acerca de eventos y notificaciones, consulte Eventos de Amazon Redshift.

Rendimiento

Amazon Redshift proporciona métricas y datos de rendimiento para que pueda realizar un seguimiento del estado y el rendimiento de sus clústeres y bases de datos. Amazon Redshift utiliza las métricas de Amazon CloudWatch para supervisar los aspectos físicos del clúster, como la utilización de la CPU, la latencia y el rendimiento. Amazon Redshift también proporciona datos de rendimiento de la carga y la consulta para ayudarlo a supervisar la actividad de la base de datos en el clúster. Para obtener más información acerca de las métricas y la supervisión del rendimiento, consulte Monitoreo del rendimiento de clústeres de Amazon Redshift.

Bases de datos

Cuando aprovisiona un clúster, Amazon Redshift crea una base de datos. Esta es la base de datos que utiliza para cargar datos y ejecutar consultas en sus datos. Puede crear bases de datos adicionales según necesidad mediante la ejecución de un comando SQL. Para obtener más información acerca de la creación de bases de datos adicionales, consulte Paso 1: Creación de una base de datos en la Guía para desarrolladores de bases de datos de Amazon Redshift.

Al aprovisionar un clúster, especifica un usuario administrador que tiene acceso a todas las bases de datos creadas dentro del clúster. Ese usuario administrador es un superusuario, el único con acceso inicial a la base de datos, aunque este usuario puede crear usuarios y superusuarios adicionales. Para obtener más información, consulte Superusuarios y Usuarios en la Guía para desarrolladores de bases de datos de Amazon Redshift.

Amazon Redshift usa grupos de parámetros, como estilo de presentación de la fecha y precisión de un coma flotante, para definir el comportamiento de todas las bases de datos en un clúster. Si no especifica un grupo de parámetros cuando aprovisiona el clúster, Amazon Redshift le asocia un grupo de parámetros predeterminado. Para obtener más información, consulte Grupos de parámetros de Amazon Redshift.

Para obtener más información sobre las bases de datos de Amazon Redshift, consulte la Guía para desarrolladores de bases de datos de Amazon Redshift.