Paso 1: Crear un clúster de Amazon Redshift de muestra - Amazon Redshift

Paso 1: Crear un clúster de Amazon Redshift de muestra

En este tutorial, seguirá el proceso de creación de un clúster de Amazon Redshift con una base de datos. Luego, deberá cargar un conjunto de datos desde Amazon S3 en las tablas de su base de datos. Puede utilizar este clúster de ejemplo para evaluar el servicio de Amazon Redshift.

Antes de comenzar a configurar el clúster de Amazon Redshift, asegúrese de completar los requisitos previos, como Inscripción en AWS y Determinación de reglas de firewall.

Para cualquier operación que acceda a datos que estén en otro recurso de AWS, el clúster necesita permiso para acceder en su nombre al recurso y a los datos del recurso. Un ejemplo es el uso de un comando de SQL COPY para cargar datos desde Amazon Simple Storage Service (Amazon S3). Estos permisos los concede utilizando AWS Identity and Access Management (IAM). Puede hacerlo a través de un rol de IAM que haya creado y asociado al clúster. Para obtener más información sobre las credenciales y los permisos de acceso, consulte Credenciales y permisos de acceso en la Guía para desarrolladores de bases de datos de Amazon Redshift.

Para crear un clúster de Amazon Redshift
  1. Inicie sesión en la AWS Management Console y abra la consola de Amazon Redshift en https://console.aws.amazon.com/redshiftv2/.

    importante

    Si utiliza las credenciales de usuario de IAM, asegúrese de que el usuario cuente con los permisos necesarios para realizar las operaciones del clúster. Para obtener más información, consulte Seguridad en Amazon Redshift en la Guía de administración de Amazon Redshift.

  2. En la consola de AWS, elija la Región de AWS en la que desee crear el clúster.

  3. En el menú de navegación, elija Clusters (Clústeres) y, a continuación, elija Create cluster (Crear clúster). Se abrirá la página Create cluster (Crear clúster).

  4. En la sección Cluster configuration (Configuración del clúster), especifique valores para Cluster identifier (Identificador del clúster), Node type (Tipo de nodo) y Nodes (Nodos):

    • En Cluster identifier (Identificador del clúster), ingrese examplecluster para este tutorial. Este identificador debe ser único. El identificador debe tener entre 1 y 63 caracteres y utilizar como caracteres válidos letras de la a a la z (solo minúsculas) y el - (guion).

    • Elija uno de los siguientes métodos para ajustar el tamaño del clúster:

      nota

      En el siguiente paso, se da por sentado que la Región de AWS es compatible con tipos de nodo RA3. Para obtener una lista de las Regiones de AWS que admiten los tipos de nodo RA3, consulte Información general sobre los tipos de nodo RA3 en la Guía de administración de Amazon Redshift. Para obtener más información sobre las especificaciones de cada tipo y tamaño de nodo, consulte Detalles acerca de los tipos de nodos.

      • Si no sabe cuál sería el tamaño adecuado para el clúster, elija Help me choose (Ayúdeme a elegir). De esta forma, se abre una calculadora de tamaño que le hace preguntas sobre el tamaño y las características de consulta de los datos que planea almacenar en el almacenamiento de datos.

        Si conoce el tamaño requerido para su clúster (es decir, el tipo de nodo y la cantidad de nodos), elija I’ll choose (Yo elegiré). A continuación, elija el Node type (Tipo de nodo) y la cantidad de Nodes (nodos) para dimensionar el clúster.

        Para este tutorial, seleccione ra3.4xlarge para Tipo de nodo y 2 para Número de nodos.

        Si la opción Configuración de AZ está disponible, elija Single-AZ.

      • Para usar el conjunto de datos de muestra que proporciona Amazon Redshift, en Sample data (Datos de muestra), elija Load sample data (Cargar datos de muestra). Amazon Redshift cargará el conjunto de datos de muestra Tickit en la base de datos dev y el esquema public predeterminados.

  5. En la sección Configuración de la base de datos, especifique un valor para Nombre de usuario del administrador. En Contraseña de administrador, elija entre las siguientes opciones:

    • Generar contraseña: use una contraseña generada por Amazon Redshift.

    • Añadir manualmente una contraseña de administrador: use su propia contraseña.

    • Administrar las credenciales de administrador en AWS Secrets Manager: Amazon Redshift usa AWS Secrets Manager para generar y administrar su contraseña de administrador. El uso de AWS Secrets Manager para generar y administrar el secreto de la contraseña conlleva un gasto. Para obtener información sobre precios de AWS Secrets Manager, consulte Precios de AWS Secrets Manager.

    Para este tutorial, utilice los valores siguientes:

    • Admin user name (Nombre del usuario administrador): ingrese awsuser.

    • Admin user password (Contraseña del usuario administrador): ingrese un valor para la contraseña.

  6. Para este tutorial, cree un rol de IAM y configúrelo como predeterminado para su clúster, como se describe a continuación. Solo se puede configurar un rol de IAM como predeterminado para un clúster.

    1. En Cluster permissions (Permisos de clúster), para Manage IAM roles (Administrar roles de IAM), elija Create IAM role (Crear rol de IAM).

    2. Especifique un bucket de Amazon S3 para que el rol de IAM tenga acceso mediante uno de los siguientes métodos:

      • Elija No additional Amazon S3 bucket (Sin bucket adicional de Amazon S3), para permitir que el rol de IAM creado acceda solo a los depósitos de Amazon S3 denominados redshift.

      • Elija Any Amazon S3 bucket (Cualquier bucket de Amazon S3), para permitir que el rol de IAM creado acceda a todos los buckets de Amazon S3.

      • Elija Specific Amazon S3 buckets (Buckets específicos de Amazon S3), para especificar uno o más buckets de Amazon S3 para el rol de IAM creado al que puede acceder. A continuación, elija uno o más buckets de Amazon S3 de la tabla.

    3. Elija Create IAM role as default (Crear un rol de IAM como predeterminado). Amazon Redshift crea y configura automáticamente el rol de IAM como predeterminado para su clúster.

      Debido a que ha creado su rol de IAM desde la consola, este tiene la política AmazonRedshiftAllCommandsFullAccess adjunta. Esto permite a Amazon Redshift copiar, cargar, consultar y analizar datos de los recursos de Amazon en su cuenta de IAM.

    Para obtener más información acerca de cómo administrar el rol de IAM predeterminado para un clúster, consulte Creación de un rol de IAM como predeterminado para Amazon Redshift en la Guía de administración de Amazon Redshift.

  7. (Opcional) En la sección Additional configurations (Configuraciones adicionales), desactive Use defaults (Utilizar valores predeterminados) para modificar las opciones de configuración Network and security (Redes y seguridad), Database configuration (Configuración de base de datos), Maintenance (Mantenimiento), Monitoring (Supervisión) y Backup (Copia de seguridad).

    En algunos casos, puede crear su clúster con la opción Load sample data (Cargar datos de muestra) y quizá desee activar el enrutamiento mejorado de Amazon VPC. De ser así, el clúster de su nube virtual privada requiere acceso al punto de conexión de Amazon S3 para que se carguen los datos.

    Para que el clúster sea accesible públicamente, puede optar por una de estas dos opciones. Puede configurar una dirección de traducción de direcciones de red (NAT) en su VPC para que el clúster acceda a Internet. O bien, puede configurar un punto de conexión de la VPC de Amazon S3 en la VPC. Para obtener más información acerca del enrutamiento mejorado de Amazon VPC, consulte Enrutamiento mejorado de Amazon VPC en la Guía de administración de Amazon Redshift.

  8. Elija Create cluster. Espere a que se cree el clúster con el estado Available que aparece en la página Clústeres.