Integraciones sin ETL - Amazon Redshift

Integraciones sin ETL

Este tema incluye documentación de la versión preliminar de las integraciones sin ETL de Aurora PostgreSQL con Amazon Redshift. Tanto la documentación como las características quedan sujetas a cambios. Se recomienda utilizar las integraciones sin ETL de Aurora PostgreSQL solo en entornos de prueba y no de producción. Para conocer los términos y condiciones de las versiones preliminares, consulte Betas y versiones preliminares en Términos de servicio de AWS.

La integración sin ETL es una solución totalmente administrada que permite que los datos transaccionales u operativos estén disponibles en Amazon Redshift prácticamente en tiempo real. Con esta solución, puede configurar una integración desde su fuente a un almacenamiento de datos de Amazon Redshift. No es necesario mantener una canalización de extracción, transformación y carga (ETL). Nosotros nos ocupamos de la ETL mediante la automatización de la creación y administración de la replicación de datos del origen de datos al clúster de Amazon Redshift o al espacio de nombres de Redshift sin servidor. Puede seguir actualizando y consultando los datos de origen y, al mismo tiempo, utilizar Amazon Redshift para cargas de trabajo de análisis, como informes y paneles.

Con la integración sin ETL, dispondrá de datos más actualizados para el análisis, la inteligencia artificial y el aprendizaje automático y la elaboración de informes. Obtendrá información más precisa y oportuna para casos de uso, como paneles en tiempo real, una experiencia de juego optimizada, la supervisión de la calidad de los datos y el análisis del comportamiento de los clientes. Puede hacer predicciones basadas en datos con más confianza, mejorar las experiencias de los clientes y promover información basada en datos en toda la empresa.

Los siguientes orígenes son compatibles actualmente con las integraciones sin ETL:

  • Edición de Aurora compatible con MySQL

  • Edición de Aurora compatible con PostgreSQL (versión preliminar)

  • RDS para MySQL

Para crear una integración sin ETL, especifique un origen de integración y un almacenamiento de datos de Amazon Redshift como destino. La integración replica los datos del origen en el almacenamiento de datos de destino. Los datos estarán disponibles en Amazon Redshift en cuestión de segundos. La integración supervisa el estado de la canalización de datos y se recupera de los problemas cuando es posible. Puede crear integraciones a partir de orígenes del mismo tipo en un único almacenamiento de datos de Amazon Redshift para obtener información integral de varias aplicaciones.

Con los datos de Amazon Redshift, puede utilizar los análisis que proporciona Amazon Redshift. Por ejemplo, el machine learning (ML) integrado, las vistas materializadas, el uso compartido de datos y el acceso directo a varios almacenes y lagos de datos. La integración sin ETL mantiene los recursos de computación aislados de los recursos de datos, de modo que usted utiliza las herramientas más eficientes para procesar datos. Para los ingenieros de datos, la integración sin ETL proporciona acceso a datos urgentes que, de otro modo, pueden verse retrasados por errores intermitentes en canalizaciones de datos complejas. Puede ejecutar consultas analíticas y modelos de ML en los datos transaccionales para obtener información casi en tiempo real sobre eventos y decisiones empresariales urgentes.

Puede crear una suscripción de notificación de eventos de Amazon Redshift para recibir notificaciones cada vez que se produzca un evento para una integración sin ETL determinada. Para ver la lista de notificaciones de eventos relacionadas con la integración, consulte Notificaciones de eventos de integración sin ETL con Amazon EventBridge. La forma más sencilla de crear una suscripción es a través de la consola de Amazon SNS. Para obtener información acerca de cómo crear un tema de Amazon SNS y suscribirse a él, consulte Introducción a Amazon SNS en la Guía para desarrolladores de Amazon Simple Notification Service.

Cuando empiece a utilizar las integraciones sin ETL, tenga en cuenta los siguientes conceptos:

  • Una base de datos de origen es la base de datos en la que se replican los datos en Amazon Redshift.

  • Un almacenamiento de datos de destino es el clúster aprovisionado de Amazon Redshift o el grupo de trabajo de Redshift sin servidor en el que se replican los datos.

  • Una base de datos de destino es la base de datos que se crea a partir de una integración sin ETL en el almacenamiento de datos de destino.

Para obtener información sobre las tablas y las vistas del sistema que puede utilizar para monitorear las integraciones sin ETL, consulte Monitoreo de integraciones sin ETL con vistas del sistema de Amazon Redshift.

Para obtener información sobre los precios de las integraciones sin ETL, consulte la página de precios correspondiente:

Para obtener más información acerca de los orígenes de la integración sin ETL, consulte los temas siguientes: