Crear un conjunto de datos a partir de un conjunto de datos existente

Crear un conjunto de datos a partir de un conjunto de datos existente en Amazon QuickSight

Después de crear un conjunto de datos en Amazon QuickSight, puede crear conjuntos de datos adicionales utilizándolos como fuente. Al hacerlo, se conserva cualquier preparación de datos que contenga el conjunto de datos principal, como las uniones o los campos calculados. Puede añadir una preparación adicional a los datos de los nuevos conjuntos de datos secundarios, como unir nuevos datos y filtrarlos. También puede configurar su propia programación de actualización de datos para el conjunto de datos secundario y realizar un seguimiento de los paneles y análisis que lo utilizan.

Los conjuntos de datos secundarios que se crean con un conjunto de datos con reglas de RLS activas como origen heredan las reglas de RLS del conjunto de datos principal. Los usuarios que crean un conjunto de datos secundario a partir de un conjunto de datos principal más grande solo pueden ver los datos a los que tienen acceso en el conjunto de datos principal. A continuación, puede añadir más reglas de RLS al nuevo conjunto de datos secundario, además de las reglas de RLS heredadas, para administrar mejor quién puede acceder a los datos que se encuentran en el nuevo conjunto de datos. Solo puede crear conjuntos de datos secundarios a partir de conjuntos de datos con reglas de RLS activas en Direct Query.

La creación de conjuntos de datos a partir de QuickSight conjuntos de datos existentes tiene las siguientes ventajas:

Administración central de los conjuntos de datos: los ingenieros de datos pueden escalar fácilmente según las necesidades de varios equipos de su organización. Para ello, pueden desarrollar y mantener algunos conjuntos de datos de uso general que describan los principales modelos de datos de la organización.
Reducción de la administración de las fuentes de datos: los analistas de negocios (BAs) suelen dedicar mucho tiempo y esfuerzo a solicitar acceso a las bases de datos, gestionar las credenciales de las bases de datos, encontrar las tablas adecuadas y gestionar QuickSight los programas de actualización de los datos. Crear nuevos conjuntos de datos a partir de conjuntos de datos existentes significa que BAs no es necesario empezar desde cero con datos sin procesar de las bases de datos. Pueden empezar con datos seleccionados.
Métricas clave predefinidas: al crear conjuntos de datos a partir de conjuntos de datos existentes, los ingenieros de datos pueden definir y mantener de forma centralizada las definiciones de datos críticos en las numerosas organizaciones de su empresa. Algunos ejemplos podrían ser el crecimiento de las ventas y la tasa de retorno marginal neto. Con esta característica, los ingenieros de datos también pueden distribuir los cambios en esas definiciones. Este enfoque significa que sus analistas empresariales pueden empezar a visualizar los datos correctos de forma más rápida y fiable.
Flexibilidad para personalizar los datos: al crear conjuntos de datos a partir de conjuntos de datos existentes, los analistas empresariales tienen más flexibilidad para personalizar los conjuntos de datos según sus propias necesidades empresariales. No tienen que preocuparse por interrumpir los datos de otros equipos.

Por ejemplo, supongamos que forma parte de un equipo central de comercio electrónico formado por cinco ingenieros de datos. Usted y su equipo tendrán acceso a los datos de ventas, pedidos, cancelaciones y devoluciones en una base de datos. Ha creado un QuickSight conjunto de datos uniendo otras 18 tablas de dimensiones mediante un esquema. Una métrica clave que ha creado su equipo es el campo calculado de ventas de productos pedidos (OPS). Su definición es la siguiente: OPS = cantidad de producto x precio.

Su equipo trabaja con más de 100 analistas empresariales repartidos en 10 equipos diferentes en ocho países. Estos son el equipo de Cupones, el equipo de Marketing de salida, el equipo de Plataformas móviles y el equipo de Recomendaciones. Todos estos equipos utilizan la métrica OPS como base para analizar su propia línea de negocio.

En lugar de crear y mantener manualmente cientos de conjuntos de datos desconectados, su equipo reutiliza los conjuntos de datos para crear varios niveles de conjuntos de datos para los equipos de toda la organización. Esto centraliza la administración de datos y permite a cada equipo personalizar los datos según sus propias necesidades. Al mismo tiempo, se sincronizan las actualizaciones de los datos, así como las actualizaciones de las definiciones de las métricas, y se mantiene la seguridad en el nivel de fila y columna. Por ejemplo, los equipos individuales de su organización pueden usar los conjuntos de datos centralizados. A continuación, pueden combinarlos con los datos específicos de su equipo para crear nuevos conjuntos de datos y elaborar análisis a partir de ellos.

Además de utilizar la métrica clave OPS, otros equipos de su organización pueden reutilizar los metadatos de las columnas de los conjuntos de datos centralizados que creó. Por ejemplo, el equipo de Ingeniería de datos puede definir los metadatos, como el nombre, la descripción, el tipo de datos y las carpetas, en un conjunto de datos centralizado. Todos los equipos subsiguientes podrán utilizarlos.

nota

Amazon QuickSight admite la creación de hasta dos niveles adicionales de conjuntos de datos a partir de un único conjunto de datos.

Por ejemplo, a partir de un conjunto de datos principal, puede crear un conjunto de datos secundario y, a continuación, un conjunto de datos secundario del secundario para un total de tres niveles de conjunto de datos.

Crear un conjunto de datos a partir de un conjunto de datos existente

Utilice el siguiente procedimiento para crear un conjunto de datos desde un conjunto de datos existente.

Creación de un conjunto de datos a partir de un conjunto de datos existente

En la página de QuickSight inicio, selecciona Conjuntos de datos en el panel de la izquierda.
En la página Conjuntos de datos, elija el conjunto de datos que desea usar para crear un nuevo conjunto de datos.
En la página que se abre para ese conjunto de datos, seleccione el menú desplegable de Uso en el análisis y, a continuación, seleccione Uso en el conjunto de datos.

La página de preparación de datos se abre y carga previamente todo el conjunto de datos principal, incluidos los campos calculados, las uniones y la configuración de seguridad.
En la página de preparación de datos que se abre, en el Modo de consulta, en la parte inferior izquierda, elija cómo desea que el conjunto de datos incorpore los cambios y actualizaciones del conjunto de datos principal original. Puede elegir las opciones siguientes:
- Consulta directa: este es el modo de consulta predeterminado. Si elige esta opción, los datos de este conjunto de datos se actualizan automáticamente al abrir un conjunto de datos, un análisis o un panel asociado. Sin embargo, se aplican las siguientes limitaciones:
  - Si el conjunto de datos principal permite realizar consultas directas, puede usar el modo de consulta directa en el conjunto de datos secundario.
  - Si tiene varios conjuntos de datos principales en una combinación, puede elegir el modo de consulta directa para el conjunto de datos secundario solo si todos los conjuntos de datos principales provienen del mismo origen de datos subyacente. Por ejemplo, la misma conexión de Amazon Redshift.
  - Se admite la consulta directa para una sola SPICE conjunto de datos principal. No es compatible con varios SPICE conjuntos de datos principales en una unión.
- SPICE: Si elige esta opción, puede configurar una programación para que su nuevo conjunto de datos se sincronice con el conjunto de datos principal. Para obtener más información sobre la creación SPICE programas de actualización de conjuntos de datos, consulteRefrescante SPICE data.
(Opcional) Prepare los datos para el análisis. Para obtener más información sobre cómo preparar datos, consulte Preparación de datos en Amazon QuickSight.
(Opcional) Configure la seguridad en el nivel de fila o columna (RLS/CLS) para restringir el acceso al conjunto de datos. Para obtener más información sobre la configuración de RLS, consulte Uso de la seguridad a nivel de fila con reglas basadas en usuarios para restringir el acceso a un conjunto de datos. Para obtener más información sobre la configuración de CLS, consulte Uso de la seguridad en el nivel de columna para restringir el acceso a un conjunto de datos.

nota
No se admite RLS/CLS on child datasets only. RLS/CLS la configuración en conjuntos de datos principales.
Cuando haya terminado, elija Guardar y publicar para guardar los cambios y publicar el nuevo conjunto de datos secundario. O elija Publicar y visualizar para publicar el nuevo conjunto de datos secundario y empezar a visualizar sus datos.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Desde orígenes de datos existentes

Impedir que otros usuarios creen nuevos conjuntos de datos a partir de su conjunto de datos