¿Qué hay de nuevo en Amazon DataZone? - Amazon DataZone

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

¿Qué hay de nuevo en Amazon DataZone?

En esta sección se describen las nuevas funciones y mejoras de Amazon DataZone por fecha de lanzamiento.

2024

Amazon DataZone lanza unidades de dominio y políticas de autorización

Publicado el 8 de diciembre de 2024

Amazon DataZone presenta un conjunto de nuevas capacidades de gobierno de datos denominadas unidades de dominio y políticas de autorización que permiten a los clientes crear una organización a nivel de unidad de negocio o equipo y gestionar las políticas según sus necesidades empresariales. Con la adición de unidades de dominio, los usuarios pueden organizar, crear, buscar y encontrar activos de datos y proyectos asociados a unidades o equipos de negocios. Con las políticas de autorización, los usuarios de esas unidades de dominio pueden establecer políticas de acceso para crear proyectos, glosarios y utilizar recursos informáticos en Amazon. DataZone Para obtener más información, consulte Unidades de dominio y políticas de autorización en Amazon DataZone.

Amazon DataZone lanza productos de datos

Publicado el 05/08/2024

Amazon DataZone presenta productos de datos, que permiten agrupar los activos de datos en paquetes independientes y bien definidos diseñados para casos de uso empresarial específicos. Por ejemplo, un producto de datos de análisis de marketing puede agrupar varios activos de datos, como datos de campañas de marketing, datos de proyectos y datos de clientes. Con los productos de datos, los clientes pueden simplificar los procesos de descubrimiento y suscripción, alineándolos con los objetivos empresariales y reduciendo la redundancia en la gestión de los activos individuales. Para obtener más información, consulte Productos de DataZone datos de Amazon .

Amazon DataZone lanza una funcionalidad de control de acceso detallada

Lanzado el 07/02/2024

Amazon DataZone ha introducido un control de acceso detallado, que le proporciona un control detallado de sus activos de datos en el catálogo de datos empresariales DataZone de Amazon en todos los lagos de datos y almacenes de datos. Con esta nueva función, los propietarios de los datos ahora pueden restringir el acceso a registros de datos específicos a nivel de fila y columna, en lugar de conceder el acceso a todos los activos de datos. Por ejemplo, si sus datos contienen columnas con información confidencial, como información de identificación personal (PII), puede restringir el acceso solo a las columnas necesarias para garantizar que la información confidencial esté protegida y, al mismo tiempo, permitir el acceso a los datos no confidenciales. Del mismo modo, puede controlar el acceso a nivel de fila, lo que permite a los usuarios ver solo los registros que son relevantes para su función o tarea. Para obtener más información, consulte Control de acceso detallado a los datos en Amazon DataZone

Amazon DataZone lanza la funcionalidad de linaje de datos

Lanzado el 27/06/2024

Amazon DataZone lanza una versión preliminar del linaje de datos, lo que ayuda a los clientes a visualizar los eventos de linaje desde sistemas OpenLineage habilitados o a través del movimiento de datos API y rastrearlos desde el origen hasta el consumo. Al utilizar Amazon OpenLineage -compatibleAPIs, los administradores DataZone de dominios y los productores de datos pueden capturar y almacenar eventos de linaje más allá de lo que está disponible en Amazon DataZone, incluidas las transformaciones en Amazon S3, AWS Glue y otros servicios. Además, Amazon DataZone versiona el linaje con cada evento, lo que permite a los usuarios visualizar el linaje en cualquier momento o comparar las transformaciones en el historial de un activo o trabajo. Este linaje histórico proporciona una comprensión más profunda de la evolución de los datos, algo esencial para la resolución de problemas, la auditoría y la validación de la integridad de los activos de datos. Para obtener más información, consulte Linaje de datos en Amazon DataZone (versión preliminar)

Amazon DataZone lanza custom AWS planos de servicio

Publicado el 17/06/2024

¡Con personalización AWS planos de servicio, si los tiene AWS recursos que incluyen IAM funciones, lagos de datos, mallas de datos, buckets de Amazon S3 y clústeres de Amazon Redshift, ahora puede especificar los permisos para estos recursos existentes mediante su propia función IAM personalizada, de modo que sus usuarios de DataZone Amazon puedan aprovechar la publicación y la suscripción para compartir y gestionar estos recursos. Con opciones personalizadas AWS planos de servicio que DataZone los administradores de Amazon pueden configurar AWS entornos de servicio que utilizan sus propias funciones personalizadas. Pueden configurar enlaces de acciones para estos AWS entornos de servicio y, por lo tanto, proporcionar acceso federado a cualquiera de sus entornos existentes AWS recursos. También pueden configurar los objetivos de suscripción y las fuentes de datos en estos personalizados AWS entornos de servicio. Los administradores pueden configurar AWS entornos de servicio en su propia cuenta de DataZone dominio de Amazon o en cualquier cuenta asociada desde la que deseen publicar, suscribirse, descubrir o gestionar datos. Para obtener más información, consulte Planos DataZone de AWS servicios personalizados de Amazon .

Mejoras en el flujo de creación de fuentes de datos

Lanzado el 10/06/2024

Amazon DataZone ha añadido mejoras al flujo de creación de fuentes de datos para simplificar la gestión del acceso para los productores de datos. Con estas actualizaciones, cuando un productor de datos crea una fuente de datos para publicar su AWS Amazon, activos de Glue y Amazon Redshift, DataZone concede permisos de solo lectura a los miembros del proyecto. Al crear un AWS Glue data source, Amazon concede DataZone automáticamente permisos de «solo lectura» a la IAM función del entorno utilizado para crear la fuente de datos, lo que permite el acceso a todas las tablas de la fuente de datos asociada AWS Glue bases de datos. Del mismo modo, en el caso de las fuentes de datos de Amazon Redshift, Amazon DataZone concede acceso de «solo lectura» a todas las tablas de los esquemas de Amazon Redshift utilizados en la fuente de datos. Para obtener más información, consulte Cree y ejecute una fuente DataZone de datos de Amazon para AWS Glue Data Catalog y Creación y ejecución de una fuente de DataZone datos de Amazon para Amazon Redshift.

Amazon DataZone lanza la integración con Amazon SageMaker

Publicado el 05/06/2024

Amazon DataZone lanza la integración con Amazon SageMaker para ayudar a los productores de datos y a los consumidores a cambiarse sin problemas SageMaker a Amazon para colaborar en proyectos de aprendizaje automático (ML) y, al mismo tiempo, reforzar la gobernanza del acceso a los datos y los activos de aprendizaje automático. Con la nueva integración integrada entre Amazon DataZone y Amazon SageMaker, los consumidores y productores de datos pueden optimizar la gobernanza del aprendizaje automático en toda la configuración de la infraestructura, colaborar en iniciativas empresariales y gestionar fácilmente los datos y los activos de aprendizaje automático. Para obtener más información, consulte Planos DataZone integrados de Amazon y Cuentas asociadas en Amazon DataZone.

Amazon DataZone lanza la integración con AWS Modo de acceso híbrido de Lake Formation

Publicado el 4 de marzo de 2024

Amazon DataZone ha introducido una integración con AWS Modo de acceso híbrido de Lake Formation. Esta integración le permite publicar y compartir fácilmente sus AWS Glue mesas a través de Amazon DataZone, sin necesidad de registrarlas en AWS Lake Formation primero. Para empezar, los administradores habilitan la configuración de registro de ubicación de datos en el DefaultDataLake blueprint de la DataZone consola de Amazon. Luego, cuando un consumidor de datos se suscribe a un AWS Glue table gestionada mediante IAM permisos, Amazon DataZone primero registra las ubicaciones de Amazon S3 de esta tabla en modo híbrido y, a continuación, concede acceso al consumidor de datos gestionando los permisos de la tabla mediante AWS Lake Formation. Esto garantiza que IAM los permisos sobre la mesa sigan existiendo con los recién concedidos AWS Permisos de Lake Formation, sin interrumpir ningún flujo de trabajo existente. Para obtener más información, consulte DataZone Integración de Amazon con el modo híbrido de AWS Lake Formation .

Amazon DataZone lanza la integración con AWS Calidad de datos de Glue

Publicado el 4 de marzo de 2024

Amazon DataZone lanza la integración con AWS Glue Data Quality y ofrece APIs integrar métricas de calidad de datos de soluciones de calidad de datos de terceros. La nueva integración le permite publicar automáticamente AWS Glue incluye las puntuaciones de calidad de los datos en el catálogo DataZone de datos empresariales de Amazon. Amazon se DataZone APIs puede utilizar para asimilar métricas de calidad de fuentes de terceros. Una vez publicados, los consumidores de datos pueden buscar fácilmente activos de datos, ver métricas de calidad pormenorizadas e identificar las comprobaciones y normas fallidas, lo que facilita la toma de decisiones empresariales. Para obtener más información, consulte Calidad de los datos en Amazon DataZone.

Publicación de disponibilidad general de las recomendaciones de IA para las descripciones en Amazon DataZone

Publicada el 27/03/2024

Amazon DataZone anunció el lanzamiento de disponibilidad general de la nueva capacidad generativa basada en IA para mejorar el descubrimiento, la comprensión y el uso de datos mediante el enriquecimiento del catálogo de datos empresariales. Con un solo clic, los productores de datos pueden generar descripciones y contextos completos de los datos empresariales, destacar las columnas más impactantes e incluir recomendaciones sobre casos de uso analíticos. El lanzamiento añade un soporte APIs que los productores de datos pueden utilizar para generar descripciones de los activos de forma programática. Para obtener más información, consulte Uso del aprendizaje automático y la IA generativa en Amazon DataZone.

Amazon DataZone presenta mejoras en la integración de Amazon Redshift

Publicado el 21 de marzo de 2024

Amazon DataZone ha introducido varias mejoras en su integración con Amazon Redshift, lo que simplifica el proceso de publicación y suscripción a las tablas y vistas de Amazon Redshift. Estas actualizaciones optimizan la experiencia tanto para los productores como para los consumidores de datos, ya que les permiten crear rápidamente entornos de almacenamiento de datos utilizando credenciales preconfiguradas y parámetros de conexión proporcionados por sus DataZone administradores de Amazon. Además, estas mejoras otorgan a los administradores un mayor control sobre quién puede usar los recursos de sus AWS cuentas y clústeres de Amazon Redshift, y con qué propósito.

  • Configuración del blueprint: una vez que active el DefaultDataWarehouseBlueprint blueprint, podrá controlar qué proyectos pueden utilizar el DefaultDataWarehouseBlueprint blueprint de su cuenta para crear perfiles de entorno asignando la gestión de los proyectos al blueprint habilitado. También puede crear conjuntos de parámetros adicionales DefaultDataWarehouseBlueprint proporcionando parámetros como un clúster, una base de datos y un AWS Secreto. También puedes crear AWS Secretos desde dentro de la DataZone consola de Amazon.

  • Perfil de entorno: al crear un perfil de entorno, puede elegir entre proporcionar sus propios parámetros de Amazon Redshift o utilizar uno de los conjuntos de parámetros de la configuración del blueprint. Si decide utilizar el conjunto de parámetros creado en la configuración del blueprint, AWS secret solo requiere una AmazonDataZoneDomain etiqueta (la AmazonDataZoneProject etiqueta solo es necesaria si decide proporcionar sus propios conjuntos de parámetros en el perfil del entorno). En el perfil del entorno, puede especificar una lista de proyectos autorizados. Solo los proyectos autorizados pueden usar este perfil de entorno para crear entornos de almacén de datos. También puede especificar qué datos pueden publicar los proyectos autorizados. Actualmente, puede elegir una de las siguientes opciones: 1) Publicar desde cualquier esquema, 2) Publicar desde el esquema de entorno predeterminado, 3) No permitir la publicación.

  • Entorno: los productores o consumidores de datos ahora pueden seleccionar un perfil de entorno para crear entornos, sin necesidad de proporcionar sus propios parámetros de Amazon Redshift, entre los que se incluyen AWS Secreto, clúster, grupo de trabajo y base de datos. Estos parámetros se transfieren al entorno desde el perfil del entorno. Junto con la creación del entorno, Amazon DataZone ahora también crea un esquema predeterminado para el entorno. Los miembros del proyecto tienen acceso de lectura y escritura a este esquema y pueden publicar fácilmente cualquier tabla creada en este esquema en el catálogo ejecutando la fuente de datos predeterminada creada como parte de la creación del entorno. Los parámetros de Amazon Redshift que se utilizan para crear el entorno también se pueden utilizar para crear nuevas fuentes de datos (en lugar de que el productor de datos proporcione sus propios parámetros en la creación de la fuente de datos).

AWS Cloud Formation Support para Amazon DataZone

Lanzado el 18/01/2024

Los usuarios de Amazon ahora DataZone pueden aprovechar AWS CloudFormation para modelar y gestionar de forma eficaz un conjunto de DataZone recursos de Amazon. Este enfoque facilita el aprovisionamiento coherente de los recursos y, al mismo tiempo, permite la gestión del ciclo de vida mediante la infraestructura como prácticas de código. Con las plantillas personalizadas, puede definir con precisión los recursos necesarios y sus interdependencias. Para obtener más información, consulta la referencia del tipo DataZone de recurso de Amazon.

Añadir IAM directores directamente como miembros de los proyectos de Amazon DataZone

Lanzado el 05/01/2024

Ahora puedes añadir IAM directores como miembros del proyecto, incluso si esos IAM directores aún no han iniciado sesión en Amazon DataZone (requisito previo). Después de que un administrador de dominio o un administrador de TI añada iam:GetUser y iam:GetRole a la función de ejecución del dominio, los propietarios del proyecto pueden añadir IAM directores como miembros simplemente proporcionando el nombre de recurso de Amazon (ARN) de la IAM función o el usuario. IAM El IAM director aún debe tener los IAM permisos necesarios para acceder a Amazon DataZone y estos se pueden configurar en la IAM consola. Para obtener más información, consulte Agrega miembros a un proyecto.

Support para tipos de activos personalizados desde el portal de datos

Lanzado el 05/01/2024

La compatibilidad con activos personalizados permite DataZone a Amazon catalogar los activos a través del portal de datos para datos no estructurados, incluidos paneles, consultas y modelos, lo que facilita la adición de activos personalizados directamente en el portal de datos junto con el soporte disponible API anteriormente. La capacidad de crear, actualizar y publicar activos personalizados en Amazon te permite compartir DataZone, buscar y suscribirte a cualquier tipo de activo y crear un flujo de trabajo empresarial que proporcione el control de esos activos. Para obtener más información, consulte Crea tipos de activos personalizados en Amazon DataZone.

2023

Eliminar dominio

Publicado el 27 de diciembre de 2023

Esta es una función que le permite eliminar sus dominios más fácilmente. Ahora puede continuar con la eliminación del dominio incluso si no está vacío (ya que contiene proyectos, entornos, activos, fuentes de datos, etc.). Para obtener más información, consulte Eliminar DataZone dominios de Amazon.

Modo híbrido

Lanzado el 22/12/2023

Amazon DataZone ha añadido soporte para AWS Modo híbrido Lake Formation. Con este apoyo, si publicas un AWS Glue mesa a Amazon DataZone con su AWS Ubicación S3 registrada en Lake Formation en modo híbrido, Amazon DataZone trata esta tabla como un activo gestionado y puede gestionar las suscripciones concedidas a esta tabla. Antes del lanzamiento de esta función, Amazon DataZone trataba esta tabla como un activo no gestionado, es decir, Amazon no DataZone podía conceder suscripciones a esta tabla. Para obtener más información, consulte Configurar los permisos de Lake Formation para Amazon DataZone.

HIPAAaptitud

Publicado el 14 de diciembre de 2023

Amazon ahora DataZone cumple con la Ley de Portabilidad y Responsabilidad de los Seguros de Salud de los Estados Unidos de 1996 (HIPAA). Para ver la lista de AWS servicios que HIPAA cumplen con las normas, consulte https://aws.amazon.com/compliance/hipaa-eligible-services-reference/.

Recomendaciones de IA para descripciones en Amazon DataZone (versión preliminar)

Publicado el 28 de noviembre de 2023

AWS anuncia la versión preliminar de una nueva capacidad generativa basada en IA en Amazon DataZone para mejorar el descubrimiento, la comprensión y el uso de datos mediante el enriquecimiento del catálogo de datos empresariales. Con un solo clic, los productores de datos pueden generar descripciones y contextos completos de los datos empresariales, destacar columnas impactantes e incluir recomendaciones sobre casos de uso analíticos. Con las recomendaciones de IA para las descripciones en Amazon DataZone, los consumidores de datos pueden identificar las tablas y columnas de datos necesarias para el análisis, lo que mejora la capacidad de descubrimiento de los datos y reduce las back-and-forth comunicaciones con los productores de datos. La vista previa está disponible en los DataZone dominios de Amazon aprovisionados de la siguiente manera AWS Regiones: EE.UU. Este (Norte de Virginia), EE.UU. Oeste (Oregón). Para obtener más información, consulte Uso del aprendizaje automático y la IA generativa en Amazon DataZone.

DefaultDataLake mejora del plano

Publicado el 20/11/2023

Amazon DataZone ha añadido una mejora al DefaultDataLake plan que te proporciona un mejor control sobre quién puede publicar qué datos de tu AWS account. Hay dos cambios clave que se introdujeron con el lanzamiento de esta función.

  • En la consola, una vez que habilites el DefaultDataLake blueprint, podrás controlar qué proyectos pueden utilizar el DefaultDataLake blueprint de tu cuenta para crear perfiles de entorno asignando la gestión de proyectos al blueprint activado.

  • El segundo cambio se produce en el portal. Si crea un perfil de entorno mediante el DefaultDataLake esquema, también puede seleccionar los proyectos autorizados que pueden usar el perfil de entorno para crear entornos. De forma predeterminada, todos los proyectos pueden usar el perfil de entorno del lago de datos, pero puede restringir el perfil de entorno a proyectos específicos y también controlar qué datos se pueden publicar utilizando los entornos creados con el perfil.

Para obtener más información, consulte Cree un perfil de entorno.