¿Qué hay de nuevo en Amazon DataZone? - Amazon DataZone

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

¿Qué hay de nuevo en Amazon DataZone?

En esta sección se describen las nuevas funciones y mejoras de Amazon DataZone por fecha de lanzamiento.

2024

Amazon DataZone lanza normas de aplicación de metadatos para las solicitudes de suscripción

Publicado el 20 de noviembre de 2024

Las nuevas normas de aplicación de metadatos para las solicitudes de suscripción en Amazon DataZone refuerzan la gobernanza de los datos al permitir a los propietarios de las unidades de dominio establecer requisitos de metadatos claros para los consumidores de datos, agilizar las solicitudes de acceso y mejorar la gobernanza de los datos. Esta función permite a las organizaciones ajustarse a los estándares de metadatos de la organización, implementar flujos de trabajo personalizados y ofrecer una experiencia de acceso a los datos coherente y regulada. Para obtener más información, consulte Reglas de aplicación de metadatos para las solicitudes de suscripción.

Los planos de AWS servicios DataZone personalizados de Amazon ahora permiten a Amazon disfrutar SageMaker de una nueva experiencia de configuración para los proyectos de Amazon DataZone.

Publicado el 15 de noviembre de 2024

Con el AWS servicio de impresión DataZone personalizado de Amazon, puedes migrar tu SageMaker dominio de Amazon existente a Amazon DataZone. Con esta capacidad, los administradores ahora pueden configurar DataZone proyectos de Amazon importando sus usuarios autorizados, configuraciones de seguridad y políticas existentes desde los SageMaker dominios de Amazon. Para obtener más información, consulte Configurar SageMaker activos (guía del administrador).

Amazon DataZone lanza AWS CloudFormation soporte para planes AWS de servicio personalizados

Publicado el 12 de septiembre de 2024

Amazon DataZone ha añadido AWS CloudFormation compatibilidad con los planos AWS de servicio personalizados. Esta nueva capacidad le permite automatizar AWS CloudFormation la creación de entornos en Amazon DataZone. Con planes personalizados, los administradores ahora pueden DataZone integrar Amazon sin problemas en sus canalizaciones de datos existentes utilizando las IAM funciones existentes para publicar los activos de datos en el DataZone catálogo de Amazon, lo que facilita el intercambio gobernado de esos activos y mejora la gobernanza en toda la infraestructura. Para obtener más información, consulta la referencia de tipos de DataZone recursos de Amazon.

Amazon DataZone lanza unidades de dominio y políticas de autorización

Publicado el 12 de agosto de 2024

Amazon DataZone presenta un conjunto de nuevas capacidades de gobierno de datos denominadas unidades de dominio y políticas de autorización que permiten a los clientes crear una organización a nivel de unidad de negocio o equipo y gestionar las políticas según sus necesidades empresariales. Con la incorporación de unidades de dominio, los usuarios pueden organizar, crear, buscar y encontrar activos de datos y proyectos asociados con unidades o equipos de negocios. Con las políticas de autorización, los usuarios de esas unidades de dominio pueden establecer políticas de acceso para crear proyectos, glosarios y utilizar recursos informáticos en Amazon. DataZone Para obtener más información, consulte Unidades de dominio y políticas de autorización en Amazon DataZone.

Amazon DataZone lanza productos de datos

Publicado el 5 de agosto de 2024

Amazon DataZone presenta productos de datos, que permiten agrupar los activos de datos en paquetes independientes y bien definidos diseñados para casos de uso empresarial específicos. Por ejemplo, un producto de datos de análisis de marketing puede agrupar varios activos de datos, como datos de campañas de marketing, datos de canalización y datos de clientes. Con los productos de datos, los clientes pueden simplificar los procesos de detección y suscripción, alineándolos con los objetivos empresariales y reduciendo la redundancia en la gestión de activos individuales. Para obtener más información, consulte Productos de datos de Amazon DataZone .

Amazon DataZone lanza una funcionalidad de control de acceso detallada

Publicado el 2 de julio de 2024

Amazon DataZone ha introducido un control de acceso detallado, que le proporciona un control detallado de sus activos de datos en el catálogo de datos empresariales DataZone de Amazon en todos los lagos de datos y almacenes de datos. Con la nueva capacidad, los propietarios de los datos pueden restringir el acceso a registros de datos específicos a nivel de fila y de columna, en lugar de proporcionar acceso a todos los activos de datos. Por ejemplo, si sus datos contienen columnas con información confidencial, como información de identificación personal (PII), puede restringir el acceso solo a las columnas necesarias para garantizar que la información confidencial esté protegida y, al mismo tiempo, permitir el acceso a los datos no confidenciales. Del mismo modo, puede controlar el acceso a nivel de fila, lo que permite a los usuarios ver solo los registros que sean relevantes para su función o tarea. Para obtener más información, consulte Control de acceso detallado a los datos en Amazon DataZone

Amazon DataZone lanza la funcionalidad de linaje de datos

Publicado el 27 de junio de 2024

Amazon DataZone lanza una versión preliminar del linaje de datos, lo que ayuda a los clientes a visualizar los eventos de linaje desde sistemas OpenLineage habilitados o a través del movimiento de datos API y rastrearlos desde el origen hasta el consumo. Al utilizar Amazon OpenLineage -compatibleAPIs, los administradores DataZone de dominios y los productores de datos pueden capturar y almacenar eventos de linaje más allá de lo que está disponible en Amazon DataZone, incluidas las transformaciones en Amazon S3, AWS Glue y otros servicios. Además, Amazon DataZone versiona el linaje con cada evento, lo que permite a los usuarios visualizar el linaje en cualquier momento o comparar las transformaciones en el historial de un activo o trabajo. Este historial de linajes proporciona una comprensión más profunda de la evolución de los datos, algo esencial para la resolución de problemas, la auditoría y la validación de la integridad de los activos de datos. Para obtener más información, consulte Linaje de datos en Amazon DataZone

Amazon DataZone lanza planes AWS de servicio personalizados

Publicado el 17 de junio de 2024

Con los planes de AWS servicio personalizados, si tiene AWS recursos existentes, incluidos IAM roles, lagos de datos, mallas de datos, buckets de Amazon S3 y clústeres de Amazon Redshift, ahora puede especificar los permisos para estos recursos existentes mediante su propia IAM función personalizada, de modo que sus DataZone usuarios de Amazon puedan aprovechar la publicación y la suscripción para compartir y administrar estos recursos. Con los planes AWS de servicio personalizados, DataZone los administradores de Amazon pueden configurar los entornos de AWS servicio mediante sus propias funciones personalizadas. Pueden configurar enlaces de acciones para estos entornos de AWS servicios y, por lo tanto, proporcionar acceso federado a cualquiera de sus recursos existentes AWS . También pueden configurar los destinos de suscripción y las fuentes de datos en estos entornos de AWS servicio personalizados. Los administradores pueden configurar entornos de AWS servicios en su propia cuenta de DataZone dominio de Amazon o en cualquier cuenta asociada desde la que deseen publicar, suscribirse, descubrir o gestionar datos. Para obtener más información, consulte Planos DataZone de AWS servicios personalizados de Amazon .

Mejoras en el flujo de creación de orígenes de datos

Publicado el 10 de junio de 2024

Amazon DataZone ha añadido mejoras al flujo de creación de fuentes de datos para simplificar la gestión del acceso para los productores de datos. Con estas actualizaciones, cuando un productor de datos crea una fuente de datos para publicar sus activos de AWS Glue y Amazon Redshift, Amazon DataZone concede permisos de solo lectura a los miembros del proyecto. Al crear una fuente de datos de AWS Glue, Amazon concede DataZone automáticamente permisos de «solo lectura» al IAM rol del entorno utilizado para crear la fuente de datos, lo que permite el acceso a todas las tablas de las bases de datos de AWS Glue asociadas. Del mismo modo, en el caso de las fuentes de datos de Amazon Redshift, Amazon DataZone concede acceso de «solo lectura» a todas las tablas de los esquemas de Amazon Redshift utilizados en la fuente de datos. Para obtener más información, consulte Cree y ejecute una fuente DataZone de datos de Amazon para AWS Glue Data Catalog y Creación y ejecución de una fuente de DataZone datos de Amazon para Amazon Redshift.

Amazon DataZone lanza la integración con Amazon SageMaker

Publicado el 6 de mayo de 2024

Amazon DataZone lanza la integración con Amazon SageMaker para ayudar a los productores de datos y a los consumidores a cambiarse sin problemas SageMaker a Amazon para colaborar en proyectos de aprendizaje automático (ML) y, al mismo tiempo, reforzar la gobernanza del acceso a los datos y los activos de aprendizaje automático. Con la nueva integración integrada entre Amazon DataZone y Amazon SageMaker, los consumidores y productores de datos pueden optimizar la gobernanza del aprendizaje automático en toda la configuración de la infraestructura, colaborar en iniciativas empresariales y gestionar fácilmente los datos y los activos de aprendizaje automático. Para obtener más información, consulte Esquemas integrados de Amazon DataZone y Cuentas asociadas en Amazon DataZone.

Amazon DataZone lanza la integración con el modo de acceso híbrido de AWS Lake Formation

Publicado el 3 de abril de 2024

Amazon DataZone ha introducido una integración con el modo de acceso híbrido de AWS Lake Formation. Esta integración te permite publicar y compartir fácilmente tus tablas de AWS Glue a través de Amazon DataZone, sin necesidad de registrarlas primero en AWS Lake Formation. Para empezar, los administradores habilitan la configuración de registro de ubicación de datos en el DefaultDataLake blueprint de la DataZone consola de Amazon. A continuación, cuando un consumidor de datos se suscribe a una tabla de AWS Glue gestionada mediante IAM permisos, Amazon DataZone primero registra las ubicaciones de Amazon S3 de esta tabla en modo híbrido y, a continuación, concede acceso al consumidor de datos gestionando los permisos de la tabla mediante AWS Lake Formation. Esto garantiza que IAM los permisos disponibles continúen existiendo con los permisos de AWS Lake Formation recién otorgados, sin interrumpir ningún flujo de trabajo existente. Para obtener más información, consulte DataZone Integración de Amazon con el modo híbrido de AWS Lake Formation .

Amazon DataZone lanza la integración con AWS Glue Data Quality

Publicado el 3 de abril de 2024

Amazon DataZone lanza la integración con AWS Glue Data Quality y ofrece APIs integrar métricas de calidad de datos de soluciones de calidad de datos de terceros. La nueva integración te permite publicar automáticamente las puntuaciones de calidad de los datos de AWS Glue en el catálogo de datos DataZone empresariales de Amazon. Amazon se DataZone APIs puede utilizar para asimilar métricas de calidad de fuentes de terceros. Una vez publicados, los consumidores de datos pueden buscar fácilmente activos de datos, ver métricas de calidad pormenorizadas e identificar las comprobaciones y normas fallidas, lo que aumenta la capacidad de toma de decisiones empresariales. Para obtener más información, consulte Calidad de los datos en Amazon DataZone.

Publicación de disponibilidad general de las recomendaciones de IA para las descripciones en Amazon DataZone

Publicado el 27 de marzo de 2024

Amazon DataZone anunció el lanzamiento de disponibilidad general de la nueva capacidad generativa basada en IA para mejorar el descubrimiento, la comprensión y el uso de datos mediante el enriquecimiento del catálogo de datos empresariales. Con un solo clic, los productores de datos pueden generar descripciones y contextos completos para los datos empresariales, destacar las columnas más impactantes e incluir recomendaciones sobre casos de uso analíticos. El lanzamiento añade un soporte APIs que los productores de datos pueden utilizar para generar descripciones de los activos de forma programática. Para obtener más información, consulte Uso del aprendizaje automático y la IA generativa en Amazon DataZone.

Amazon DataZone presenta mejoras en la integración de Amazon Redshift

Publicado el 21 de marzo de 2024

Amazon DataZone ha introducido varias mejoras en su integración con Amazon Redshift, lo que simplifica el proceso de publicación y suscripción a las tablas y vistas de Amazon Redshift. Estas actualizaciones optimizan la experiencia tanto para los productores como para los consumidores de datos, ya que les permiten crear rápidamente entornos de almacenamiento de datos utilizando credenciales preconfiguradas y parámetros de conexión proporcionados por sus DataZone administradores de Amazon. Además, estas mejoras otorgan a los administradores un mayor control sobre quién puede usar los recursos de sus AWS cuentas y clústeres de Amazon Redshift, y con qué propósito.

  • Configuración del esquema: una vez que active el esquema DefaultDataWarehouseBlueprint, podrá controlar qué proyectos pueden utilizar el esquema DefaultDataWarehouseBlueprint de su cuenta para crear perfiles de entorno asignando la administración de los proyectos al esquema habilitado. También puede crear conjuntos de parámetros adicionales DefaultDataWarehouseBlueprint proporcionando parámetros como el clúster, la base de datos y un AWS secreto. También puedes crear AWS secretos desde la DataZone consola de Amazon.

  • Perfil de entorno: al crear un perfil de entorno, puede elegir entre proporcionar sus propios parámetros de Amazon Redshift o utilizar uno de los conjuntos de parámetros de la configuración del esquema. Si eliges usar el conjunto de parámetros creado en la configuración del blueprint, el AWS secreto solo requiere una AmazonDataZoneDomain etiqueta (la AmazonDataZoneProject etiqueta solo es obligatoria si decides proporcionar tus propios conjuntos de parámetros en el perfil del entorno). En el perfil del entorno, puede especificar una lista de proyectos autorizados. Solo los proyectos autorizados pueden usar este perfil de entorno para crear entornos de almacenamiento de datos. También puede especificar qué datos pueden publicar los proyectos autorizados. Actualmente, puede elegir una de las siguientes opciones: 1) Publicar desde cualquier esquema, 2) Publicar desde el esquema de entorno predeterminado, 3) No permitir la publicación.

  • Entorno: los productores o consumidores de datos ahora pueden seleccionar un perfil de entorno para crear entornos, sin necesidad de proporcionar sus propios parámetros de Amazon Redshift, incluidos AWS Secret, clúster, grupo de trabajo y base de datos. Estos parámetros se transfieren al entorno desde el perfil de entorno. Junto con la creación del entorno, Amazon DataZone ahora también crea un esquema predeterminado para el entorno. Los miembros del proyecto tienen acceso de lectura y escritura a este esquema y pueden publicar fácilmente cualquier tabla creada en este esquema en el catálogo al ejecutar el origen de datos predeterminado creado como parte de la creación del entorno. Los parámetros de Amazon Redshift que se utilizan para crear el entorno también se pueden utilizar para crear nuevos orígenes de datos (en lugar de que el productor de datos proporcione sus propios parámetros en la creación del origen de datos).

AWS Cloud Formation Support para Amazon DataZone

Publicado el 18 de enero de 2024

Los usuarios de Amazon ahora DataZone pueden aprovechar AWS CloudFormation para modelar y gestionar eficazmente un conjunto de DataZone recursos de Amazon. Este enfoque facilita un aprovisionamiento coherente de recursos y, al mismo tiempo, permite la administración del ciclo de vida mediante la infraestructura como prácticas de código. Con las plantillas personalizadas, puede definir con precisión los recursos necesarios y sus interdependencias. Para obtener más información, consulta la referencia del tipo DataZone de recurso de Amazon.

Añadir IAM directores directamente como miembros de los proyectos de Amazon DataZone

Publicado el 5 de enero de 2024

Ahora puedes añadir IAM directores como miembros del proyecto, incluso si esos IAM directores aún no han iniciado sesión en Amazon DataZone (requisito previo). Después de que un administrador de dominio o un administrador de TI añada iam:GetUser y iam:GetRole a la función de ejecución del dominio, los propietarios del proyecto pueden añadir IAM directores como miembros simplemente proporcionando el nombre de recurso de Amazon (ARN) de la IAM función o el usuario. IAM El IAM director aún debe tener los IAM permisos necesarios para acceder a Amazon DataZone y estos se pueden configurar en la IAM consola. Para obtener más información, consulte Agregación de miembros a un proyecto.

Compatibilidad con tipos de activos personalizados del portal de datos

Publicado el 5 de enero de 2024

La compatibilidad con activos personalizados permite DataZone a Amazon catalogar los activos a través del portal de datos para datos no estructurados, incluidos paneles, consultas y modelos, lo que facilita la adición de activos personalizados directamente en el portal de datos junto con el soporte disponible API anteriormente. La capacidad de crear, actualizar y publicar activos personalizados en Amazon te permite compartir DataZone, buscar y suscribirte a cualquier tipo de activo y crear un flujo de trabajo empresarial que proporcione el control de esos activos. Para obtener más información, consulte Crea tipos de activos personalizados en Amazon DataZone.

2023

Eliminación de un dominio

Publicado el 27 de diciembre de 2023

Esta es una característica que le permite eliminar los dominios más fácilmente. Ahora puede continuar con la eliminación del dominio incluso si no está vacío (ya que contiene proyectos, entornos, activos, orígenes de datos, etc.). Para obtener más información, consulte Eliminación de dominios en Amazon DataZone.

Modo híbrido

Publicado el 22 de diciembre de 2023

Amazon DataZone ha añadido soporte para el modo híbrido AWS Lake Formation. Con este soporte, si publicas una tabla AWS Glue en Amazon DataZone con su ubicación AWS S3 registrada en Lake Formation en modo híbrido, Amazon DataZone trata esta tabla como un activo gestionado y puede gestionar las subvenciones de suscripción a esta tabla. Antes del lanzamiento de esta función, Amazon DataZone trataba esta tabla como un activo no gestionado, es decir, Amazon no DataZone podía conceder suscripciones a esta tabla. Para obtener más información, consulte Configurar los permisos de Lake Formation para Amazon DataZone.

HIPAAaptitud

Publicado el 14 de diciembre de 2023

Amazon ahora DataZone cumple con la Ley de Portabilidad y Responsabilidad de los Seguros de Salud de los Estados Unidos de 1996 (HIPAA). Para ver la lista de AWS servicios que HIPAA cumplen con las normas, consulta https://aws.amazon.com/compliance/hipaa-eligible-services-reference/.

Recomendaciones de IA para descripciones en Amazon DataZone (versión preliminar)

Publicado el 28 de noviembre de 2023

AWS anuncia la versión preliminar de una nueva capacidad generativa basada en IA en Amazon DataZone para mejorar el descubrimiento, la comprensión y el uso de datos mediante el enriquecimiento del catálogo de datos empresariales. Con un solo clic, los productores de datos pueden generar descripciones y contextos completos para los datos empresariales, destacar las columnas más impactantes e incluir recomendaciones sobre casos de uso analíticos. Con las recomendaciones de IA para las descripciones en Amazon DataZone, los consumidores de datos pueden identificar las tablas y columnas de datos necesarias para el análisis, lo que mejora la capacidad de descubrimiento de los datos y reduce las back-and-forth comunicaciones con los productores de datos. La versión preliminar está disponible en DataZone los dominios de Amazon aprovisionados en las siguientes AWS regiones: EE.UU. Este (Norte de Virginia) y EE.UU. Oeste (Oregón). Para obtener más información, consulte Uso del aprendizaje automático y la IA generativa en Amazon DataZone.

DefaultDataLake mejora del plano

Publicado el 20 de noviembre de 2023

Amazon DataZone ha añadido una mejora al DefaultDataLake plan que te permite controlar mejor quién puede publicar qué datos de tu AWS cuenta. Se incorporaron dos cambios importantes con el lanzamiento de esta característica.

  • En la consola, una vez que habilites el DefaultDataLake blueprint, podrás controlar qué proyectos pueden utilizar el DefaultDataLake blueprint de tu cuenta para crear perfiles de entorno asignando la gestión de proyectos al blueprint activado.

  • El segundo cambio se produce en el portal. Si crea un perfil de entorno mediante el DefaultDataLake esquema, también puede seleccionar los proyectos autorizados que pueden usar el perfil de entorno para crear entornos. De forma predeterminada, todos los proyectos pueden usar el perfil de entorno del lago de datos, pero puede restringir el perfil de entorno a proyectos específicos y también controlar qué datos se pueden publicar utilizando los entornos creados con el perfil.

Para obtener más información, consulte Creación de un perfil de entorno.