Apéndice: Fuentes de datos de AWS compatibles con Microsoft Power BI - Uso de Microsoft Power BI con Nube de AWS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Apéndice: Fuentes de datos de AWS compatibles con Microsoft Power BI

Microsoft proporciona la lista completa de fuentes de datos compatibles (consulte las fuentes de datos de Power BI); sin embargo, las siguientes secciones de cada fuente de datos de AWS proporcionan instrucciones de uso y configuración que pueden resultar útiles para algunos lectores.

Amazon Redshift

Amazon Redshift es un servicio de almacenamiento de datos a escala de petabytes totalmente gestionado en la nube de AWS. Un almacén de datos de Amazon Redshift es una colección de recursos de computación denominados nodos que están organizados en un grupo llamado clúster. Cada clúster ejecuta un motor Amazon Redshift y contiene una o más bases de datos.

Debería considerar la posibilidad de utilizar Amazon Redshift cuando:

  • Está creando o migrando a un almacén de datos en la nube nativo.

  • Es posible que necesite escalar desde unos pocos terabytes hasta cientos de terabytes.

  • Desea permitir a los usuarios de Power BI acceder de forma transparente a los datos del lago de datos almacenado en Amazon S3 y unirlos a las tablas del almacén de datos.

  • Su carga de trabajo de consultas incluye:

    • Consultas que calculan la agregación en tablas grandes (de varios gigabytes y varios terabytes).

    • SQL extremadamente complejo con múltiples uniones y subconsultas.

    • Una combinación de consultas analíticas complejas y consultas sencillas y muy filtradas que se utilizan en los paneles de control.

Cuando utilice Amazon Redshift con Microsoft Power BI, tenga en cuenta los siguientes puntos:

  • Amazon Redshift se admite de forma nativa como fuente de datos de Power BI en los servicios de escritorio y Power BI de Microsoft, y cada uno de ellos admite los modos de importación y consulta directa.

  • Si bien un clúster de Redshift puede lanzarse en una subred pública y configurarse para permitir el acceso desde Internet, la mayoría de los clientes prefieren lanzarlo en una subred privada para aumentar la seguridad. Cuando utilice una subred privada, utilice la puerta de enlace de datos local para conectarse desde el servicio Power BI a Amazon Redshift.

  • El conector Redshift admite la autenticación de Azure AD en Power BI Desktop y en el servicio.

  • Las tablas externas a las que se accede a través de Spectrum no reciben un tratamiento diferente al de las tablas Redshift nativas, y Power BI no tiene forma de diferenciarlas. Al acceder a los datos de tablas externas, asegúrese de que:

    • Las columnas que contienen cadenas de caracteres se catalogan como «VARCHAR» en el catálogo de datos de AWS Glue y no como «STRING»; de lo contrario, Power BI mostrará el siguiente error: Exception: OLE DB or ODBC error: [Expression.Error] We couldn't fold the expression to the data source. Please try a simpler expression..

    • No se admiten las columnas que contienen tipos de datos complejos, como ARRAY. Cuando se utilizan columnas que contienen tipos de datos complejos, Power BI mostrará el siguiente error: Exception: ODBC: ERROR [42703] [Microsoft]Amazon Redshift Error occurred while trying to execute a query

      Si necesita incluirlos en su modelo, puede habilitar (en Amazon Redshift) la serialización de JSON a nivel de usuario o almacenar los tipos de datos complejos en una columna SUPER de una tabla nativa.

Amazon RDS

Amazon RDS facilita la configuración, el funcionamiento y el escalado de una base de datos relacional en la nube. Amazon RDS está disponible en varios tipos de instancias de bases de datos (optimizadas para memoria, rendimiento o E/S) y le proporciona seis motores de bases de datos conocidos entre los que elegir, incluidos Amazon Aurora, PostgreSQL, MySQL, MariaDB, Oracle Database y SQL Server.

Debería considerar el uso de RDS cuando:

  • Está creando un almacén de datos operativos.

  • Está migrando el almacén de datos de SQL Server u Oracle Database a la nube, pero no le interesa la refactorización.

  • Su carga de trabajo de consultas incluye:

    • Consultas que acceden a datos muy filtrados en tablas que se pueden indexar fácilmente.

    • Consultas de análisis en tablas small-to-medium dimensionadas (gigabytes).

    • Una combinación de consultas analíticas de complejidad media y consultas sencillas y muy filtradas que se utilizan en los paneles de control.

Cuando utilice Amazon RDS con Microsoft Power BI, tenga en cuenta los siguientes puntos:

  • Amazon RDS ofrece varios motores de bases de datos, incluidos SQL Server, MariaDB, MySQL, Oracle Database y PostgreSQL. Tenga en cuenta que los motores de bases de datos aparecen en Power BI Desktop y en el servicio Power BI, no en el servicio Amazon RDS.

  • Para Amazon Aurora, utilice el tipo de conexión My SQL o PostgreSQL, según el motor de base de datos que haya seleccionado.

  • Si bien una instancia de Amazon RDS puede lanzarse en una subred pública y configurarse para permitir el acceso desde Internet, la mayoría de los clientes prefieren lanzarla en una subred privada para aumentar la seguridad. Cuando utilice una subred privada, utilice la puerta de enlace de datos local para conectarse desde el servicio Power BI a RDS.

  • Con Amazon RDS, puede implementar varias ediciones de SQL Server (2012, 2014, 2016, 2017 y 2019), incluidas Express, Web, Standard y Enterprise.

Amazon Athena

Amazon Athena es un servicio de consultas interactivo que facilita el análisis de datos en Amazon S3 con SQL estándar. Athena está out-of-the-box integrada con AWS Glue Data Catalog, lo que le permite crear un repositorio de metadatos unificado en varios servicios, rastrear fuentes de datos para descubrir esquemas, rellenar su catálogo de datos con definiciones de tablas y particiones nuevas y modificadas y mantener el control de versiones de los esquemas.

Debe considerar Athena como fuente de datos cuando:

  • Desea consultar su lago de datos directamente.

  • La carga de trabajo de consultas incluye:

    • Consultas que calculan la agregación en tablas grandes (de varios gigabytes y varios terabytes)

    • SQL ad hoc interactivo, con fines exploratorios.

Cuando utilice Amazon Athena con Microsoft Power BI, tenga en cuenta los siguientes puntos:

  • Con la versión de julio de 2021 de Microsoft Power BI, se introdujo un conector certificado por Microsoft para Amazon Athena. Puede usar el conector Microsoft Power BI para Amazon Athena para analizar los datos de Amazon Athena en Microsoft Power BI Desktop. Después de publicar contenido en el servicio Power BI, puede usar la puerta de enlace de datos local de Microsoft para mantener el contenido actualizado mediante actualizaciones programadas o bajo demanda.

  • El conector Microsoft Power BI para Amazon Athena admite los modos de conectividad de datos de importación y consulta directa. Con el modo de importación, las tablas y columnas seleccionadas se importan a Power BI Desktop para su consulta. Con el modo de consulta directa, no se importan ni copian datos en Power BI Desktop y, en su lugar, Power BI Desktop consulta directamente la fuente de datos subyacente.

  • Para obtener más información sobre el conector Power BI de Microsoft para Amazon Athena, consulte Uso del conector Power BI de Amazon Athena.

  • Tenga en cuenta que el conector Microsoft Power BI para Amazon Athena requiere el uso del controlador ODBC de Amazon Athena y una configuración de DSN ODBC válida en el sistema para realizar consultas a Amazon Athena. Para descargar el controlador ODBC más reciente y obtener información de configuración, consulte Conexión a Amazon Athena con ODBC.

  • Para ver un tutorial sobre los pasos de configuración y las prácticas recomendadas al utilizar el conector Microsoft Power BI para Amazon Athena, consulte Creación rápida de cuadros de mando en Microsoft Power BI con Amazon Athena.

OpenSearch Servicio Amazon

Puedes usar SQL para consultar tu Amazon OpenSearch Service, en lugar de usar la consulta de búsqueda basada en JSON (DSL). Las consultas con SQL son útiles si ya está familiarizado con el lenguaje o si desea integrar su dominio con una aplicación que lo utilice, como Microsoft Power BI.

Deberías considerar Amazon OpenSearch Service como fuente de datos cuando:

  • Tiene datos semiestructurados, como archivos de registro o datos de salida JSON, y necesita buscar, analizar o visualizar la información rápidamente.

Cuando utilices Amazon OpenSearch Service con Microsoft Power BI, ten en cuenta los siguientes puntos:

  • La conectividad con Amazon OpenSearch Service requiere el controlador Open Database Connectivity (ODBC), que es un controlador ODBC de solo lectura para Windows y macOS que le permite conectar aplicaciones de inteligencia empresarial (BI) y visualización de datos como Tableau, Microsoft Excel y Power BI al complemento SQL de su clúster. El controlador está disponible en el sitio web OpenSearch Download & Get Started. Para obtener instrucciones de configuración, consulte la sección «Personalización del controlador ODBC» del sitio web del controlador OpenSearch ODBC.

  • Actualmente, solo se admite el modo de importación.

  • La conectividad de Power BI a Amazon OpenSearch Service requiere actualmente el uso de un conector beta. Consulte la documentación de Microsoft Power Query: Referencia del conector: Amazon Opensearch Service (Beta) para empezar.

AWS Lake Formation

Lake Formation le ayuda a recopilar y catalogar datos de bases de datos y almacenamiento de objetos, a trasladar los datos a su nuevo lago de datos de Amazon S3, a limpiar y clasificar los datos mediante algoritmos de aprendizaje automático y a proteger el acceso a sus datos confidenciales. Sus usuarios pueden acceder a un catálogo de datos centralizado que describe los conjuntos de datos disponibles y su uso adecuado. Luego, sus usuarios utilizan estos conjuntos de datos con los servicios de análisis y aprendizaje automático que elijan, como Amazon Redshift, Amazon Athena y (en versión beta) Amazon EMR para Apache Spark. Lake Formation se basa en las capacidades disponibles en AWS Glue.

Debería considerar Lake Formation si necesita un acceso detallado (fila y columna) a su lago de datos en lugar de los controles tradicionales basados en IAM.

Cuando utilice Lake Formation con Microsoft Power BI, tenga en cuenta los siguientes puntos:

  • Para consultar datos del catálogo de datos de Lake Formation con Power BI Desktop o el servicio Power BI, utilice el mismo proceso y la misma configuración que para consultar datos en Athena. Si utiliza el modelo de permisos de Lake Formation, asegúrese de que la configuración DSN de ODBC para Amazon Athena tenga LakeformationEnabled la clave de propiedad establecida en un valor de. true Esto indica al controlador ODBC de Amazon Athena que utilice el servicio Lake Formation para la autorización, en lugar de hacerlo directamente con AWS Security Token Service. Para obtener más información, consulte la documentación sobre cómo conectarse a Amazon Athena con ODBC.

  • La configuración «Usar solo el control de acceso de IAM» habilitada para garantizar la compatibilidad con el comportamiento actual del catálogo de datos proporcionará una compatibilidad total.

  • La actualización de los permisos de datos de AWS Glue al modelo Lake Formation puede introducir incompatibilidades y debe probarse antes de su uso. Las pruebas preliminares indican que se acepta conceder o denegar a nivel de columna, pero los autores no han probado el filtrado a nivel de fila y celda, ya que todavía se encuentra en versión preliminar y está sujeto a cambios.