本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
附录:微软 Power BI 支持的 AWS 数据源
支持的数据源的完整列表由 Microsoft 提供(请参阅 Power BI 数据源
Amazon Redshift
Amazon Redshift 是 AWS 云中一项完全托管的 PB 级数据仓库服务。Amazon Redshift 数据仓库是一个由称作节点的各种计算资源构成的集合,这些节点已整理到名为集群的组中。每个集群运行一个 Amazon Redshift 引擎并包含一个或多个数据库。
在以下情况下,你应该考虑使用亚马逊 Redshift:
-
您正在构建或迁移到原生云数据仓库。
-
您可能需要将容量从几太字节扩展到数百 TB。
-
您希望允许 Power BI 用户透明地访问存储在 Amazon S3 中的数据湖中的数据,并将其与数据仓库中的表连接起来。
-
您的查询工作负载包括:
-
在大型(多 GB 和多 TB)表上计算聚合的查询。
-
具有多个联接和子查询的极其复杂的 SQL。
-
仪表板中混合了复杂的分析查询和经过高度筛选的简单查询。
-
将亚马逊 Redshift 与微软 Power BI 配合使用时,请记住以下几点:
-
微软 Power BI Desktop 和 Power BI 服务原生支持 Amazon Redshift 作为 Power BI 数据源,每种服务都支持导入和直接查询模式。
-
虽然 Redshift 集群可以在公有子网中启动并配置为允许从 Internet 进行访问,但大多数客户更愿意在私有子网中启动它以提高安全性。使用私有子网时,请使用本地数据网关从 Power BI 服务连接到 Amazon Redshift。
-
Redshift 连接器支持 Power BI 桌面和服务中的 Azure AD 身份验证。
-
通过 Spectrum 访问的外部表与原生 Redshift 表的处理方式没有任何区别,而且 Power BI 无法区分它们。访问外部表中的数据时,请确保:
-
包含字符串的列在 AWS Glue 数据目录中被归类为 “VARCHAR”,而不是 “字符串”,否则 Power BI 将抛出以下错误:
Exception: OLE DB or ODBC error: [Expression.Error] We couldn't fold the expression to the data source. Please try a simpler expression..
-
不支持包含复杂数据类型(例如 ARRAY)的列。当使用包含复杂数据类型的列时,Power BI 会抛出以下错误:
Exception: ODBC: ERROR [42703] [Microsoft]Amazon Redshift Error occurred while trying to execute a query
如果您需要将它们包含在模型中,则可以在用户级别启用(在 Amazon Redshift 中)JSON 序列化,也可以将复杂数据类型存储在本机表的 SUPER 列中。
-
Amazon RDS
借助 Amazon RDS,您可以轻松地在云中设置、操作和扩展关系数据库。Amazon RDS 适用于多种数据库实例类型(针对内存、性能或 I/O 进行了优化),并为您提供六种熟悉的数据库引擎可供选择,包括亚马逊 Aurora、PostgreSQL、MySQL、MariaDB、Oracle 数据库和 SQL Server。
在以下情况下,您应该考虑使用 RDS:
-
您正在构建运营数据存储。
-
您正在将 SQL Server 或 Oracle 数据库数据仓库迁移到云端,但对重构不感兴趣。
-
您的查询工作负载包括:
-
访问可轻松编制索引的表上经过高度筛选的数据的查询。
-
对 small-to-medium大小的表(千兆字节)进行分析查询。
-
混合了中等复杂度的分析查询和仪表板中使用的简单、经过高度过滤的查询。
-
将 Amazon RDS 与微软 Power BI 配合使用时,请记住以下几点:
-
Amazon RDS 提供多个数据库引擎,包括 SQL Server、MariaDB、MySQL、Oracle 数据库和 PostgreSQL。请注意,数据库引擎列在 Power BI Desktop 和 Power BI 服务中,而不是 Amazon RDS 服务中。
-
对于 Amazon Aurora,请使用我的 SQL 或 PostgreSQL 连接类型,具体取决于您选择的数据库引擎。
-
虽然 Amazon RDS 实例可以在公有子网中启动并配置为允许从 Internet 进行访问,但大多数客户更愿意在私有子网中启动它以提高安全性。使用私有子网时,请使用本地数据网关从 Power BI 服务连接到 RDS。
-
使用 Amazon RDS,您可以部署多个版本的 SQL Server(2012、2014、2016、2017 和 2019 年),包括 Express、Web、标准版和企业版。
Amazon Athena
Amazon Athena 是一种交互式查询服务,方便使用标准 SQL 分析 Amazon S3 的数据。Athena out-of-the-box 与 AWS Glue Data Catalog 集成,允许您跨各种服务创建统一的元数据存储库,抓取数据源以发现架构,使用新的和修改过的表和分区定义填充数据目录,并维护架构版本控制。
在以下情况下,您应该将 Athena 视为数据源:
-
你想直接查询你的数据湖。
-
您的查询工作负载包括:
-
在大型(多 GB 和多 TB)表上计算聚合的查询
-
交互式临时 SQL,用于探索目的。
-
将亚马逊 Athena 与 Microsoft Power BI 配合使用时,请记住以下几点:
-
随着2021年7月微软Power BI的发布,亚马逊Athena推出了经过微软认证的连接器。你可以使用适用于亚马逊 Athena 的微软 Power BI 连接器在微软 Power BI Desktop 中分析来自亚马逊 Athena 的数据。将内容发布到 Power BI 服务后,你可以使用 Microsoft 本地数据网关,通过按需或计划刷新来保持内容最新。
-
适用于亚马逊 Athena 的 Microsoft Power BI 连接器支持导入和直接查询数据连接模式。在导入模式下,选定的表和列将导入 Power BI Desktop 中进行查询。在直接查询模式下,不会将任何数据导入或复制到 Power BI Desktop 中,而是 Power BI Desktop 直接查询底层数据源。
-
有关适用于亚马逊 Athena 的 Microsoft Power BI 连接器的更多信息,请参阅使用亚马逊 Athena P ower BI 连接器。
-
请注意,适用于亚马逊 Athena 的 Microsoft Power BI 连接器需要在系统上使用亚马逊 Athena ODBC 驱动程序和有效的 ODBC DSN 配置才能查询亚马逊 Athena。要下载最新的 ODBC 驱动程序和配置信息,请参阅使用 ODBC 连接到 Amazon Athena。
-
有关使用适用于亚马逊 Athena 的 Microsoft Power BI 连接器时的配置步骤和最佳实践的教程,请参阅使用亚马逊 Athena 在 Microsoft Power BI 上快速创建
仪表板。
亚马逊 OpenSearch 服务
您可以使用 SQL 来查询您的亚马逊 OpenSearch 服务,而不必使用基于 JSON 的搜索查询 DSL。如果你已经熟悉该语言,或者想将你的域与使用该语言的应用程序(例如 Microsoft Power BI)集成,那么使用 SQL 进行查询非常有用。
在以下情况下,您应该考虑将亚马逊 OpenSearch 服务作为数据源:
-
您有半结构化数据,例如日志文件或 JSON 输出,需要快速搜索、分析或可视化这些信息。
将亚马逊 OpenSearch 服务与 Microsoft Power BI 配合使用时,请记住以下几点:
-
连接亚马逊 OpenSearch 服务需要开放数据库连接 (ODBC) 驱动程序,这是一款适用于 Windows 和 macOS 的只读 ODBC 驱动程序,允许您将商业智能 (BI) 和数据可视化应用程序(如 Tableau 、
M icrosoft Excel 和 Power BI )连接到集群上的 SQL 插件。该驱动程序可在 “ OpenSearch 下载并入门” 网站上找到 。有关配置说明,请参阅 ODBC 驱动程序网站中的 “自定义 ODBC 驱动程序” 部分。OpenSearch -
目前仅支持导入模式。
-
与亚马逊 OpenSearch 服务的 Power BI 连接目前需要使用测试版连接器。要开始使用,请参阅微软 Power Query 文档——连接器参考:亚马逊 Opensearch 服务(测试版)
。
AWS Lake Formation
Lake Formation 可帮助您收集数据库和对象存储中的数据并对其进行分类,将数据移动到新的 Amazon S3
如果您需要对数据湖进行细粒度(行和列)级别的访问权限,而不是传统的基于 IAM 的控件,则应考虑 Lake Formation。
在微软 Power BI 中使用 Lake Formation 时,请记住以下几点:
-
要使用 Power BI Desktop 或 Power BI 服务查询 Lake Formation 数据目录中的数据,请使用与在 Athena 中查询数据相同的流程和配置。如果您使用的是 Lake Formation 权限模型,请确保亚马逊 Athena 的 ODBC DSN 配置的属性密钥
LakeformationEnabled
值设置为。true
这告诉亚马逊 Athena ODBC 驱动程序使用 Lake Formation 服务进行授权,而不是直接使用 AWS Security Token Service Token Service 进行授权。有关更多信息,请参阅使用 ODBC 连接至亚马逊 Athen a 的文档。 -
为与现有数据目录行为兼容而启用的 “仅使用 IAM 访问控制” 设置将提供完全兼容性。
-
将 AWS Glue 数据权限升级到 Lake Formation 模型可能会带来不兼容性,应在使用前进行测试。初步测试表明,列级允许或拒绝,但作者尚未测试行级和单元级筛选,因为这仍处于预览阶段,可能会发生变化。