本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
创建数据来源
目标受众:Amazon QuickSight 作者 |
作为 Amazon 的分析作者 QuickSight,您无需对用于连接数据的基础设施一无所知。您只需设置一次新数据源。
数据源设置完成后,您可以通过 Amazon QuickSight 控制台中的磁贴对其进行访问。可以使用该数据源创建一个或多个数据集。设置数据集后,您还可以从其磁贴访问数据集。通过抽象技术细节,Amazon QuickSight 简化了数据连接。
注意
您无需为打算手动上传的文件存储连接设置。有关文件上传的更多信息,请参阅创建数据集。
在开始向 Amazon QuickSight 添加新的数据源连接配置文件之前,请先收集连接到数据源所需的信息。在某些情况下,您可能会打算从文件复制和粘贴设置。如果是这样,请确保文件不包含格式字符(列表项目符号或编号)或空格字符(空格、制表符)。还要确保文件不包含非文本 “gremlin” 字符,例如非-ASCII、null (ASCII0) 和控制字符。
以下列表包含收集最常用设置的信息:
-
要连接到的数据源。
确保您知道需要连接到哪个源以进行报告。此源可能与存储或处理数据或提供数据访问的源不同。
例如,假设您是新加入一家大公司的分析师。您希望分析订购系统中的数据,该系统使用 Oracle。但是,您不能直接查询在线交易处理 (OLTP) 数据。数据子集被提取并存储在 Amazon S3 上的存储桶中,但您也无权访问该子集。您的新同事解释说,他们使用 AWS Glue 抓取工具来读取和 AWS Lake Formation 访问文件。通过更多研究,您将了解到,您需要使用Amazon Athena查询作为您在亚马逊中的数据源。 QuickSight此处的重点是,选择哪种类型的数据源并不总是非常明显。
-
新数据源磁贴的描述性名称。
每个新数据源连接都需要一个唯一的描述性名称。此名称显示在 Amazon 现有数据源 QuickSight 列表中,该列表位于 “创建数据集” 屏幕的底部。使用一个可轻松地将您的数据源与其他类似数据源区分开的名称。您的新 Amazon QuickSight 数据源配置文件会同时显示数据库软件徽标和您分配的自定义名称。
-
要连接到的服务器或实例的名称。
一个唯一名称或其他标识符,标识您的网络上的数据源的服务器连接器。描述符取决于您要连接的服务器或实例,但通常是以下一个或多个:
-
Hostname
-
IP 地址
-
集群 ID
-
实例 ID
-
Connector
-
基于站点 URL
-
-
要使用的数据集合的名称。
描述符因数据源而异,但通常是以下之一:
-
数据库
-
数据仓库
-
S3 存储桶
-
目录
-
架构
在某些情况下,您可能需要包含一个清单文件或查询。
-
-
您希望 Amazon 使用的 QuickSight 用户名。
每次 Amazon 使用此数据源配置文件(磁贴)进行 QuickSight 连接时,都会使用连接设置中的用户名。在一些情况下,这可能是您的个人登录信息。但是,如果您要与其他人共享此信息,请向系统管理员询问如何创建用于 Amazon QuickSight 连接的证书。
-
要使用的连接的类型。您可以选择公共网络或VPC连接。如果您有多个可用VPC连接,请确定使用哪一个连接来访问您的数据源。
-
某些数据源需要其他设置,例如安全套接字层 (SSL) 或API令牌。
将连接设置另存为数据源配置文件后,可以通过选择数据集磁贴来创建数据集。这些连接作为数据源连接配置文件存储在 Amazon 中 QuickSight。
要查看您现有的连接配置文件,请打开 Amazon QuickSight 起始页面,选择数据集,选择新建数据集,然后滚动到标题FROMEXISTINGDATASOURCES。
有关更多信息,请参阅以下主题: