Amazon QuickSight 内の既存のデータセットを使用したデータセットの作成

Amazon QuickSight でデータセットを作成した後、それをソースとして使用して追加のデータセットを作成できます。これを行うと、親データセットに含まれるすべてのデータ準備 (結合や計算フィールドなど) が保持されます。新しいデータの結合やデータのフィルタリングなど、新しい子データセット内のデータに準備を追加できます。また、子データセットに対して独自のデータ更新スケジュールを設定し、それを使用するダッシュボードと分析を追跡することもできます。

RLS ルールが有効になっているデータセットをソースとして使用して作成された子データセットは、親データセットの RLS ルールを継承します。より大きな親データセットから子データセットを作成するユーザーには、親データセットでアクセスできるデータのみが表示されます。次に、継承された RLS ルールに加えて、新しい子データセットにさらに RLS ルールを追加して、新しいデータセット内のデータにアクセスできるユーザーをさらに管理できます。子データセットは、直接クエリで RLS ルールが有効になっているデータセットからのみ作成できます。

既存の QuickSight データセットからデータセットを作成することには、次のような利点があります。

データセットの一元管理 - データエンジニアは、組織内の複数のチームのニーズに合わせて簡単に拡張できます。これを行うには、組織の主要データモデルを記述するいくつかの汎用データセットを開発し、維持することができます。
データソース管理の削減 - ビジネスアナリスト (BA) は、多くの場合、データベースへのアクセス要求、データベースの認証情報の管理、適切なテーブルの検索、QuickSight データ更新スケジュールの管理に多くの時間と労力を費やします。既存のデータセットから新しいデータセットを構築することは、BA がデータベースからの raw データでゼロから開始する必要がないことを意味します。キュレートされたデータから始めることができます。
事前定義された主要メトリクス：既存のデータセットからデータセットを作成することにより、データエンジニアは、企業の多くの組織にわたって重要なデータ定義を一元的に定義および維持できます。例としては、売上高の伸びと純差益還元などがあります。この機能を使用すると、データエンジニアはこれらの定義に変更を配信することもできます。このアプローチは、ビジネスアナリストが適切なデータの視覚化をより迅速かつ確実に開始できることを意味します。
データをカスタマイズする柔軟性 - 既存のデータセットからデータセットを作成することで、ビジネスアナリストは、自分のビジネスニーズに合わせてデータセットを柔軟にカスタマイズできます。これにより、他のチームのデータが中断される心配を回避できます。

例えば、あなたは 5 人のデータエンジニアで構成されるeコマース中心チームの一員であるとします。自分と自身のチームは、データベース内の販売、注文、キャンセル、返品データにアクセスできます。スキーマを使用して 18 のその他のディメンションテーブルを結合し、QuickSight データセットを作成しました。チームが作成した主要メトリクスは、計算フィールド、注文商品販売 (OPS) です。その定義は次のとおりです。OPS = 製品数量 x 料金。

チームは、8 か国の 10 の異なるチームをまたぐ 100 人以上のビジネスアナリストにサービスを提供しています。これらは、クーポンチーム、アウトバウンドマーケティングチーム、モバイルプラットフォームチーム、レコメンデーションチームです。これらのチームはすべて、各自のビジネスラインを分析するためのベースとして OPS メトリクスを使用します。

何百もの接続されていないデータセットを手動で作成して維持するのではなく、チームはデータセットを再利用して、組織全体のチームに対して複数のレベルのデータセットを作成します。これにより、データ管理が一元化され、各チームがそれぞれのニーズに合わせてデータをカスタマイズできるようになります。同時に、メトリクス定義の更新などの更新がデータに同期され、行レベルおよび列レベルのセキュリティが維持されます。例えば、組織内の個々のチームが集中型データセットを使用できます。その後、チーム固有のデータと組み合わせて、新しいデータセットを作成し、その上に解析を構築できます。

主要 OPS メトリクスの使用に加えて、組織内の他のチームは、作成した一元化されたデータセットの列メタデータを再利用できます。例えば、データエンジニアリングチームは、一元化されたデータセット内で名前、説明、データ型、およびフォルダなどのメタデータを定義できます。それ以降の全てのチームが使用できます。

注記

Amazon QuickSight では、1 つのデータセットから最大 2 つのレベルのデータセットを作成できます。

例えば、親データセットから、子データセットを作成し、孫データセットを合計 3 つのデータセットレベルで作成できます。

既存のデータセットからのデータセットの作成

以下の手順に従って、既存のデータソースを使用してデータセットを作成します。

既存のデータセットからデータセットを作成するには

QuickSight 開始ページの左側のペインから [データセット] を選択します。
[データセット] ページで、新しいデータセットの作成に使用するデータセットを選択します。
対象のデータセットのページが開くので、[Use in analysis] (分析で使用)、[Use in dataset] (データセットで使用) の順に選択します。

データ準備ページが開き、計算フィールド、結合、セキュリティ設定など、親データセットのすべてのものがプリロードされます。
開いたデータ準備ページで、左下の [クエリモード]、データセットが元の、親データセットから変更と更新を取り込む方法を選択します。以下のオプションを選択できます。
- 直接クエリ - デフォルトのクエリモードです。このオプションを選択すると、関連付けられたデータセット、分析、またはダッシュボードを開くと、このデータセットのデータは自動的に更新されます。ただし、次のような制限があります。
  - 親データセットが直接クエリを許可している場合、子データセットで直接クエリモードを使用できます。
  - 結合に複数の親データセットがある場合、すべての親が同じ基になるデータソースの場合にのみ、子データセットの直接クエリモードを選択できます。例えば、同じ Amazon Redshift 接続などです。
  - 直接クエリは、単一の SPICE 親データセットでサポートされています。結合内の複数の SPICE 親データセットではサポートされません。
- SPICE - このオプションを選択する場合は、新しいデータセットの親データセットとの同期用にスケジュールを設定できます。データセットの SPICE 更新スケジュールの作成に関する詳細については、SPICE データの更新を参照してください。
(オプション) 分析用にデータを準備します。データ準備の詳細については、「Amazon QuickSight でのデータの準備」を参照してください。
(オプション) 行レベルまたは列レベルのセキュリティ(RLS/CLS) を設定して、データセットへのアクセスを制限します。RLS の設定の詳細については、「データセットへのアクセスを制限するためのユーザーベースのルールでの行レベルのセキュリティの使用」を参照してください。SPF の設定の詳細については、「データセットへのアクセスを制限するために列レベルのセキュリティを使用する」を参照してください。

注記
RLS/CLS は、子データセットにのみ設定できます。親データセットの RLS/CLS はサポートされていません。
完了したら、[Save & publish] を選択して、変更を保存し、新しい子データセットを公開します。または、[Save & publish] を選択クして、新しい子データセットを公開し、データの視覚化を開始します。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

既存のデータソースから

他のユーザーがデータセットから新しいデータセットを作成しないようにする制限