Amazon の既存のデータセットを使用したデータセットの作成 QuickSight - Amazon QuickSight

重要:Amazon QuickSight 分析ワークスペースを再設計しました。コンソールの新しい外観を反映していないスクリーンショットや手順のテキストが表示される場合があります。 QuickSight 現在、スクリーンショットと手順のテキストを更新しています。

機能または項目を検索するには、クイック検索バーを使用します。

QuickSightの新しい外観について詳しくは、「Amazon での新しい分析機能の紹介」を参照してください QuickSight。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon の既存のデータセットを使用したデータセットの作成 QuickSight

Amazon でデータセットを作成したら QuickSight、それをソースとして使用して追加のデータセットを作成できます。これを行うと、親データセットに含まれるすべてのデータ準備 (結合や計算フィールドなど) が保持されます。新しいデータの結合やデータのフィルタリングなど、新しい子データセット内のデータに準備を追加できます。また、子データセットに対して独自のデータ更新スケジュールを設定し、それを使用するダッシュボードと分析を追跡することもできます。

RLS ルールが有効になっているデータセットをソースとして使用して作成された子データセットは、親データセットの RLS ルールを継承します。より大きな親データセットから子データセットを作成するユーザーには、親データセットでアクセスできるデータのみが表示されます。次に、継承された RLS ルールに加えて、新しい子データセットにさらに RLS ルールを追加して、新しいデータセット内のデータにアクセスできるユーザーをさらに管理できます。子データセットは、直接クエリで RLS ルールが有効になっているデータセットからのみ作成できます。

既存のデータセットから QuickSight データセットを作成すると、次の利点があります。

  • データセットの一元管理 - データエンジニアは、組織内の複数のチームのニーズに合わせて簡単に拡張できます。これを行うには、組織の主要データモデルを記述するいくつかの汎用データセットを開発し、維持することができます。

  • データソース管理の削減 – ビジネスアナリスト (BAsは、データベースへのアクセスのリクエスト、データベース認証情報の管理、適切なテーブルの検索、 QuickSight データ更新スケジュールの管理に多くの時間と労力を費やすことがよくあります。既存のデータセットから新しいデータセットを構築することは、BA がデータベースからの raw データでゼロから開始する必要がないことを意味します。キュレートされたデータから始めることができます。

  • 事前定義された主要メトリクス:既存のデータセットからデータセットを作成することにより、データエンジニアは、企業の多くの組織にわたって重要なデータ定義を一元的に定義および維持できます。例としては、売上高の伸びと純差益還元などがあります。この機能を使用すると、データエンジニアはこれらの定義に変更を配信することもできます。このアプローチは、ビジネスアナリストが適切なデータの視覚化をより迅速かつ確実に開始できることを意味します。

  • データをカスタマイズする柔軟性 - 既存のデータセットからデータセットを作成することで、ビジネスアナリストは、自分のビジネスニーズに合わせてデータセットを柔軟にカスタマイズできます。これにより、他のチームのデータが中断される心配を回避できます。

例えば、あなたは 5 人のデータエンジニアで構成されるeコマース中心チームの一員であるとします。自分と自身のチームは、データベース内の販売、注文、キャンセル、返品データにアクセスできます。スキーマを介して 18 個の他のディメンションテーブルを結合して QuickSight データセットを作成しました。チームが作成した主要メトリクスは、計算フィールド、注文商品販売 (OPS) です。その定義は次のとおりです。OPS = 製品数量 x 料金。

チームは、8 か国の 10 の異なるチームをまたぐ 100 人以上のビジネスアナリストにサービスを提供しています。これらは、クーポンチーム、アウトバウンドマーケティングチーム、モバイルプラットフォームチーム、レコメンデーションチームです。これらのチームはすべて、各自のビジネスラインを分析するためのベースとして OPS メトリクスを使用します。

何百もの接続されていないデータセットを手動で作成して維持するのではなく、チームはデータセットを再利用して、組織全体のチームに対して複数のレベルのデータセットを作成します。これにより、データ管理が一元化され、各チームがそれぞれのニーズに合わせてデータをカスタマイズできるようになります。同時に、メトリクス定義の更新などの更新がデータに同期され、行レベルおよび列レベルのセキュリティが維持されます。例えば、組織内の個々のチームが集中型データセットを使用できます。その後、チーム固有のデータと組み合わせて、新しいデータセットを作成し、その上に解析を構築できます。

主要 OPS メトリクスの使用に加えて、組織内の他のチームは、作成した一元化されたデータセットの列メタデータを再利用できます。例えば、データエンジニアリングチームは、一元化されたデータセット内で名前説明データ型、およびフォルダなどのメタデータを定義できます。それ以降の全てのチームが使用できます。

注記

Amazon QuickSight では、1 つのデータセットから最大 2 つのレベルのデータセットを作成できます。

例えば、親データセットから、子データセットを作成し、孫データセットを合計 3 つのデータセットレベルで作成できます。

既存のデータセットからのデータセットの作成

以下の手順に従って、既存のデータソースを使用してデータセットを作成します。

既存のデータセットからデータセットを作成するには
  1. QuickSight スタートページから、左側のペインでデータセットを選択します。

  2. [データセット] ページで、新しいデータセットの作成に使用するデータセットを選択します。

  3. 対象のデータセットのページが開くので、[Use in analysis] (分析で使用)、[Use in dataset] (データセットで使用) の順に選択します。

    
									データセットで使用。

    データ準備ページが開き、計算フィールド、結合、セキュリティ設定など、親データセットのすべてのものがプリロードされます。

  4. 開いたデータ準備ページで、左下の [クエリモード]、データセットが元の、親データセットから変更と更新を取り込む方法を選択します。以下のオプションを選択できます。

    • 直接クエリ - デフォルトのクエリモードです。このオプションを選択すると、関連付けられたデータセット、分析、またはダッシュボードを開くと、このデータセットのデータは自動的に更新されます。ただし、次のような制限があります。

      • 親データセットが直接クエリを許可している場合、子データセットで直接クエリモードを使用できます。

      • 結合に複数の親データセットがある場合、すべての親が同じ基になるデータソースの場合にのみ、子データセットの直接クエリモードを選択できます。例えば、同じ Amazon Redshift 接続などです。

      • 直接クエリは、単一の SPICE 親データセットでサポートされています。結合内の複数の SPICE 親データセットではサポートされません。

    • SPICE - このオプションを選択する場合は、新しいデータセットの親データセットとの同期用にスケジュールを設定できます。データセットの SPICE 更新スケジュールの作成に関する詳細については、SPICE データの更新 を参照してください。

  5. (オプション) 分析用にデータを準備します。データ準備の詳細については、「Amazon でのデータの準備 QuickSight」を参照してください。

  6. (オプション) 行レベルまたは列レベルのセキュリティ(RLS/CLS) を設定して、データセットへのアクセスを制限します。RLS の設定の詳細については、「データセットへのアクセスを制限するためのユーザーベースのルールでの行レベルのセキュリティ (RLS) の使用」を参照してください。SPF の設定の詳細については、「 データセットへのアクセスを制限するための列レベルのセキュリティ (CLS) の使用」を参照してください。

    注記

    RLS/CLS は、子データセットにのみ設定できます。親データセットの RLS/CLS はサポートされていません。

  7. 完了したら、[Save & publish] を選択して、変更を保存し、新しい子データセットを公開します。または、[Save & publish] を選択クして、新しい子データセットを公開し、データの視覚化を開始します。