SPICE データの更新 - Amazon QuickSight

SPICE データの更新

データセットの更新

次の手順に従って、[Datasets] (データセット) ページで Amazon S3 またはデータベースのデータソースに基づいた SPICE データセットを更新します。

データセットページから SPICE データを更新する

  1. [Datasets (データセット)] ページで、データセットを選択し、[Refresh Now (今すぐ更新)] を選択します。

  2. 更新タイプは [Full refresh (フル更新)] のままにしておきます。

  3. Amazon S3 のデータセットを更新する場合は、S3 マニフェストの以下のオプションのうちいずれか 1 つを選択します。

    • Amazon QuickSight で前回指定したものと同じマニフェストファイルを使用するときは、 [Existing Manifest (既存のマニフェスト)] を選択します。前回指定したファイルの場所または URL にあるマニフェストファイルを変更している場合、返されるデータにはそれらの変更が反映されます。

    • ローカルネットワークからのアップロードにより新しいマニフェストファイルを指定するには、[Upload Manifest (マニフェストのアップロード)]、[Upload manifest file (マニフェストファイルのアップロード)] の順に選択します。[Open (開く)] で、ファイルを選択してから [Open (開く)] を選択します。

    • URL の指定により新しいマニフェストファイルを指定するには、[Input manifest URL (マニフェスト URL の入力)] にマニフェストの URL を入力します。マニフェストファイルの URL は、Amazon S3 コンソールでマニフェストファイルのコンテキストメニュー (右クリック) を開き、[Properties (プロパティ)] を選択し、[Link (リンク)] ボックスを見ると確認できます。

  4. [Refresh (更新)] を選択します。

  5. Amazon S3 のデータセットを更新する場合は、[OK] を選択し、もう一度 [OK] を選択します。

    データベースのデータセットを更新する場合は、[OK] を選択します。

データセットの増分更新

 適用先: Enterprise Edition 

Amazon Redshift、Amazon Athena、PostgreSQL、または Snowflake などの SQL ベースのデータソースの場合、ルックバック期間内にデータを増分的に更新できます。

増分更新は、指定されたルックバック期間内で、データセットによって定義されたデータのみをクエリします。この更新は、その期間内に行われたデータセットへの挿入、削除、および変更のすべてをソースからデータセットに転送します。現在 SPICE 内にあるデータでその期間内にあてはまるものは削除され、更新されたデータに置き換えられます。

増分更新では、更新ごとにクエリおよび転送されるデータが少なくなります。例えば、1 月 1 日から 6 月 30 日までのデータが含まれた 180,000 個のレコードを持つデータセットがあるとします。7 月 1 日に、7 日間のルックバック期間でデータの増分更新を実行します。QuickSight はデータベースにクエリを実行して、6 月 24 日 (7 日前) 以降のすべてのデータ (7,000 レコード) を要求します。QuickSight は次に、現在 SPICE 内にある 6 月 24 日以降のデータを削除し、新しくクエリされたデータを追加します。翌日 (7 月 2 日) も QuickSight は同じ操作を実行しますが、今回は 6 月 25 日からのデータ (同じく 7,000 レコード) をクエリして、同日以降の既存のデータセットからデータを削除します。毎日 180,000 個のレコードを取り込む代わりに、7,000 個のレコードを取り込むだけでよいことになります。

以下の手順に従って、[Datasets] (データセット) ページで SQL データソースに基づく SPICE データセットを増分更新します。

SQL ベースの SPICE データセットを増分更新する

  1. [Datasets (データセット)] ページで、データセットを選択し、[Refresh Now (今すぐ更新)] を選択します。

  2. [Refresh type] (更新タイプ) には [Incremental refresh] (増分更新) を選択します。

  3. これがデータセットで行う最初の増分更新である場合は、[Configure] (設定) をクリックします。

  4. [Configure incremental refresh] (増分更新を設定) ページで、以下を実行します。

    1. [Date column] (日付の列) には、ルックバック期間の基準にする日付列を選択します。

    2. [Window size] (ウィンドウサイズ) には、[size] (サイズ) の数値を入力します。次に、変更についてルックバックする時間の単位を選択します。

      現時点から、指定された時間数、日数、または週数内に発生したデータへの変更を更新するように選択できます。例えば、現在の日付から 2 週間の間に発生したデータへの変更を更新するように選択できます。

  5. [Submit] (送信) を選択します。

データの準備時におけるデータセットの更新

以下の手順に従って、データの準備中に Amazon S3 またはデータベースのデータソースに基づく SPICE データセットを更新します。

データの準備中に SPICE のデータを更新する

  1. [Datasets (データセット)] ページで、データセットを選択し、 [Edit Data Set (データセットの編集)] を選択します。

  2. データセット画面で、[Refresh now (今すぐ更新)] を選択します。

  3. 更新のタイプは [Full refresh (フル更新)] のままにしておきます。

  4. (オプション) Amazon S3 のデータセットを更新する場合は、S3 マニフェストの以下のオプションのうちいずれか 1 つを選択します。

    • Amazon QuickSight で前回指定したものと同じマニフェストファイルを使用するには、[Existing Manifest] (既存のマニフェスト) を選択します。前回指定したファイルの場所または URL にあるマニフェストファイルを変更している場合、返されるデータにはそれらの変更が反映されます。

    • ローカルネットワークからのアップロードにより新しいマニフェストファイルを指定するには、[Upload Manifest (マニフェストのアップロード)]、[Upload manifest file (マニフェストファイルのアップロード)] の順に選択します。[Open (開く)] で、ファイルを選択してから [Open (開く)] を選択します。

    • URL の指定により新しいマニフェストファイルを指定するには、[Input manifest URL (マニフェスト URL の入力)] にマニフェストの URL を入力します。マニフェストファイルの URL は、Amazon S3 コンソールでマニフェストファイルのコンテキストメニュー (右クリック) を開き、[Properties (プロパティ)] を選択し、[Link (リンク)] ボックスを見ると確認できます。

  5. [Refresh (更新)] を選択します。

  6. Amazon S3 のデータセットを更新する場合は、[OK] を選択し、もう一度 [OK] を選択します。

    データベースのデータセットを更新する場合は、[OK] を選択します。

スケジュールに基づいたデータセットの更新

以下の手順に従って、データの更新をスケジュールします。データセットが直接クエリに基づくもので、SPICE に保存されていない場合は、データセットを開くことでデータを更新できます。分析またはダッシュボードのページを更新して、データを更新することもできます。

スケジュールに基づいて SPICE データを更新する

  1. [Datasets (データセット)] ページで、データセットを選択し、[Schedule refresh (更新スケジュール)] を選択します。

  2. [更新スケジュール] で、[作成] を選択します。

  3. [Create a Schedule] (スケジュールの作成) 画面で、スケジュールの設定を選択します。

    1. [Refresh type] (更新タイプ) は [Full refresh] (フル更新) のままにしておきます。

    2. [Time zone (タイムゾーン)] で、データの更新に適用されるタイムゾーンを選択します。

    3. [Repeats (繰り返し)] で、以下のいずれかのオプションを選択します。

      • Standard Edition または Enterprise Edition の場合は、[Daily (毎日)]、[Weekly (毎週)]、または [Monthly (毎月)] を選択できます。

        • [Daily (毎日)]: 毎日繰り返します。

        • [Weekly (毎週)]: 毎週同じ日に繰り返します。

        • [Monthly (毎月)]: 毎月同じ日に繰り返します。毎月の 29 日、30 日、または 31 日にデータを更新するには、リストから [Last day of month (月の最後の日)] を選択します。

      • Enterprise Edition の場合のみ、[Hourly (毎時)] を選択できます。この設定では、選択した時刻を開始点として 1 時間ごとにデータセットが更新されます。したがって、開始時刻として 1:05 を選択すると、その時間後に、毎時 5 分にデータが更新されます。

        1 時間ごとの更新を使用する場合は、追加の更新スケジュールを使用することもできません。時間単位のスケジュールを作成するには、そのデータセットの他の既存のスケジュールを削除します。また、毎日、毎週、または毎月のスケジュールを作成する前に、既存の時間単位のスケジュールを削除します。

    4. [Starting (開始日)] では、更新を開始する日付を選択します。

    5. [At (時刻)] では、更新を開始する時刻を指定します。24 時間表記の「HH:MM」形式を使用します (例: 13:30)。

  4. [Create] を選択します。

Amazon QuickSight コンソールを使用して、データセットごとに 5 つのスケジュールを作成できます。スケジュールが 5 個作成されると、[Create] (作成) ボタンが無効になります。

スケジュールに基づいたデータセットの増分更新

 適用先: Enterprise Edition 

Amazon Redshift、Athena、PostgreSQL、または Snowflake などの SQL ベースのデータソースには、増分更新をスケジュールできます。以下の手順に従って、[Datasets] (データセット) ページで SQL データソースに基づく SPICE データセットを増分更新します。

SQL ベースの SPICE データセットに増分更新スケジュールを設定する

  1. [Datasets] (データセット) ページでデータセットを選択し、[Schedule refresh] (更新をスケジュール) をクリックします。

  2. [Refresh schedule] (更新をスケジュール) ページで [Create] (作成) をクリックします。

  3. [Create a schedule] (スケジュールの作成) ページで、[Refresh type] (更新タイプ) に [Incremental refresh] (増分更新) を選択します。

  4. これがこのデータセットの最初の増分更新である場合は、[Configure] (設定) をクリックして以下を実行します。

    1. [Date column] (日付の列) には、ルックバック期間の基準にする日付列を選択します。

    2. [Window size] (ウィンドウサイズ) には、[size] (サイズ) の数値を入力します。次に、変更についてルックバックする時間の単位を選択します。

      現時点から、指定された時間数、日数、または週数内に発生したデータへの変更を更新するように選択できます。例えば、現在の日付から 2 週間の間に発生したデータへの変更を更新するように選択できます。

    3. [Submit] (送信) を選択します。

  5. [Time zone (タイムゾーン)] で、データの更新に適用されるタイムゾーンを選択します。

  6. [Repeats (繰り返し)] で、以下のいずれかのオプションを選択します。

    • [Every 15 minutes] (15 分ごと)、[Every 30 minutes] (30 分ごと)、[Hourly] (毎時)、[Daily] (毎日)、[Weekly] (毎週)、または [Monthly] (毎月) を選択できます。

      • [Every 15 minutes] (15 分ごと): 選択した時刻を開始点として 15 分ごとに繰り返されます。したがって、開始時刻として 1:05 を選択すると、データは 1:20 に更新され、その後 1:35 に再度更新されます。

      • [Every 30 minutes] (30 分ごと): 選択した時刻を開始点として 30 分ごとに繰り返されます。したがって、開始時刻として 1:05 を選択すると、データは 1:35 に更新され、その後 2:05 に再度更新されます。

      • [Hourly] (毎時): 選択した時刻を開始点として 1 時間ごとに繰り返されます。したがって、開始時刻として 1:05 を選択すると、その時間後に、毎時 5 分にデータが更新されます。

      • [Daily (毎日)]: 毎日繰り返します。

      • [Weekly (毎週)]: 毎週同じ日に繰り返します。

      • [Monthly (毎月)]: 毎月同じ日に繰り返します。毎月の 29 日、30 日、または 31 日にデータを更新するには、リストから [Last day of month (月の最後の日)] を選択します。

    • 15 分ごと、30 分ごと、または毎時の更新を使用する場合は、追加の更新スケジュールを使用できません。15 分ごと、30 分ごと、または毎時の更新スケジュールを作成するには、そのデータセット用の他の既存スケジュールを削除してください。また、毎日、毎週、または毎月のスケジュールを作成する前にも、既存の分単位または毎時のスケジュールを削除してください。

  7. [Starting (開始日)] では、更新を開始する日付を選択します。

  8. [At (時刻)] では、更新を開始する時刻を指定します。24 時間表記の「HH:MM」形式を使用します (例: 13:30)。

場合によっては、データセットの増分更新で不具合が発生し、データセットをロールバックする必要が生じることがあります。または、データセットの増分更新を停止したいという場合もあります。このような場合は、スケジュールされた更新を削除できます。

削除するには、[Datasets] (データセット) ページでデータセットを選択し、[Schedule a refresh] (更新をスケジュール) をクリックしてから、スケジュールされた更新の右側にある [X] アイコンをクリックします。増分更新設定を削除すると、フル更新が開始されます。このフル更新の一環として、増分更新用に準備されたすべての設定が削除されます。