Amazon SageMaker モデルと Amazon の統合 QuickSight - Amazon QuickSight

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker モデルと Amazon の統合 QuickSight

注記

Amazon で ML を使用した機能を使用する分析やダッシュボードを作成するのに、機械学習 (ML) の技術的な経験は必要ありません QuickSight。

Amazon QuickSight Enterprise Edition のデータは、Amazon SageMaker 機械学習モデルで拡張できます。Amazon でサポートされている任意のデータソースからSPICEインポートされた に保存されたデータに対して推論を実行できます QuickSight。サポートされているデータソースの詳細な一覧については、サポートされているデータソースを参照してください。

SageMaker モデル QuickSight で Amazon を使用すると、データ移動の管理やコードの記述に費やす時間を節約できます。この結果は、モデルの評価や、(結果に満足している場合は) 意思決定者との共有に有用です。モデルが作成された直後に開始できます。これにより、データサイエンティストが事前に構築したモデルが表れ、データサイエンスをデータセットに適用できるようになります。その後、予測ダッシュボードでこれらのインサイトを共有できます。Amazon QuickSight サーバーレスアプローチでは、プロセスがシームレスに拡張されるため、推論やクエリの容量について心配する必要はありません。

Amazon は、回帰アルゴリズムと分類アルゴリズムを使用する SageMaker モデル QuickSight をサポートしています。この機能を適用すると、ほぼすべてのビジネスユースケースに関する予測を立てることができます。例えば、顧客の解約、従業員の離職、セールスリードの採点、信用リスクの評価などに予測を利用できます。Amazon を使用して予測 QuickSight を提供するには、入力と出力の両方の SageMaker モデルデータが表形式である必要があります。マルチクラス分類またはマルチラベル分類のユースケースでは、各出力列に単一の値を含める必要があります。Amazon QuickSight は、1 つの列内の複数の値をサポートしていません。

SageMaker 統合の仕組み

一般に、プロセスは次のように動作します。

  1. Amazon QuickSight 管理者は、Amazon が にアクセス QuickSight するためのアクセス許可を追加します SageMaker。これを行うには、「管理 QuickSight」ページから「セキュリティとアクセス許可の設定」を開きます。QuickSight 「 AWSサービスへのアクセス」に移動し、 を追加します SageMaker。

    これらのアクセス許可を追加すると、Amazon QuickSight はAWS、アカウント内のすべての SageMaker モデルを一覧表示するためのアクセスを提供する AWS Identity and Access Management (IAM) ロールに追加されます。また、プレフィックス が付いた名前の SageMaker ジョブを実行するアクセス許可も提供しますquicksight-auto-generated-

  2. データの前処理が自動的に実行されるため、推論パイプラインを持つ SageMaker モデルに接続することをお勧めします。詳細については、「 デベロッパーガイド」の「推論パイプラインをデプロイする」を参照してください。 SageMaker

  3. 一緒に使用するデータと事前トレーニング済みモデルを特定したら、モデルの所有者がスキーマファイルを作成し、提供します。この JSON ファイルは との契約です SageMaker。モデルが想定するフィールド、データタイプ、列の順序、出力、設定に関するメタデータを提供します。オプションの設定コンポーネントは、ジョブに使用するコンピュートインスタンスのインスタンスサイズと数を提供します。

    モデルを構築したデータサイエンティストは、次に説明する’形式でこのスキーマファイルを作成します。モデルのコンシューマは、モデルの所有者からスキーマファイルを取得します。

  4. Amazon では QuickSight、まず、予測を行うデータを使用して新しいデータセットを作成します。ファイルをアップロードする場合は、アップロード設定画面で SageMaker モデルを追加できます。それ以外の場合は、データ準備ページでモデルを追加します。

    先に進む前に、データセットとモデルの間のマッピングを確認します。

  5. データがデータセットにインポートされると、出力フィールドには から返されたデータが含まれます SageMaker。これらのフィールドは、「使用上のガイドライン」で説明されているガイドライン内で、他のフィールドと同じように使用できます。

    SageMaker 統合を実行すると、Amazon QuickSight は推論パイプラインを使用してバッチ変換ジョブを実行するリクエスト SageMaker を に渡します。Amazon は、AWSアカウントに必要なインスタンスのプロビジョニングとデプロイ QuickSight を開始します。処理が完了すると、これらのインスタンスはシャットダウンされ、終了します。コンピューティング性能は、モデルの処理時にのみコストが発生します。

    識別しやすくするために、Amazon QuickSight はすべての SageMaker ジョブにプレフィックス を付けていますquicksight-auto-generated-

  6. 推論の出力は SPICE に保存され、データセットに追加されます。推論が完了するとすぐに、データセットを使用して、予測データを使用して視覚化やダッシュボードを作成できます。

  7. データ更新は、データセットを保存するたびに開始されます。SPICE データセットを更新してデータ更新プロセスを手動で開始する、または定期的に更新プロセスが実行されるようにスケジュールすることができます。データ更新のたびに、システムは SageMaker バッチ変換を自動的に呼び出して、出力フィールドを新しいデータで更新します。

    Amazon QuickSight SPICE Ingestion API オペレーションを使用して、データ更新プロセスを制御できます。これらの API オペレーションの使用の詳細については、「Amazon QuickSight API リファレンス」を参照してください。

発生したコスト(統合自体による追加コストはありません)

この機能を使用すること自体に追加料金はかかりません。費用には以下が含まれます。

  • によるモデルデプロイのコスト。 SageMakerモデルが実行中の場合にのみ発生します。データセットの作成もしくは編集後、またはデータの更新後にデータセットを保存すると、データの取り込みが開始されます。このプロセスには、データセットに推定フィールド SageMaker がある場合の の呼び出しが含まれます。コストは、 QuickSight サブスクリプションと同じAWSアカウントで発生します。

  • QuickSight サブスクリプションのコストは次のとおりです。

    • QuickSight (SPICE) のインメモリ計算エンジンにデータを保存するコスト。SPICE に新しいデータを追加するときは、それに対応するために十分な SPICE 容量を購入する必要が生じる場合があります。

    • QuickSight データセットを構築する作成者または管理者の サブスクリプション。

    • ビューワー (閲覧者) がインタラクティブダッシュボードにアクセスするための P ay-per-session 料金。

使用上のガイドライン

Amazon では QuickSight、この Enterprise Edition 機能に次の使用ガイドラインが適用されます。

  • モデルの処理は SPICE で行われます。そのため、これは SPICE に保存されているデータセットにのみ適用できます。現在このプロセスでは、データセットあたり最大 5 億行がサポートされています。

  • ML モデルでデータセットを拡張できるのは、 QuickSight 管理者または作成者のみです。閲覧者は、ダッシュボードの一部である場合にのみ結果を表示できます。

  • 各データセットは、1 つの ML モデルのみを処理できます。

  • 出力フィールドを使用して新しいフィールドを計算することはできません。

  • データセットは、モデルと統合されているフィールドでフィルタリングすることはできません。つまり、データセットフィールドが現在、機械学習モデルにマッピングされている場合、そのフィールドでフィルタリングすることはできません。

では SageMaker、Amazon で使用する事前トレーニング済みモデルに次の使用ガイドラインが適用されます QuickSight。

  • モデルを作成するときに、適切な IAM ロールの Amazon リソースネーム (ARN) に関連付けます。 SageMaker モデルの IAM ロールは、Amazon が QuickSight 使用する Amazon S3 バケットにアクセスできる必要があります。

  • モデルが入力と出力の両方で .csv ファイルをサポートしていることを確認します。データが表形式であることを確認します。

  • 入力フィールドと出力フィールドのリストを含む、モデルに関するメタデータを含むスキーマファイルを指定します。現在、このスキーマファイルは手動で作成する必要があります。

  • 推論を完了するのにかかる時間を考慮してください。これはいくつかの要因に依存します。これには、モデルの複雑さ、データ量、定義されたコンピューティング性能が含まれます。推論の完了には数分から数時間かかることがあります。Amazon では、すべてのデータの取り込みジョブと推論ジョブを最大 10 時間 QuickSight に制限しています。推論の実行にかかる時間を短縮するには、インスタンスのサイズまたはインスタンスの数を増やすことを検討してください。

  • 現在、 との統合にはバッチ変換のみを使用でき SageMaker、リアルタイムデータは使用できません。 SageMaker エンドポイントを使用することはできません。

スキーマファイルの定義

Amazon QuickSight データで SageMaker モデルを使用する前に、Amazon がモデルを処理する QuickSight ために必要なメタデータを含む JSON スキーマファイルを作成します。Amazon QuickSight の作成者または管理者は、データセットの設定時にスキーマファイルをアップロードします。

スキーマフィールドは次のように定義されます。次の説明で指定されていない限り、すべてのフィールドは必須です。属性では、大文字と小文字が区別されます。

inputContentType

この SageMaker モデルが入力データに期待するコンテンツタイプ。これに対してサポートされている値は "text/csv" のみです。 QuickSight には、入力ファイルに追加するヘッダー名は含まれません。

outputContentType

使用する SageMaker モデルによって生成される出力のコンテンツタイプ。これに対してサポートされている値は "text/csv" のみです。

input

モデルが入力データで期待する機能のリスト。 QuickSight は、入力データをまったく同じ順序で生成します。このリストには次の属性が含まれています。

  • 名前 – 列の名前 可能な場合は、 QuickSight データセット内の対応する列の名前と同じにします。この属性は最大 100 文字に制限されています。

  • – この列のデータ型 この属性は、"INTEGER""STRING"、および "DECIMAL" の値をとります。

  • nullable – (オプション) フィールドの NULL 値。デフォルト値は、trueです。nullable を に設定するとfalse、 は を呼び出す前に、この値を含まない行を QuickSight ドロップします SageMaker。これにより、 が必要なデータ欠落時に失敗 SageMaker するのを防ぐことができます。

output

SageMaker モデルが生成する出力列のリスト。 QuickSight はこれらのフィールドをまったく同じ順序で想定します。このリストには次の属性が含まれています。

  • name – この名前は、 で作成された対応する新しい列のデフォルト名になります QuickSight。ここで指定した名前は で上書きできます QuickSight。この属性は最大 100 文字に制限されています。

  • – この列のデータ型 この属性は、"INTEGER""STRING"、および "DECIMAL" の値をとります。

instanceTypes

が変換ジョブを実行するためにプロビジョニング SageMaker できる ML インスタンスタイプのリスト。リストは、ユーザーが選択 QuickSight できるように提供されます。このリストは、 でサポートされているタイプに限定されています SageMaker。サポートされているタイプの詳細については、「 デベロッパーガイドTransformResources」の「」を参照してください。 SageMaker

defaultInstanceType

(オプション) の SageMaker ウィザードでデフォルトオプションとして表示されるインスタンスタイプ QuickSight。このインスタンスタイプを instanceTypes に含めます。

instanceCount

(オプション) インスタンス数は、 が変換ジョブを実行するためにプロビジョニング SageMaker するために選択したインスタンスの数を定義します。値は正の整数である必要があります。

説明

このフィールドは、 SageMaker モデルを所有するユーザーが、 でこのモデルを使用しているユーザーと通信するための場所を提供します QuickSight。このフィールドを使用して、このモデルを正常に使用するためのヒントを提供します。たとえばこのフィールドには、データセットのサイズに基づいて、instanceTypes のリストから選択する有効なインスタンスタイプの選択に関する情報を含めることができます。このフィールドは最大 1,000 文字に制限されています。

バージョン

スキーマのバージョン("1.0" など)。

次の例は、スキーマファイル内の JSON の構造を示しています。

{ "inputContentType": "CSV", "outputContentType": "CSV", "input": [ { "name": "buying", "type": "STRING" }, { "name": "maint", "type": "STRING" }, { "name": "doors", "type": "INTEGER" }, { "name": "persons", "type": "INTEGER" }, { "name": "lug_boot", "type": "STRING" }, { "name": "safety", "type": "STRING" } ], "output": [ { "name": "Acceptability", "type": "STRING" } ], "description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB", "version": "1.0", "instanceCount": 1, "instanceTypes": [ "ml.m4.xlarge", "ml.m4.4xlarge" ], "defaultInstanceType": "ml.m4.xlarge" }

スキーマファイルの構造は、 が提供する例で使用されているモデルの種類に関連しています SageMaker。

QuickSight データセットへの SageMaker モデルの追加

次の手順を使用して、事前トレーニング済み SageMaker モデルをデータセットに追加し、分析とダッシュボードで予測データを使用できるようにします。

開始する前に、次の項目を使用可能にしておきます。

  • データセットの構築に使用するデータ。

  • データセットの拡張に使用する SageMaker モデルの名前。

  • モデルのスキーマ。このスキーマには、フィールド名のマッピングとデータ型が含まれます。インスタンスタイプと使用するインスタンス数の推奨設定も含まれている場合に便利です。

で Amazon QuickSight データセットを拡張するには SageMaker
  1. スタートページから [Datasets] (データセット) を選択し、続いて [New data set] (新しいデータセット) を選択します。

    既存のデータセットを編集することもできます。

  2. データ準備画面で Augment with SageMaker を選択します。

  3. [Select your model (モデルを選択)] で、次の設定を選択します。

    • モデル - フィールドの推測に使用する SageMaker モデルを選択します。

    • 名前 – モデルにわかりやすい名前を付けます。

    • スキーマ – モデル用に提供された JSON スキーマファイルをアップロードします。

    • 詳細設定 – QuickSight は、データセットに基づいて選択したデフォルトを推奨します。特定のランタイム設定を使用して、ジョブの速度とコストのバランスをとることができます。これを行うには、インスタンスタイプ の SageMaker ML インスタンスタイプカウント のインスタンス数を入力します。

    次へを選択して続行します。

  4. 入力の確認 で、データセットにマッピングされているフィールドを確認します。 QuickSight 再試行して、スキーマ内のフィールドをデータセット内のフィールドに自動的にマッピングします。マッピングを調整する必要がある場合は、ここで変更できます。

    次へを選択して続行します。

  5. [Review outputs] (レビュー出力) で、データセットに追加されたフィールドを表示します。

    [Save and prepare data (保存してデータを準備する)] を選択して、選択内容を確認します。

  6. データを更新するには、詳細を表示するデータセットを選択します。次に、[Refresh Now (今すぐ更新)] を選択してデータを手動で更新するか [Schedule refresh (更新をスケジュール)] を選択して定期的な更新間隔を設定します。データ更新のたびに、システムは SageMaker バッチ変換ジョブを自動的に実行し、出力フィールドを新しいデータで更新します。