Amazon EMR を使用したデータ準備 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon EMR を使用したデータ準備

重要

Amazon SageMaker Studio と Amazon SageMaker Studio Classic は、SageMaker AI を操作するために使用できる機械学習環境の 2 つです。

ドメインが 2023 年 11 月 30 日以降に作成されている場合には、Studio がデフォルトのエクスペリエンスになります。

ドメインが 2023 年 11 月 30 日より前に作成されている場合には、Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスになります。Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスである場合に Studio を使用するには、「Amazon SageMaker Studio Classic からの移行」を参照してください。

Amazon SageMaker Studio Classic から Amazon SageMaker Studio に移行しても、利用できる機能に変わりはありません。Studio Classic は Amazon SageMaker Studio 内のアプリケーションとしても利用でき、従来の機械学習ワークフローの実行に役立ちます。

Amazon SageMaker Studio と Studio Classic には、Amazon EMR との統合が組み込まれています。データサイエンティストやデータエンジニアは、JupyterLab や Studio Classic のノートブック内で、既存の Amazon EMR クラスターを検出して接続し、Apache SparkApache HivePresto を使用して、大規模なデータをインタラクティブに探索、可視化したり、機械学習向けに準備できます。ワンクリックで Spark UI にアクセスして、ノートブック以外を使用する必要なく、Spark ジョブのステータスとメトリクスをモニタリングできます。

管理者は、Amazon EMR クラスターを定義するAWS CloudFormation テンプレートを作成できます。その後、ユーザーが Studio や Studio Classic が起動できるように、このようなクラスターテンプレートを AWS Service Catalog で利用できるようにします。その後、データサイエンティストは事前定義されたテンプレートを選択して、Studio 環境から直接 Amazon EMR クラスターをセルフプロビジョンできます。管理者はさらにテンプレートをパラメータ化して、クラスターの要素を事前定義された値の範囲内でユーザーが選択できるようにすることができます。例えば、ユーザーはコアノードの数を指定したり、ドロップダウンメニューからノードのインスタンスタイプを選択したりできます。

を使用すると AWS CloudFormation、管理者は Amazon EMR クラスターの組織、セキュリティ、ネットワークのセットアップを制御できます。データサイエンティストやデータエンジニアは、ワークロードに応じてこのようなテンプレートをカスタマイズして、複雑な設定を必要とせずに Studio と Studio Classic から直接オンデマンドで Amazon EMR クラスターを作成できます。ユーザーは、使用後に Amazon EMR クラスターを終了できます。