Amazon EMRクラスターを使用してデータを準備する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon EMRクラスターを使用してデータを準備する

重要

Amazon SageMaker Studio と Amazon SageMaker Studio Classic は、 とのやり取りに使用できる機械学習環境の 2 つです SageMaker。

ドメインが 2023 年 11 月 30 日以降に作成された場合、Studio はデフォルトのエクスペリエンスです。

ドメインが 2023 年 11 月 30 日より前に作成された場合、Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスになります。Amazon Studio Classic がデフォルトのエクスペリエンスである場合に SageMaker Studio を使用するには、「」を参照してくださいAmazon SageMaker Studio Classic からの移行

Amazon SageMaker Studio Classic から Amazon SageMaker Studio に移行しても、機能の可用性が失われることはありません。Studio Classic は、レガシー機械学習ワークフローの実行に役立つ Amazon SageMaker Studio 内のアプリケーションとしても存在します。

Amazon SageMaker Studio と Studio Classic には、Amazon EMRとの統合が組み込まれています。 JupyterLab および Studio Classic ノートブック内では、データサイエンティストとデータエンジニアは既存の Amazon EMRクラスターを検出して接続し、Apache SparkApache HivePresto を使用して機械学習用の大規模なデータをインタラクティブに調査、視覚化、準備できます。ワンクリックで Spark UI にアクセスして、ノートブックを離れることなく Spark ジョブのステータスとメトリクスをモニタリングできます。

管理者は を作成できます AWS CloudFormation Amazon EMRクラスターを定義する テンプレート。その後、これらのクラスターテンプレートを で使用できるようにすることができます。 AWS Service Catalog Studio および Studio Classic ユーザーが起動するための 。その後、データサイエンティストは事前定義されたテンプレートを選択して、Studio 環境から直接 Amazon EMRクラスターを自己プロビジョニングできます。管理者はテンプレートをさらにパラメータ化して、ユーザーが事前定義された値内でクラスターの側面を選択できるようにすることができます。例えば、ユーザーはコアノードの数を指定したり、ドロップダウンメニューからノードのインスタンスタイプを選択したりできます。

使用 AWS CloudFormation管理者は、Amazon EMRクラスターの組織、セキュリティ、ネットワークの設定を制御できます。その後、データサイエンティストとデータエンジニアは、ワークロードに合わせてこれらのテンプレートをカスタマイズして、複雑な設定を行わずに Studio と Studio Classic から直接オンデマンドの Amazon EMRクラスターを作成できます。ユーザーは、使用後に Amazon EMRクラスターを終了できます。