Amazon EMR を使用してデータを準備する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon EMR を使用してデータを準備する

重要

Amazon SageMaker Studio と Amazon SageMaker Studio Classic は、 とのやり取りに使用できる機械学習環境の 2 つです SageMaker。

ドメインが 2023 年 11 月 30 日以降に作成された場合、Studio はデフォルトのエクスペリエンスです。

ドメインが 2023 年 11 月 30 日より前に作成された場合、Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスになります。Amazon Studio Classic がデフォルトのエクスペリエンスである場合に SageMaker Studio を使用するには、「」を参照してくださいAmazon SageMaker Studio Classic からの移行

Amazon SageMaker Studio Classic から Amazon SageMaker Studio に移行しても、機能の可用性が失われることはありません。Studio Classic は、レガシー機械学習ワークフローの実行に役立つ Amazon SageMaker Studio 内のアプリケーションとしても存在します。

Amazon SageMaker Studio と Studio Classic には Amazon EMR の統合が組み込まれており、データサイエンティストとデータエンジニアは、ペタバイト規模のインタラクティブなデータ準備と機械学習 (ML) をノートブックから直接実行できます。 JupyterLab および Studio Classic ノートブック内では、既存の Amazon EMR クラスターを検出して接続し、Apache Spark、Apache HivePresto を使用して機械学習用の大規模なデータをインタラクティブに調査、視覚化、準備できます。ワンクリックで Spark UI にアクセスして、ノートブックを離れることなく Spark ジョブのステータスとメトリクスをモニタリングできます。

管理者は、Amazon EMR クラスターを定義するAWS CloudFormation テンプレートを作成できます。その後、これらのクラスターテンプレートを AWS Service Catalog Studio および Studio Classic ユーザーが起動できるように で使用できます。その後、データサイエンティストは事前定義されたテンプレートを選択して、Studio 環境から直接 Amazon EMR クラスターを自己プロビジョニングできます。管理者はテンプレートをさらにパラメータ化して、ユーザーが事前定義された値内でクラスターの側面を選択できるようにすることができます。例えば、ユーザーはコアノードの数を指定したり、ドロップダウンメニューからノードのインスタンスタイプを選択したりできます。

を使用すると AWS CloudFormation、管理者は Amazon EMR クラスターの組織、セキュリティ、ネットワークのセットアップを制御できます。データサイエンティストとデータエンジニアは、複雑な設定を行わずに、ワークロードに合わせてこれらのテンプレートをカスタマイズして、Studio と Studio Classic から直接オンデマンドの Amazon EMR クラスターを作成できます。ユーザーは、使用後に Amazon EMR クラスターを終了できます。