翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon EMR を使用したデータ準備
重要
Amazon SageMaker Studio と Amazon SageMaker Studio Classic は、SageMaker AI を操作するために使用できる機械学習環境の 2 つです。
ドメインが 2023 年 11 月 30 日以降に作成されている場合には、Studio がデフォルトのエクスペリエンスになります。
ドメインが 2023 年 11 月 30 日より前に作成されている場合には、Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスになります。Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスである場合に Studio を使用するには、「Amazon SageMaker Studio Classic からの移行」を参照してください。
Amazon SageMaker Studio Classic から Amazon SageMaker Studio に移行しても、利用できる機能に変わりはありません。Studio Classic は Amazon SageMaker Studio 内のアプリケーションとしても利用でき、従来の機械学習ワークフローの実行に役立ちます。
Amazon SageMaker Studio と Studio Classic には、Amazon EMR との統合が組み込まれています。データサイエンティストやデータエンジニアは、JupyterLab や Studio Classic のノートブック内で、既存の Amazon EMR クラスターを検出して接続し、Apache Spark
管理者は、Amazon EMR クラスターを定義するAWS CloudFormation テンプレートを作成できます。その後、ユーザーが Studio や Studio Classic が起動できるように、このようなクラスターテンプレートを AWS Service Catalog で利用できるようにします。その後、データサイエンティストは事前定義されたテンプレートを選択して、Studio 環境から直接 Amazon EMR クラスターをセルフプロビジョンできます。管理者はさらにテンプレートをパラメータ化して、クラスターの要素を事前定義された値の範囲内でユーザーが選択できるようにすることができます。例えば、ユーザーはコアノードの数を指定したり、ドロップダウンメニューからノードのインスタンスタイプを選択したりできます。
を使用すると AWS CloudFormation、管理者は Amazon EMR クラスターの組織、セキュリティ、ネットワークのセットアップを制御できます。データサイエンティストやデータエンジニアは、ワークロードに応じてこのようなテンプレートをカスタマイズして、複雑な設定を必要とせずに Studio と Studio Classic から直接オンデマンドで Amazon EMR クラスターを作成できます。ユーザーは、使用後に Amazon EMR クラスターを終了できます。
-
管理者の場合:
Studio または Studio Classic のクラスターと Amazon EMR クラスター間の通信が有効になっていることを確認します。手順については、「Amazon EMR クラスターのネットワークアクセスを設定する」を参照してください。この通信が有効になったら、以下を実行できます。
-
データサイエンティストまたはデータエンジニアの場合、以下を実行できます。