ユーザーガイド - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ユーザーガイド

このセクションでは、データサイエンティストとデータエンジニアが Studio または Studio Classic から Amazon EMR クラスターを起動、検出、接続、または終了する方法について説明します。

ユーザーがクラスターを一覧表示または起動する前に、管理者は Studio 環境で必要な設定を行う必要があります。管理者が Studio 環境を設定して Amazon EMR クラスターの自己プロビジョニングと一覧表示を許可する方法については、「」を参照してください管理者ガイド

Studio または Studio Classic から Amazon EMR クラスターに接続するためにサポートされているイメージとカーネル

次のイメージとカーネルにはsagemaker-studio-analytics-extension、Apache Livy を使用してSparkMagicライブラリ経由でリモート Spark (Amazon EMR) クラスターに接続する JupyterLab 拡張機能である が付属しています。 https://livy.apache.org/

  • Studio ユーザーの場合: SageMaker ディストリビューションは、 JupyterLab ノートブックインスタンスのデフォルトイメージとして使用されるデータサイエンス用の Docker 環境です。ディスSageMakerトリビューションのすべてのバージョンには、 がsagemaker-studio-analytics-extensionプリインストールされています。

  • Studio Classic ユーザーの場合: 以下のイメージには がプリインストールされていますsagemaker-studio-analytics-extension

    • DataScience – Python 3 カーネル

    • DataScience 2.0 – Python 3 カーネル

    • DataScience 3.0 – Python 3 カーネル

    • SparkAnalytics 1.0 – SparkMagic および PySpark カーネル

    • SparkAnalytics 2.0 – SparkMagic および PySpark カーネル

    • SparkMagic – SparkMagic および PySpark カーネル

    • PyTorch 1.8 – Python 3 カーネル

    • TensorFlow 2.6 – Python 3 カーネル

    • TensorFlow 2.11 – Python 3 カーネル

別の組み込みイメージまたは独自のイメージを使用して Amazon EMR クラスターに接続するには、「独自のイメージを使用する」の手順に従ってください。

独自のイメージを使用する

Studio または Studio Classic に独自のイメージを持ち込んで、ノートブックが Amazon EMR クラスターに接続できるようにするには、次のsagemaker-studio-analytics-extension拡張機能をカーネルにインストールします。 SageMaker Studio または Studio Classic ノートブックを SparkMagicライブラリ経由で Spark (Amazon EMR) クラスターに接続できます。

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

Kerberos 認証を使用して Amazon EMR に接続する場合は、kinit クライアントをインストールする必要があります。お使いの OS によって、kinit クライアントをインストールするコマンドは異なる場合があります。Ubuntu (Debian ベース) イメージを取り込むには、apt-get install -y -qq krb5-user コマンドを使用します。

SageMaker Studio または Studio Classic で独自のイメージを持ち込む方法の詳細については、「独自の SageMaker イメージを持ち込む」を参照してください。