ノートブックインスタンスを使用してモデルをビルドする - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ノートブックインスタンスを使用してモデルをビルドする

機械学習 (ML) 担当者が Amazon を利用する最良の方法の 1 SageMaker つは、 SageMaker ノートブックインスタンスを使用して ML モデルをトレーニングしてデプロイすることです。 SageMaker ノートブックインスタンスは、Amazon Elastic Compute Cloud (Amazon EC2) で Jupyter サーバーを起動し、事前設定されたカーネルに以下のパッケージ (Amazon SageMaker Python SDK、、 AWS Command Line Interface (AWS CLI)、Conda、Pandas AWS SDK for Python (Boto3)、ディープラーニングフレームワークライブラリ、およびデータサイエンスや機械学習用のその他のライブラリを提供することで、環境の作成に役立ちます。

SageMaker Python SDK によるMachine Learning

SageMaker ノートブックインスタンスで ML モデルをトレーニング、検証、デプロイ、評価するには SageMaker Python SDK を使用します。 SageMaker Python SDK AWS SDK for Python (Boto3) のアブストラクトと SageMaker API オペレーションです。データやモデルアーティファクトを保存するための Amazon Simple Storage Service (Amazon S3)、ML AWS モデルのインポートとサービスのための Amazon Elastic Container Registry (ECR)、トレーニングと推論のための Amazon Elastic Compute Cloud (Amazon EC2) など、他のサービスと統合してオーケストレーションすることができます。

また、データのラベル付け、データの前処理、モデルトレーニング、モデルのデプロイ、予測パフォーマンスの評価、本番環境でのモデルの品質の監視など、ML SageMaker サイクル全体のあらゆる段階に対処するのに役立つ機能を活用することもできます。

初めての方は SageMaker 、 end-to-end ML チュートリアルに従って SageMaker Python SDK を使用することをお勧めします。オープンソースのドキュメントを見つけるには、Amazon SageMaker Python SDK を参照してください。

チュートリアルの概要

この入門チュートリアルでは、 SageMaker ノートブックインスタンスを作成する方法、機械学習用に Conda 環境で事前設定されたカーネルで Jupyter ノートブックを開く方法、ML SageMaker サイクルを実行するためのセッションを開始する方法について説明します。 end-to-end SageMakerセッションと自動的にペアリングされるデフォルトの Amazon S3 バケットにデータセットを保存する方法、ML モデルのトレーニングジョブを Amazon EC2 に送信する方法、Amazon EC2 を介してホスティングまたはバッチ推論によってトレーニング済みモデルをデプロイして予測する方法を学習します。

このチュートリアルでは、組み込みモデルプールから XGBoost モデルをトレーニングする完全な ML SageMaker フローを明示的に示しています。米国成人国勢調査データセットを使用し、トレーニング済みの SageMaker XGBoost モデルが個人の収入を予測する際のパフォーマンスを評価します。