翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ノートブックインスタンスを使用してモデルをビルドする
機械学習 (ML) 担当者が Amazon を利用する最良の方法の 1 SageMaker つは、 SageMaker ノートブックインスタンスを使用して ML モデルをトレーニングしてデプロイすることです。 SageMaker ノートブックインスタンスは、Amazon Elastic Compute Cloud (Amazon EC2) で Jupyter サーバーを起動し、事前設定されたカーネルに以下のパッケージ (Amazon SageMaker Python SDK、、 AWS Command Line Interface (AWS CLI)、Conda、Pandas AWS SDK for Python (Boto3)、ディープラーニングフレームワークライブラリ、およびデータサイエンスや機械学習用のその他のライブラリを提供することで、環境の作成に役立ちます。
SageMaker Python SDK によるMachine Learning
SageMaker ノートブックインスタンスで ML モデルをトレーニング、検証、デプロイ、評価するには SageMaker Python SDK を使用します。 SageMaker Python SDK AWS SDK for Python (Boto3) のアブストラクトと SageMaker API オペレーションです。データやモデルアーティファクトを保存するための Amazon Simple Storage Service (Amazon S3)、ML AWS モデルのインポートとサービスのための Amazon Elastic Container Registry (ECR)、トレーニングと推論のための Amazon Elastic Compute Cloud (Amazon EC2) など、他のサービスと統合してオーケストレーションすることができます。
また、データのラベル付け、データの前処理、モデルトレーニング、モデルのデプロイ、予測パフォーマンスの評価、本番環境でのモデルの品質の監視など、ML SageMaker サイクル全体のあらゆる段階に対処するのに役立つ機能を活用することもできます。
初めての方は SageMaker 、 end-to-end ML チュートリアルに従って SageMaker Python SDK を使用することをお勧めします。オープンソースのドキュメントを見つけるには、Amazon SageMaker Python SDK
チュートリアルの概要
この入門チュートリアルでは、 SageMaker ノートブックインスタンスを作成する方法、機械学習用に Conda 環境で事前設定されたカーネルで Jupyter ノートブックを開く方法、ML SageMaker サイクルを実行するためのセッションを開始する方法について説明します。 end-to-end SageMakerセッションと自動的にペアリングされるデフォルトの Amazon S3 バケットにデータセットを保存する方法、ML モデルのトレーニングジョブを Amazon EC2 に送信する方法、Amazon EC2 を介してホスティングまたはバッチ推論によってトレーニング済みモデルをデプロイして予測する方法を学習します。
このチュートリアルでは、組み込みモデルプールから XGBoost モデルをトレーニングする完全な ML SageMaker フローを明示的に示しています。米国成人国勢調査データセットを使用し
-
SageMakerXGBoost — XGBoost モデルは環境に合わせて調整され、Docker
コンテナとして事前設定されています。 SageMaker SageMaker機能を使用できるように準備された一連の組み込みアルゴリズムを提供します。 SageMaker ML アルゴリズムの適用対象について詳しくは SageMaker、「アルゴリズムの選択」と「Amazon SageMaker ビルトインアルゴリズムの使用」を参照してください。 SageMaker 組み込みアルゴリズム API オペレーションについては、Amazon SageMaker Python SDK のファーストパーティアルゴリズムを参照してください 。 -
成人国勢調査データセット
- Ronny Kohavi 氏と Barry Becker 氏による 1994 年国勢調査局データベース からのデータセットです (Data Mining and Visualization、Silicon Graphics)。 SageMaker XGBoost モデルは、このデータセットを使用して個人の年収が 50,000 ドル以下かどうかを予測するようにトレーニングされています。