SageMaker Autopilot - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker Autopilot

重要

2023 年 11 月 30 日現在、Autopilot の UI は、更新された Amazon Studio SageMaker エクスペリエンスの一部として Amazon Canvas に移行しています。 SageMaker Canvas は、データの準備、特徴量エンジニアリング、アルゴリズムの選択、トレーニングとチューニング、推論、継続的なモデルモニタリングなどのタスクにコードなしの機能を提供します。 SageMaker Canvas は、コンピュータビジョン、需要予測、インテリジェントな検索、生成 AI など、さまざまなユースケースをサポートしています。 SageMaker

Studio の以前のエクスペリエンスである Amazon SageMaker Studio Classic Amazon SageMaker Studioのユーザーは、Studio Classic で Autopilot UI を引き続き使用できます。コーディングの経験を持つユーザーは、サポートされている SDK のすべての API リファレンスを引き続き使用して、技術的な実装を行うことができます。

Studio Classic でこれまでに Autopilot を使用していて、Canvas SageMaker に移行する場合は、Canvas アプリケーションを作成して使用できるように、ユーザープロファイルまたは IAM SageMaker ロールに追加のアクセス許可を付与する必要がある場合があります。詳細については、「Studio Classic のオートパイロットから Canvas に移行します。 SageMaker 」を参照してください。

このガイドの UI 関連の手順はすべて、Amazon SageMaker Canvas に移行する前の Autopilot のスタンドアロン機能に関するものです。これらの指示に従うユーザーは、Studio Classic を使用する必要があります。

Amazon SageMaker Autopilot は、機械学習モデル (AutoML ) の構築とデプロイのプロセスを自動化することで、機械学習ワークフローのさまざまな段階を簡素化および高速化する機能セットです。

Autopilot は、Autopilot またはさまざまな程度のヒューマンガイダンスで使用できる以下の主要なタスクを実行します。

  • データ分析と前処理: Autopilot は、特定の問題タイプを識別し、欠落した値を処理し、データを正規化し、特徴量を選択して、全体的にモデルトレーニング用データを準備します。

  • モデルの選択: Autopilot は、さまざまなアルゴリズムを調べ、交差検証リサンプリングテクニックを使用して、事前定義された目標メトリクスに基づいてアルゴリズムの予測品質を評価するメトリクスを生成します。

  • ハイパーパラメータの最適化: Autopilot は最適なハイパーパラメータ設定の検索を自動化します。

  • モデルトレーニングと評価: Autopilot は、さまざまなモデル候補のトレーニングと評価のプロセスを自動化します。データをトレーニングおよび検証セットに分割し、トレーニングデータを使用して選択したモデル候補をトレーニングし、検証セットの未見データに基づいてパフォーマンスを評価します。最後に、パフォーマンスに基づいて最適化されたモデル候補をランク付けし、最もパフォーマンスの高いモデルを特定します。

  • モデルのデプロイ: Autopilot は、最もパフォーマンスの高いモデルを特定したら、モデルアーティファクトと API を公開するエンドポイントを生成して、モデルを自動的にデプロイするオプションを提供します。外部アプリケーションはエンドポイントにデータを送信し、対応する予測や推論を受信することができます。

Autopilot は、最大数百 GB の大規模データセットでの機械学習モデルの構築をサポートしています。

次の図は、Autopilot によって管理されるこの AutoML プロセスのタスクの概要を示しています。


      Amazon  SageMaker Autopilot AutoML プロセスの概要。

機械学習プロセスにどれだけ慣れているかとコーディング経験に応じて、さまざまな方法で Autopilot を使用できます。

  • Studio Classic UI を使用すると、ユーザーはコードなしのエクスペリエンスを選択するか、何らかのレベルの人間による入力を選択できます。

    注記

    Studio Classic UI では、回帰や分類などの問題タイプの表形式データから作成された実験のみを使用できます。

  • AutoML API を使用すると、コーディングの経験を持つユーザーは、利用可能な SDKs を使用して AutoML ジョブを作成できます。このアプローチでは、柔軟性とカスタマイズオプションが向上し、すべての問題タイプで使用できます。

現在、Autopilot は以下の問題タイプをサポートしています。

注記

表形式データに関連するリグレッションまたは分類の問題の場合、ユーザーは Studio Classic ユーザーインターフェイスまたは API リファレンス の 2 つのオプションから選択できます。

テキストと画像の分類、時系列予測、大規模言語モデルの微調整などのタスクは、Autopilot API のバージョン 2 でのみ使用できます。Python ユーザーの場合、 AWS SDK for Python (Boto3) を使用することをお勧めします。Amazon SageMaker Python SDK は現在、Autopilot API バージョン 2 ではサポートされていません。

ユーザーインターフェイスの利便性を好むユーザーは、Amazon SageMaker Canvas を使用して、事前トレーニング済みのモデルや生成 AI 基盤モデルにアクセスしたり、特定のテキスト、イメージ分類、予測ニーズ、生成 AI に合わせたカスタムモデルを作成したりできます。

さらに、Autopilot は、個々の特徴量の重要性を示すレポートを自動的に生成して、モデルが予測を行う方法をユーザーが理解できるようにします。これにより、リスクチームとコンプライアンスチーム、外部規制機関が使用できる、予測に影響を与える要素に関する透明性とインサイトが得られます。また、Autopilot は、評価メトリクスの要約、混同行列、受信者操作特性曲線や適合率-再現率曲線などのさまざまな視覚化を包含するモデルパフォーマンスレポートも提供します。各レポートの具体的なコンテンツは、Autopilot 実験の問題タイプによって異なります。

Autopilot 実験で最適なモデル候補の説明可能性レポートとパフォーマンスレポートは、テキスト、画像、表形式のデータ分類問題タイプで使用できます。

リグレッションや分類などの表形式のデータユースケースでは、Autopilot は、データの探索と最適なパフォーマンスのモデルを見つけるために使用されるコードを含むノートブックを生成することで、データがどのようにラングされ、モデル候補がどのように選択、トレーニング、チューニングされたかをより詳細に可視化します。これらのノートブックはインタラクティブで探索的な環境を提供し、さまざまな入力の影響や実験におけるトレードオフについて学習するのに役立ちます。Autopilot が提供するデータ探索と候補定義ノートブックに独自の変更を加えることにより、よりパフォーマンスの高いモデル候補でさらに実験することもできます。

Amazon では SageMaker、使用した分に対してのみ料金が発生します。またはその他の SageMaker AWS サービス内の基盤となるコンピューティングリソースとストレージリソースは、使用量に基づいてお支払いいただきます。の使用コストの詳細については SageMaker、「Amazon SageMaker 料金表」を参照してください。