SageMaker オートパイロット - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker オートパイロット

重要

2023 年 11 月 30 日の時点で、オートパイロットのユーザーインターフェイスは、更新された Amazon Studio エクスペリエンスの一環として Amazon SageMaker Canvas に移行されます。 SageMaker SageMaker Canvas により、データサイエンティストはデータ準備、機能エンジニアリング、アルゴリズム選択、トレーニングとチューニング、推論、継続的なモデルモニタリングなどのタスクを、コーディングなしで行うことができます。 SageMaker Canvasは、コンピュータービジョン、需要予測、インテリジェントサーチ、ジェネレーティブAIなど、さまざまなユースケースをサポートしています。

以前の Studio SageMaker で使用していた Amazon Studio Classic のユーザーは、引き続き Studio Classic のオートパイロット UI を使用できます。コーディング経験のあるユーザーは、サポートされているどの SDK でも、すべての API リファレンスを技術的な実装に引き続き使用できます

これまで Studio Classic で Autopilot を使用していて、 SageMaker Canvas に移行したい場合は、Canvas アプリケーションを作成して使用できるように、ユーザープロファイルまたは IAM ロールに追加の権限を付与する必要がある場合があります。 SageMaker 詳細については、「Studio Classic のオートパイロットから Canvas に移行します。 SageMaker 」を参照してください。

このガイドの UI 関連の説明はすべて、Amazon Canvas に移行する前のオートパイロットのスタンドアロン機能に関するものです。 SageMaker 以下の手順に従うユーザーは Studio Classic を使用してください。

Amazon SageMaker Autopilot は、機械学習モデル (AutoML) の構築とデプロイのプロセスを自動化することで、機械学習ワークフローのさまざまな段階を簡素化および迅速化する機能セットです。

オートパイロットは以下の主要タスクを実行します。これらのタスクは自動操縦でも、さまざまな程度の人間によるガイダンスでも使用できます。

  • データ分析と前処理: Autopilot は、特定の問題タイプを識別し、欠落した値を処理し、データを正規化し、特徴量を選択して、全体的にモデルトレーニング用データを準備します。

  • モデルの選択: Autopilot は、さまざまなアルゴリズムを調べ、交差検証リサンプリングテクニックを使用して、事前定義された目標メトリクスに基づいてアルゴリズムの予測品質を評価するメトリクスを生成します。

  • ハイパーパラメータ最適化:オートパイロットは、最適なハイパーパラメータ構成の検索を自動化します。

  • モデルのトレーニングと評価:オートパイロットは、さまざまなモデル候補のトレーニングと評価のプロセスを自動化します。データをトレーニングおよび検証セットに分割し、トレーニングデータを使用して選択したモデル候補をトレーニングし、検証セットの未見データに基づいてパフォーマンスを評価します。最後に、パフォーマンスに基づいて最適化されたモデル候補をランク付けし、最もパフォーマンスの高いモデルを特定します。

  • モデルのデプロイ:オートパイロットは、最もパフォーマンスの高いモデルを特定すると、モデルアーティファクトと API を公開するエンドポイントを生成することで、モデルを自動的にデプロイするオプションを提供します。外部アプリケーションはエンドポイントにデータを送信し、対応する予測や推論を受信することができます。

Autopilot は、最大数百 GB の大規模データセットでの機械学習モデルの構築をサポートしています。

次の図は、Autopilotによって管理されるこのAutoMLプロセスのタスクの概要を示しています。

Amazon SageMaker オートパイロット AutoML プロセスの概要

機械学習プロセスにどれだけ慣れているかとコーディング経験に応じて、さまざまな方法で Autopilot を使用できます。

  • Studio Classic UI を使用すると、ユーザーはコーディング不要のエクスペリエンスか、ある程度の人間による入力を行うかを選択できます。

    注記

    Studio Classic UI では、回帰や分類などの問題タイプについて表形式のデータから作成されたテストのみを使用できます。

  • AutoML API を使用すると、コーディング経験のあるユーザーは、利用可能な SDK を使用して AutoML ジョブを作成できます。このアプローチは柔軟性が高く、カスタマイズオプションも豊富で、あらゆるタイプの問題に対応できます。

現在、Autopilot は以下の問題タイプをサポートしています。

注記

表形式データに関する回帰問題や分類問題では、Studio Classic ユーザーインターフェイスを使用するか API リファレンスを使用するかの 2 つのオプションから選択できます。

テキストや画像の分類、時系列予測、大規模言語モデルの微調整などのタスクは、AutoML REST APIのバージョン2でのみ利用できます。選択した言語が Python の場合は、Amazon SageMaker Python SDK の AutoMLv2 オブジェクトを直接参照できますAWS SDK for Python (Boto3)

便利なユーザーインターフェイスを好むユーザーは、Amazon SageMaker Canvas を使用して事前トレーニング済みのモデルやジェネレーティブ AI 基盤モデルにアクセスしたり、特定のテキスト、画像分類、予測ニーズ、またはジェネレーティブ AI に合わせたカスタムモデルを作成したりできます。

さらに、Autopilot は、個々の特徴量の重要性を示すレポートを自動的に生成して、モデルが予測を行う方法をユーザーが理解できるようにします。これにより、リスクチームとコンプライアンスチーム、外部規制機関が使用できる、予測に影響を与える要素に関する透明性とインサイトが得られます。また、Autopilot は、評価メトリクスの要約、混同行列、受信者操作特性曲線や適合率-再現率曲線などのさまざまな視覚化を包含するモデルパフォーマンスレポートも提供します。各レポートの具体的なコンテンツは、Autopilot 実験の問題タイプによって異なります。

テキスト、画像、表形式のデータ分類問題タイプについて、オートパイロット実験で最適なモデル候補を説明できるレポートとパフォーマンスレポートが用意されています。

回帰や分類などの表形式データのユースケースでは、オートパイロットは、データを探索して最もパフォーマンスの高いモデルを見つけるために使用されるコードを含むノートブックを生成することで、データがどのようにラングリングされたか、モデル候補がどのように選択、トレーニング、調整されたかをさらに可視化します。これらのノートブックはインタラクティブで探索的な環境を提供し、さまざまな入力の影響や実験におけるトレードオフについて学習するのに役立ちます。Autopilot が提供するデータ探索と候補定義ノートブックに独自の変更を加えることにより、よりパフォーマンスの高いモデル候補でさらに実験することもできます。

Amazon では SageMaker、お支払いいただくのは使用した分のみです。使用量に応じて、 SageMaker AWS または他のサービス内の基盤となるコンピューティングリソースとストレージリソースに対してお支払いいただきます。使用コストの詳細については SageMaker、「Amazon SageMaker 料金表」を参照してください。