翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
SageMaker オートパイロット
アマゾン SageMaker オートパイロットは、機械学習モデル(AutoML)の構築と展開のプロセスを自動化することにより、機械学習ワークフローのさまざまな段階を簡素化および加速する機能セットです。
オートパイロットは、オートパイロット(その名の由来)やさまざまなレベルのガイダンスで使用できる以下の主要なタスクを実行することで、自動操縦で使える重要なタスクについてさらに実行することで、自動操縦を行うこともできます。
-
データ分析と前処理:オートパイロットは、特定の問題タイプを特定し、欠損値を処理し、データを正規化し、特徴を選択し、モデルトレーニング用のデータを全体的に準備します。
-
モデル選択:オートパイロットは、さまざまなアルゴリズムを検討し、相互検証リサンプリング手法を使用して、あらかじめ定義された客観的指標に基づいてアルゴリズムの予測品質を評価する指標を生成します。
-
ハイパーパラメータ最適化:Autopilot は最適なハイパーパラメータ構成の検索を自動化します。
-
モデルトレーニングと評価:オートパイロットは、さまざまなモデル候補のトレーニングと評価のプロセスを自動化します。データをトレーニングセットと検証セットに分割し、選択したモデル候補をトレーニングデータを使用してトレーニングし、検証セットの目に見えないデータに基づいてパフォーマンスを評価します。最後に、最適化されたモデル候補をパフォーマンスに基づいてランク付けし、最もパフォーマンスの高いモデルを特定します。
-
モデルの展開:オートパイロットは、最もパフォーマンスの高いモデルを特定すると、モデルアーティファクトと API (アプリケーションプログラミングインターフェイス) を公開するエンドポイントを生成することで、モデルを自動的にデプロイするオプションを提供します。外部アプリケーションはエンドポイントにデータを送信し、対応する予測や推論を受け取ることができます。
オートパイロットは、最大数百GBの大規模なデータセットでの機械学習モデルの構築をサポートします。
以下は、Autopilotによって管理されるこのAutoMLプロセスのタスクの概要を以下に示します。

機械学習のプロセスやコーディングに慣れているかどうかによって、オートパイロットをさまざまな方法で使用できます。
-
Amazon では、人間による追加入力を必要としない完全自動化モード SageMaker スタジオ UI。このアプローチでは、コーディングや技術的な知識は最小限で済みます。Studio UI から利用できるのは、回帰や分類などの問題タイプについて表形式のデータから作成されたテストだけです。
-
Amazon では、人間が入力して特定のオプションやパラメータを選択することができます。 SageMaker スタジオ UI。ユーザーは、特定のオプションとパラメーター値を選択することで、機械学習実験の作成をより適切にカスタマイズおよび制御できます。
-
SDK を使用したコード実装。コーディングの経験があれば、利用可能なソフトウェア開発キット(SDK)を使用してから再実行を行うこともできます。このアプローチにより、柔軟性が向上し、カスタマイズオプションも増えます。
オートパイロットは現在、以下のタイプの問題をサポートしています。
-
回帰分類、バイナリ分類、マルチクラス分類CSV または Parquet ファイルとしてフォーマットされた表形式のデータで、各列に特定のデータ型のフィーチャが含まれ、各行に観測が含まれる、CSV または Parquet ファイルとしてフォーマットされた表形式のデータを使用します。使用できる列データ型には、数値、カテゴリ、テキスト、およびカンマで区切られた数値の文字列で構成される数値、カテゴリ、テキスト、および時系列が含まれます。
-
テキスト分類CSV または Parquet ファイルとしてフォーマットされたデータで、1 つの列には分類する文を、もう 1 つの列には対応するクラスラベルを指定します。
-
画像分類PNG、JPEG、または両方の組み合わせなどの画像形式を使用。
-
時系列予測CSV または Parquet ファイルとしてフォーマットされた時系列データを使用します。
注記
表形式データに関係する回帰問題や分類問題では、Studio ユーザーインターフェイスを使用するか、次の 2 つのオプションから選択できます。API リファレンス。
テキストや画像の分類、時系列予測などのタスクは、最新バージョンでのみ利用できます。 SageMaker API。便利なユーザーインターフェースを好むユーザーは、アマゾン SageMaker キャンバス事前にトレーニングされたモデルにアクセスしたり、特定のテキスト、画像分類、予測のニーズに合わせたカスタムモデルを作成したりできます。
さらに、オートパイロットは、個々の機能の重要性を示すレポートを自動的に生成することで、モデルがどのように予測を行うかをユーザーが理解するのに役立ちます。これにより、予測に影響を及ぼす要因について透明性と洞察が得られ、リスクやコンプライアンスのチームや外部の規制当局が利用できるように、予測に影響を及ぼす要因について透明性と洞察が得られるようになります。オートパイロットは、評価指標の要約、混同マトリックス、受信機動作特性曲線や精度リコール曲線などのさまざまな視覚化を含むモデル性能レポートも提供します。各レポートの具体的な内容は、自動操縦実験の問題の種類によって異なるため、各レポートの具体的な内容は異なります。
オートパイロットの説明可能性レポートとパフォーマンスレポートは、すべての問題タイプについて最適なモデル候補を用意しています。
回帰分析や分類などの表形式データのユースケースでは、オートパイロットは、データを調べて最もパフォーマンスの高いモデルを見つけるために使用されたコードを含むノートブックを生成することで、データがどのようにラングリングされたか、モデル候補がどのように選択、トレーニング、調整されたかをさらに可視化します。これらのノートブックは、さまざまな入力の影響や実験におけるトレードオフについて学ぶのに役立つ、インタラクティブで実験を行う際のトレードオフについて学ぶのに役立つ、インタラクティブで実験を行うための実験を行うための実験を行う際に役立つインタラクティブな実験を行うための環境を提供するものです。オートパイロットが提供するデータ探索および候補について独自の変更を行うことで、よりパフォーマンスの高いモデルについてさらに実験を行うこともできます。
アマゾンで SageMaker、使用した分のみをお支払いいただきます。その中の基盤となるコンピューティングリソースとストレージリソースの料金を支払う SageMaker またはその他AWS使用状況に基づくサービス。使用コストについての詳細について SageMaker、参照アマゾン SageMaker価格設定