Amazon でモデル開発を自動化する SageMaker Autopilot チュートリアル - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon でモデル開発を自動化する SageMaker Autopilot チュートリアル

アマゾン SageMaker Autopilot は、自動機械学習 (AutoML) プロセスの主要タスクを自動化する機能セットです。データを探索し、問題タイプに関連するアルゴリズムを選択して、モデルのトレーニングとチューニングを容易にするようにデータを準備します。Autopilot は、適切な場合すべての候補アルゴリズムに交差検証リサンプリング手順を自動的に適用し、それらがこれまでトレーニングを行っていないデータを予測する能力をテストします。また、機械学習モデル候補の予測品質を評価するメトリクスも生成します。AutoML プロセスを構成するこれらの主要タスクを自動化することで、機械学習エクスペリエンスを簡素化します。パフォーマンスに基づいて、テストされたすべての最適化モデルをランク付けします。デプロイ可能な最高パフォーマンスのモデルを、通常必要とされる時間のほんの一部で見つけることができます。

Autopilot は、オートパイロット (つまり名前)、さまざまな程度のヒューマンガイダンス、コードなしの Amazon など、さまざまな程度のヒューマンガイダンスで使用できます。 SageMaker スタジオ、または次のいずれかを使ったコードでAWSSDK。Autopilot は現在、回帰、二項分類と複数クラス分類の問題タイプをサポートしています。CSV ファイルまたは Parquet ファイルとしてフォーマットした表形式のデータをサポートしています。各列には特定のデータ型の特徴が入り、各行には観測値が入ります。使用可能な列データ型には、数値、カテゴリ、テキスト、およびカンマ区切りの数値の文字列で構成された時系列が含まれます。Autopilot は、数百 GB に達する大規模なデータセットでの機械学習モデルの構築をサポートしています。

また、Autopilot はモデルが Amazon 向けに開発された特徴属性アプローチを使用してどのように予測するかを説明するのに役立ちます。 SageMaker Clarify。Autopilot は、最適候補によって行われた予測の各特徴の重要度を示すレポートを自動的に生成します。この説明可能性機能により、AWS のユーザーは機械学習モデルを理解しやすくなります。生成されたモデルガバナンスレポートは、リスクとコンプライアンスのチーム、および外部の規制当局への情報提供に使用できます。

テストした候補ごとに、データがどのように操作されたか、また、モデルがどのように選択、トレーニング、チューニングされたかを完全に可視化できます。これは、データの探索と最適候補の発見に使用されたコードを含む、トライアルごとに Autopilot が生成するノートブックによって提供されます。このノートブックは、独自の機械学習実験を学習および実行するための教育ツールも提供します。Autopilot によって明らかになったさまざまなデータ探索と候補定義のノートブックを精査することで、実験で行われたさまざまな入力とトレードオフの影響について学習できます。また、ノートブックに独自の変更を加えてから再実行することで、よりパフォーマンスの高い候補についてさらに実験を行うこともできます。

次の図は、Autopilot によって管理される AutoML プロセスの主要タスクの概要を示しています。


      Amazon で使用される AutoML プロセスの概要 SageMaker Autopilot チュートリアル

アマゾンで SageMakerについては、お客様が利用された分のみのお支払いとなります。内部の基礎となるコンピューティングおよびストレージのリソースに対して料金を支払います SageMaker またはその他のAWS使用量に基づくサービス 使用料金の詳細については SageMaker、を参照してくださいアマゾン SageMaker料金