Amazon を使用してモデル開発を自動化する SageMaker Autopilot - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon を使用してモデル開発を自動化する SageMaker Autopilot

アマゾン SageMaker Autopilot は、自動機械学習 (AutoML) プロセスの主要タスクを自動化する機能セットです。データを探索し、問題タイプに関連するアルゴリズムを選択して、モデルのトレーニングとチューニングを容易にするようにデータを準備します。Autopilot は、適切な場合すべての候補アルゴリズムに交差検証リサンプリング手順を自動的に適用し、それらがこれまでトレーニングを行っていないデータを予測する能力をテストします。また、機械学習モデル候補の予測品質を評価するメトリクスを生成します。AutoML プロセスを構成するこれらの主要タスクを自動化することで、機械学習エクスペリエンスを簡素化します。パフォーマンスに基づいて、テストされたすべての最適化モデルをランク付けします。デプロイ可能な最高パフォーマンスのモデルを、通常必要とされる時間のほんの一部で見つけることができます。

Autopilot は、オートパイロット (つまり名前) で、さまざまな程度のヒューマンガイダンスで、Amazonのコードなしで、さまざまな方法で使用できます。 SageMaker Studio、またはいずれかのコードを使用してAWSSDK Autopilot は、現在、回帰、二項分類およびマルチクラス分類の問題タイプをサポートしています。各列に特定のデータ型の特徴を含み、各行に観測値を含む、CSV または Parquet ファイルとしてフォーマットされた表形式のデータをサポートしています。使用可能な列データ型には、数値、カテゴリ、テキスト、およびカンマ区切りの数値の文字列で構成された時系列が含まれます。Autopilot は、最大 100 GB の大規模なデータセットでの機械学習モデルの構築をサポートします。

また、Autopilot は、Amazon 向けに開発された特徴属性アプローチを使用してモデルがどのように予測するかを説明するのに役立ちます SageMaker Clarify Autopilot は、最適な候補によって行われた予測の各特徴の重要度を示すレポートを自動的に生成します。この説明性機能により、機械学習モデルを理解しやすくなりますAWS顧客。生成されたモデルガバナンスレポートは、リスクとコンプライアンスのチーム、および外部の規制当局への情報提供に使用できます。

テストされた各候補について、どのようにデータが操作されたか、また、どのようにモデルが選択、トレーニング、チューニングされたかを完全に把握できます。これは、データの探索と最適な候補の発見に使用されるコードを含む、トライアルごとにAutopilot が生成するノートブックによって提供されます。このノートブックには、機械学習実験について学習し、実行するのに役立つ教育ツールも用意されています。Autopilot によって明らかになったさまざまなデータ探索と候補定義のノートブックを精査することで、実験で行われたさまざまな入力とトレードオフの影響について学習できます。また、ノートブックに独自の変更を加えてから再実行することで、よりパフォーマンスの高い候補についてさらに実験を行うこともできます。

次の図は、Autopilot によって管理される AutoML プロセスの主要タスクの概要を示しています。


      Amazon で使用される AutoML プロセスの概要 SageMaker Autopilot

Amazon SageMaker では、料金は実際に使用する分に対してのみ発生します。内の基礎となるコンピューティングおよびストレージのリソースに対して料金を支払います。 SageMaker または、AWS使用状況に応じてサービス。SageMaker の使用料金の詳細については、「Amazon SageMaker の料金」を参照してください。