Amazon を作成する SageMaker Autopilot 実験 - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon を作成する SageMaker Autopilot 実験

このガイドでは、Amazon を作成する方法を示します。 SageMaker データを分析し、候補となるモデル定義を含むノートブックを作成できるように、自動操縦実験を行います。これにより、機械学習をすぐに開始できます。

ユーザーインターフェース (UI) を使用して、入力、出力、ターゲット、およびパラメーターを入力して、オートパイロットの実験を実行および評価できます。UI には、モデルの作成に役立つ説明、トグルスイッチ、ドロップダウンメニュー、ラジオボタンなどがあります。実験の実行中に、統計を表示することもできます。実行後、試験を比較して詳細を掘り下げることができます。

次の手順は、Amazon を作成する方法を示しています。 SageMaker パイロット実験としてのオートパイロットの仕事。実験に名前を付け、入力データと出力データの位置を指定し、予測するターゲットデータを指定します。オプションで、解決する機械学習のタイプを指定することもできます。

Autopilot 実験を作成するには
  1. サインインhttps://console.aws.amazon.com/sagemaker/を選択します。スタジオナビゲーションペインから。

  2. がのとき SageMaker Studio コンソールが開くので、を起動する SageMakerスタジオボタン。

  3. 次に、を選択します。アプリを起動するユーザー名を含む行で、スタジオドロップダウンリストから。

  4. を選択します。モデルの自動構築のセンターカードスタジオランチャータブ。「」を参照してください。クイックセットアップガイドStudio を初めて起動する方法の詳細については、こちらをご覧ください。

  5. というタイトルのページAutopilot 実験を作成するを開きます。このページには次のフィールドがあります実験とデータの詳細名前、Amazon S3 バケットの場所、分割率、実験のターゲットなど。

  6. の中に実験とデータの詳細のセクションAutopilot 実験を作成するページで、次の情報を入力します。

    1. 実験名— 現在のアカウントで一意である必要がありますAWS リージョンおよび最大 63 文字の英数字を使用します。ハイフン (-) は使用できますが、スペースは使用できません。

    2. 入力データ-入力データの S3 バケットの場所を指定します。この S3 バケットは現在のものである必要がありますAWS リージョン。URL はs3://フォーマット:アマゾン SageMaker 書き込み権限がある。ファイルは CSV 形式またはパーケット形式とし、500 以上の行が必要です。選択Browse利用可能なパスをスクロールしてPreview入力データのサンプルを表示します。

    3. Is your S3 input a manifest file? (S3 入力はマニフェストファイルですか) - マニフェストファイルには、入力データの他にメタデータが含まれます。メタデータは、データの場所を指定します。Amazon Simple Storage Service(Amazon S3)。データのフォーマット方法や、モデルのトレーニング時に使用するデータセットの属性も指定します。マニフェストファイルは、ラベル付きデータをストリーミングする前処理の代わりに使用できます。パイプモード。

    4. データを自動分割? — Autopilotは、トレーニングデータと検証データ用にデータを80~ 20% に分割できます。カスタムスプリットをご希望の場合は、分割比率を指定する。カスタムデータセットを検証に使用するには、検証セットを指定してください

    5. 出力データの場所 (S3 バケット)-出力データを保存する S3 バケットの場所の名前。このバケットの URL は Amazon S3 形式でなければなりません。ここで Amazon SageMaker 書き込み権限がある。S3 バケットは現在のAWS リージョン。Autopilotでは、入力データと同じ場所にこれを作成することもできます。

  7. 選択次のステップ ターゲットと機能。-ターゲットと機能タブが開きます。

  8. の中にターゲットと機能セクションで、モデル予測のターゲットとして設定する列を選択します。また、学習する特徴を選択し、そのデータ型を変更することもできます。以下のデータ型 (タイプ) を使用できます。Text,Numerical,Categorical,Datetime,SequenceそしてAuto。デフォルトではすべての機能が選択されています。

  9. 選択次のステップ トレーニングメソッド。-トレーニングメソッドタブが開きます。

  10. の中にトレーニングメソッドセクションで、次のトレーニングオプションから選択します。アンサンブル,ハイパーパラメータ最適化 (HPO)または、データセットのサイズに基づいてオートパイロットに自動的に選択させます。

    トレーニングの詳細については、「」を参照してください。Autopilot トレーニングモードのセクショントレーニングモードとアルゴリズムページ。

  11. 選択次のステップ デプロイとアドバンスト設定を開くにはデプロイとアドバンスト設定。設定には、auto 表示エンドポイント名、機械学習の問題タイプ、および実験を実行するための選択肢が含まれます。

  12. 現在、少なくとも 2 つの ml.m5.2xlarge インスタンスを持つことが要件になっています。

    自動デプロイは、次のいずれかの理由で失敗します。

    • リージョン内のエンドポイントインスタンスのデフォルトのリソースクォータが制限を超えています。

    • リージョンのエンドポイントインスタンスの顧客クォータが制限を超えています。

    クォータに関連する障害が発生した場合は、サービス制限の引き上げをリクエストするにとって SageMaker エンドポイントインスタンス。

  13. デプロイ設定— Autopilotはエンドポイントを自動的に作成し、モデルをデプロイします。

    1. 自動生成されたエンドポイントに自動デプロイするか、カスタムデプロイ用のエンドポイント名を指定するには、トグルを次のように設定しますはい自動デプロイ? Amazon からデータをインポートする場合 SageMaker Data Wrangler では、Data Wrangler からの変換の有無にかかわらず、最適なモデルをauto デプロイするオプションが追加されています。

      注記

      Data Wrangler フローに次のような複数行の操作が含まれている場合groupby,joinまたはconcatenateでは、このトランスフォームではauto デプロイできません。詳細については、「」を参照してください。データフローに基づいてモデルを自動的にトレーニング

    2. 詳細設定 (オプション)— オートパイロットには、実験パラメータを手動で設定するための追加コントロールがあります。

      1. 機械学習の問題タイプ-オートパイロットは、機械学習の問題のタイプを選択します。手動で選択したい場合は、機械学習の問題のタイプを選択します。ドロップダウンメニュー。

        1. オート-オートパイロットは、予測する属性の値から問題のタイプを推測します。場合によって SageMaker 正確に推論することはできません。この場合、ジョブを成功させるために値を指定する必要があります。

        2. 二項分類-二項分類は、教師あり学習の一種で、属性に基づいて、事前に定義された相互に排他的な 2 つのクラスのいずれかに個人を割り当てます。たとえば、誰かが病気にかかっているかどうかを判断する診断テストの結果に基づく医療診断。

        3. 回帰-回帰では、従属ターゲット変数の値は、それと相関する 1 つ以上の変数または属性に基づいて推定されます。平方フィートやバスルーム数などの特徴に基づく住宅価格などが例として挙げられます。

        4. 多クラス分類-複数クラス分類は、教師あり学習の一種で、その属性に基づいて複数のクラスのいずれかに個人を割り当てる分類です。政治、金融、哲学など、テキストドキュメントに最も関連性の高いトピックの予測などが例として挙げられます。

      2. 選択次のステップ 確認と作成作成前にオートパイロットの実験の概要を取得できます。

  14. 選択実験を作成する。オートパイロットは、実験の進行状況、生成されたモデルのリスト、およびそれらの作成に使用されたジョブプロファイルを提供します。

注記

不必要な請求が発生しないようにするには: 不要になったモデルをデプロイする場合は、そのデプロイ中に作成されたエンドポイントとリソースを削除します。リージョン別のインスタンス料金に関する情報は、次のURLでご覧いただけます。アマゾン SageMaker 料金