ML モデルの作成 - Amazon Machine Learning

Amazon Machine Learning サービスの更新や、その新しいユーザーの受け入れは行っていません。このドキュメントは既存のユーザー向けに提供されていますが、更新は終了しています。詳細については、「Amazon Machine Learning とは」を参照してください。

ML モデルの作成

データソースを作成したら、ML モデルを作成できます。Amazon Machine Learning コンソールを使用してモデルを作成する場合は、デフォルト設定を使用するか、カスタムオプションを適用してモデルをカスタマイズするかを選択できます。

カスタムオプションは次のとおりです。

  • 評価設定: Amazon ML に入力データの一部を保持させ、ML モデルの予測品質を評価させることができます。評価の詳細については、「ML モデルの評価」を参照してください。

  • レシピ: レシピは Amazon ML に、モデルトレーニングに使用できる属性と属性変換を知らせます。Amazon ML レシピの詳細については、「データレシピを使用した機能変換」を参照してください。

  • トレーニングパラメータ: パラメータは、トレーニングプロセスおよび結果として生じる ML モデルの特定のプロパティを制御します。トレーニングパラメータの詳細については、「トレーニングパラメータ」を参照してください。

これらの設定の値を選択または指定するには、ML モデル作成ウィザードを使用するときに [カスタム] オプションを選択します。Amazon ML にデフォルト設定を適用する場合は、[Default] (デフォルト) を選択します。

ML モデルを作成すると、Amazon ML はターゲット属性の属性タイプに基づいて、使用する学習アルゴリズムのタイプを選択します。(ターゲット属性とは「正しい」回答を含む属性のことです。) ターゲット属性がバイナリの場合、Amazon ML はロジスティック回帰アルゴリズムを使用するバイナリ分類モデルを作成します。ターゲット属性がカテゴリの場合、Amazon ML は多項ロジスティック回帰アルゴリズムを使用する複数クラスモデルを作成します。ターゲット属性が数値の場合、Amazon ML は直線回帰アルゴリズムを使用する回帰モデルを作成します。

前提条件

Amazon ML コンソールを使用して ML モデルを作成する前に、モデルのトレーニング用とモデル評価用の 2 つのデータソースを作成する必要があります。2 つのデータソースをまだ作成していない場合は、「ステップ 2: トレーニングデータソースを作成する」のチュートリアルを参照してください。

デフォルトオプションで ML モデルを作成する

Amazon ML で以下のことを行う場合は、[Default] (デフォルト) オプションを選択します。

  • 入力データを分割して最初の 70% をトレーニングに使用し、残りの 30% を評価に使用します

  • トレーニングデータソースで収集された統計 (入力データソースの 70%) に基づいてレシピを提案します

  • デフォルトのトレーニングパラメータを選択します

デフォルトのオプションを選択するには
  1. Amazon ML コンソールで [Amazon Machine Learning] を選択してから、[ML models] (ML モデル) を選択します。

  2. [ML モデル] の概要ページで、[新しい ML モデルを作成] を選択します。

  3. [入力データ] ページで、[S3 データを指すデータソースを既に作成しました] が選択されていることを確認します。

  4. 表からデータソースを選択し、[続行] を選択します。

  5. [ML モデル設定] ページの [ML モデル名] に ML モデルの名前を入力します。

  6. [トレーニングおよび評価設定] で、[デフォルト] が選択されていることを確認します。

  7. [Name this evaluation] (この評価に名前を設定) で、評価の名前を入力して [Review] (確認) を選択します。Amazon ML により残りのウィザードはスキップされ、[Review] (確認) ページに移動します。

  8. データを確認し、モデルと評価に適用しないデータソースからコピーしたタグをすべて削除し、[完了] を選択します。

カスタムオプションで ML モデルを作成する

ML モデルのカスタマイズを行うと以下のことができます。

  • 独自のレシピを提供します。独自のレシピを提供する方法の詳細については、「レシピ形式のリファレンス」を参照してください。

  • トレーニングパラメータを選択します。トレーニングパラメータの詳細については、「トレーニングパラメータ」を参照してください。

  • デフォルトの 70/30 以外のトレーニング/評価分割比を選択するか、または、評価のために準備した別のデータソースを提供してください。分割方法の詳細については、「データの分割」を参照してください。

これらの設定のデフォルト値を選択することもできます。

デフォルトのオプションを使用してすでにモデルを作成していて、モデルの予測パフォーマンスを向上させたい場合は、[カスタム] オプションを使用してカスタマイズされた設定で新しいモデルを作成します。たとえば、機能変換をレシピに追加する、または、トレーニングパラメータのパスの数を増やすことができます。

カスタムオプションでモデルを作成するには
  1. Amazon ML コンソールで [Amazon Machine Learning] を選択してから、[ML models] (ML モデル) を選択します。

  2. [ML モデル] の概要ページで、[新しい ML モデルを作成] を選択します。

  3. データソースをすでに作成している場合は、[入力データ] ページで、[S3 データを指すデータソースを既に作成しました] を選択します。表からデータソースを選択し、[続行] を選択します。

    データソースを作成する必要がある場合は、[データは S3 にあり、データソースを作成する必要があります] を選択した後、[続行] を選択します。[Create a Datasource (データソースの作成)] ウィザードにリダイレクトされます。データが [S3] または [Redshift] にあるかを指定し、[検証] を選択します。データソースを作成する手順を完了します。

    データソースを作成したら、[Create ML Model (ML モデルの作成)] ウィザードの次のステップにリダイレクトされます。

  4. [ML モデル設定] ページの [ML モデル名] に ML モデルの名前を入力します。

  5. [Select training and evaluation settings (トレーニングおよび評価設定の選択)] で、[カスタム] を選択した後、[続行] を選択します。

  6. [レシピ] ページで、customize a recipe を行えます。レシピをカスタマイズしない場合は、Amazon ML がレシピを提案します。[Continue] (続行) をクリックします。

  7. [詳細設定] ページで、[最大 ML モデルサイズ]、[データパスの最大数]、[トレーニングデータのシャッフルタイプ]、[正則化タイプ]、および [正則化の量] を指定します。これらを指定しない場合、Amazon ML はデフォルトのトレーニングパラメータを使用します。

    これらのパラメータおよびデフォルトの詳細については、「トレーニングパラメータ」を参照してください。

    [Continue] (続行) をクリックします。

  8. [評価] ページで、すぐに ML モデルを評価するかどうかを指定します。ML モデルをすぐに評価しない場合は、[Review (レビュー)] を選択します。

    ML モデルを今すぐ評価する場合

    1. [この評価に名前を設定] に、評価の名前を入力します。

    2. [Select evaluation data] (評価データを選択) で、Amazon ML が評価のために入力データの一部を保持するかどうかを選択して、そうするのであれば、データソースの分割方法、または評価のために異なるデータソースを提供することを選択します。

    3. [Review] (レビュー) を選択します。

  9. [Review (レビュー)] ページで、選択を編集し、モデルと評価に適用しないデータソースからコピーしたタグをすべて削除して、[終了] を選択します。

モデルを作成した後は、「ステップ 4: ML モデルの予測パフォーマンスを確認し、スコアのしきい値を設定する」を参照してください。