翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
カスタムモデルを構築する
アマゾンを使う SageMaker Canvas で、インポートしたデータセットに基づいてカスタムモデルが作成されます。構築したモデルを使用して、新しいデータで予測を行います。 SageMaker Canvas データセットの情報により Canvas 情報を使用して、最大 250 のモデルを作成し、最もパフォーマンスの高いモデルを選択します。
モデルの構築を開始すると、Canvas は 1 つ以上のモデルを自動的に推奨します。モデルタイプ。モデルタイプは、以下のいずれかに分類されます。
-
数値予測— これは退行機械学習で。数値予測モデルタイプは、数値データを予測する場合に使用します。たとえば、住宅の平方フィートなどの特徴に基づいて住宅価格を予測したい場合があります。
-
カテゴリ予測。— これは分類機械学習で。データをグループに分類する場合は、以下のカテゴリ予測モデルタイプを使用します。
-
2 カテゴリ予測— 2 カテゴリ予測モデルタイプ (別名:バイナリ分類機械学習で) データについて予測したいカテゴリが 2 つあるとき。たとえば、顧客が解約する可能性が高いかどうかを判断したい場合があります。
-
3+ カテゴリ予測。— 3+ カテゴリ予測モデルタイプ (別名) を使用マルチクラス分類機械学習で) データについて予測したいカテゴリが 3 つ以上ある場合。たとえば、以前の支払いなどの特徴に基づいて、顧客のローン状況を予測したい場合があります。
-
-
時系列予測— ある期間にわたって予測を行いたい場合は、時系列予測を使用してください。例えば、次の四半期に販売する商品の数を予測したいかもしれません。時系図を作成するアマゾンでの時系列予測 SageMaker キャンバス。
-
画像予測— シングルラベル画像予測モデルタイプ (別名) を使用シングルラベル画像分類(機械学習で) 画像にラベルを付けたいとき。たとえば、商品のイメージにあるさまざまな種類の製造上の欠陥を分類したい場合があります。
-
テキスト予測の取得— マルチカテゴリのテキスト予測モデルタイプ (別名) を使用マルチクラステキスト分類機械学習 (機械学習) では、テキストの一部にラベルを割り当てたい場合に使用します。たとえば、ある商品のカスタマーレビューのデータセットがあって、顧客がその商品を気に入ったか嫌いかを判断したいとします。特定の文章がそうであるかどうかをモデルに予測させることもできます。
Positive
、Negative
、またはNeutral
。
各モデルタイプでサポートされる入力データタイプの表については、を参照してください。カスタムモデルを使う。
作成する表形式データモデル (数値モデル、カテゴリ予測モデル、時系列予測モデル、テキスト予測モデルを含む) ごとに、次のものを選択します。ターゲット列。[Target column] (ターゲット列) は、予測する情報を含む列です。たとえば、利用者がサブスクリプションをキャンセルしたかどうかを予測するモデルを構築する場合、ターゲット列以下のいずれかのデータポイントが含まれます。yes
またはno
誰かのキャンセル状況について。
画像予測モデルの場合は、ラベルが割り当てられた画像のデータセットを使用してモデルを構築します。提供したラベルのない画像については、モデルはラベルを予測します。たとえば、画像が猫か犬かを予測するモデルを作成する場合、モデルを作成するときに猫または犬というラベルの付いた画像を提供します。そうすれば、モデルはラベルの付いていない画像を受け入れ、それらが猫か犬かを予測できます。
モデルを作成される場合。
モデルを作成するには、次のコマンドを使用できます。クイックビルドまたは標準ビルド。ザ・クイックビルドビルド時間は短くなりますが、スタンダードビルド一般的に、精度は高くなります。次の表は、各モデルとビルドタイプの平均ビルド時間と、各ビルドタイプに必要なデータポイントの最小数と最大数をまとめたものです。
制限 | 数値予測とカテゴリを示しています。 | 時系列予測 | 画像予測 | テキスト予測の取得 |
---|---|---|---|---|
クイックビルド時間 |
2 ~ 20 分 |
2 ~ 20 分 |
15‐30 分 |
15‐30 分 |
標準ビルドアクセス許可 |
2 ~ 4 時間 |
2 ~ 4 時間 |
2 ~ 5 時間 |
2 ~ 5 時間 |
クイックビルドの最大エントリ (行または画像) 数 |
50,000 |
50,000 |
5000 |
7500 |
実行中にログアウトした場合クイックビルド再度ログインするまでビルドが中断される可能性があります。再度ログインすると、Canvas は再開します。クイックビルド。
Canvas は、モデルタイプに応じて、データセットの残りの情報を使用して値を予測します。
-
カテゴリ予測では、Canvas は各行を以下のいずれかのカテゴリに分類します。ターゲット列。
-
数値予測では、Canvas はデータセット内の情報を使用して、データセット内の数値を予測します。ターゲット列。
-
時系列予測では、Canvas は履歴データを使用して値を予測します。ターゲット列future 的には。
-
画像予測では、Canvas はラベルが割り当てられた画像を使用して、ラベルの付いていない画像のラベルを予測します。
-
テキスト予測では、Canvas はラベルが割り当てられたテキストデータを分析して、ラベルの付いていないテキストが一部でもラベルを予測します。
モデルを作成する
注記
数値予測、カテゴリ予測、時系列予測モデルでは、次の機能を使用できます。
モデルを作成する前に、データをフィルタリングしたり、高度な変換を使用してデータを準備したりできます。モデル構築用のデータ準備の詳細については、以下を参照してください。高度な変換機能を使ってデータを準備します。。
また、ビジュアライゼーションと分析を使用してデータを調べ、どの機能をモデルに含めるのが最適かを判断することもできます。詳細については、次を参照してください。データの調査と分析。
モデルのプレビュー、データセットの検証、モデルの構築に使用されるランダムサンプルのサイズの変更など、その他の機能の詳細については、を参照してください。モデルのプレビュー。
複数の列がある表形式のデータセット (カテゴリ、数値、または時系列予測モデルタイプを構築するためのデータセットなど) では、行にデータポイントが欠落している可能性があります。Canvas はモデルを構築する際、欠損値を自動的に追加します。Canvas は、データセット内の値を使って、欠損値を数学的に近似します。モデル精度を最も高くするために、欠落しているデータが見つかった場合は、その値を追加することをお勧めします。欠損データ機能はテキスト予測モデルや画像予測モデルではサポートされていないことに注意してください。
開始方法
カスタムモデルの作成を開始するモデルの構築作成するモデルのタイプに応じた手順に従います。