SageMaker 組み込みアルゴリズムを使用する - アマゾン SageMaker

英語の翻訳が提供されている場合で、内容が矛盾する場合には、英語版がオリジナルとして取り扱われます。翻訳は機械翻訳により提供されています。

SageMaker 組み込みアルゴリズムを使用する

機械学習アルゴリズムは、サンプルデータを使用して、回答が必要なビジネス上の質問に対応する一般化されたソリューション (モデル) を作成します。サンプルデータを使用してモデルを作成したら、一連の新しいデータの、同じビジネス上の質問に答えることができます。これは、推論の取得とも呼ばれます。

SageMaker は、さまざまな問題のタイプに使用可能な、いくつかの組み込み機械学習アルゴリズムを提供します。

ビジネス上の質問に対応するモデルを作成するため、まず最初のステップは解決が必要な問題について理解することです。具体的には、必要な回答の形式によって選択するアルゴリズムが変わります。たとえば、ユーザーが銀行のマーケティングマネージャーで、新規顧客を獲得するためのダイレクトメールキャンペーンを実施するとします。候補として考えられる回答の形式について見てみましょう。

  • 個別のカテゴリに適合する回答。たとえば、以下の質問への回答です。

     

    • 「過去の顧客の反応からして、この特定の顧客にメールをしたほうがよいでしょうか。」 この質問に対する回答は、2 つのカテゴリに分類されます。「はい」または「いいえ」です。この場合は、メールキャンペーンの受取人を絞り込むという回答を使用します。

       

    • 「過去の顧客の区分けからすると、この顧客はどのセグメントに分類されますか。」 回答は、「子どもが巣立った親」、「郊外に住む家庭」、「都会に住む専門職」などに分類されるかもしれません。これらの区分けを使用して、誰がメールを受け取るかを決定することができます。

       

    このタイプの個別分類の問題について、SageMaker は 2 つのアルゴリズム、線形学習アルゴリズム および XGBoost アルゴリズム を用意しています。次のハイパーパラメータを設定して、これらのアルゴリズムが個別の結果を生成するように指示します。

     

    • 線形学習者アルゴリズムでは、predictor_type ハイパーパラメータを binary_classifier に設定します。

       

    • の XGBoost アルゴリズム、 objective ハイパーパラメータから reg:logistic.

     

  • 定量的回答—次の質問について考えてください。「過去のメーリングからの投資収益率(ROI)に基づいて、この顧客をメーリングする場合のROIはどのくらいですか?」 この場合、ROI を使用してメールキャンペーンの顧客の対象を絞ります。これらの量的な分析の問題については、線形学習アルゴリズムXGBoost アルゴリズム アルゴリズムを使用することもできます。次のハイパーパラメータを設定して、これらのアルゴリズムが量的な結果を生成するように指示します。

     

    • 線形学習者アルゴリズムでは、predictor_type ハイパーパラメータを regressor に設定します。

       

    • の XGBoost アルゴリズム、 objective ハイパーパラメータから reg:linear.

     

  • 個別の推奨事項の形での回答—次の質問について考えてください。メーリングに対する過去の回答に基づき、各顧客に推奨されるコンテンツは何ですか? この場合に必要なのは、顧客にメールを送付するかどうかではなく、何を送付するかどうかについての推奨事項です。この問題について、SageMaker では 因数分解機アルゴリズム アルゴリズムを用意しています。

     

前述の例のすべての質問は、回答を含むサンプルデータがあることに依存しています。時には、回答を含むサンプルデータを必要としない場合や、取得できない場合があります。これは、回答によってグループが識別される問題に当てはまります。以下に例を示します。

  • 「現在の顧客と、見込み顧客を属性に基づいて 10 のグループに分けたいです。どのようにグループ化すればよいですか? " 現在の顧客の割合が最も高いグループの顧客にメールを送信するよう選択できます。つまり、一連の同じ属性に基づいて、現在の顧客に最もよく似ている見込み顧客です。このタイプの問題について、SageMaker では K-Means アルゴリズム を用意しています。

     

  • 「これらの顧客を差別化する属性は何ですか。また、これらの側面から見たそれぞれの顧客の価値は何ですか。」 これらの回答を使用して、現在の顧客および見込み顧客を単純化し、これらの顧客の属性をより一層理解できるようになります。このタイプの問題について、SageMaker では 主成分分析法 (PCA) アルゴリズム アルゴリズムを用意しています。

これらの汎用アルゴリズムに加えて、SageMaker では特定のユースケースに合わせてカスタマイズされたアルゴリズムを用意しています。具体的には以下のとおりです。