Amazon SageMaker 組み込みアルゴリズムを使用する - Amazon SageMaker

Amazon SageMaker 組み込みアルゴリズムを使用する

機械学習アルゴリズムは、サンプルデータを使用して、回答が必要なビジネス上の質問に対応する一般化されたソリューション (モデル) を作成します。サンプルデータを使用してモデルを作成したら、一連の新しいデータの、同じビジネス上の質問に答えることができます。これは、推論の取得とも呼ばれます。

Amazon SageMaker は、さまざまな問題のタイプに使用可能な、いくつかの組み込み機械学習アルゴリズムを提供します。

ビジネス上の質問に対応するモデルを作成するため、まず最初のステップは解決が必要な問題について理解することです。具体的には、必要な回答の形式によって選択するアルゴリズムが変わります。たとえば、ユーザーが銀行のマーケティングマネージャーで、新規顧客を獲得するためのダイレクトメールキャンペーンを実施するとします。候補として考えられる回答の形式について見てみましょう。

  • 個別のカテゴリに適合する回答。たとえば、以下の質問への回答です。

     

    • 「過去の顧客の反応からして、この特定の顧客にメールをしたほうがよいでしょうか。」 この質問に対する回答は、2 つのカテゴリに分類されます。「はい」または「いいえ」です。 この場合は、メールキャンペーンの受取人を絞り込むという回答を使用します。

       

    • 「過去の顧客の区分けからすると、この顧客はどのセグメントに分類されますか。」 回答は、「子どもが巣立った親」、「郊外に住む家庭」、「都会に住む専門職」などに分類されるかもしれません。 これらの区分けを使用して、誰がメールを受け取るかを決定することができます。

       

    このタイプの個別分類の問題について、Amazon SageMaker は 2 つのアルゴリズム、線形学習アルゴリズム および XGBoost アルゴリズム を用意しています。次のハイパーパラメータを設定して、これらのアルゴリズムが個別の結果を生成するように指示します。

     

    • 線形学習者アルゴリズムでは、predictor_type ハイパーパラメータを binary_classifier に設定します。

       

    • XGBoost アルゴリズムでは、objective ハイパーパラメータを reg:logistic に設定します。

     

  • 量的な回答。この質問について考えてみてください。「過去に送付したメールの投資利益率 (ROI) からすると、この顧客にメールしたときの ROI はいくつですか。」 この場合、ROI を使用してメールキャンペーンの顧客の対象を絞ります。これらの量的な分析の問題については、線形学習アルゴリズムXGBoost アルゴリズム アルゴリズムを使用することもできます。次のハイパーパラメータを設定して、これらのアルゴリズムが量的な結果を生成するように指示します。

     

    • 線形学習者アルゴリズムでは、predictor_type ハイパーパラメータを regressor に設定します。

       

    • XGBoost アルゴリズムでは、objective ハイパーパラメータを reg:linear に設定します。

     

  • 個別の推奨という形式の回答。この質問について考えてみてください。「過去に送付したメールへの反応からすると、それぞれの顧客に推奨されるコンテンツは何でしょうか。」 この場合に必要なのは、顧客にメールを送付するかどうかではなく、何を送付するかどうかについての推奨事項です。この問題について、Amazon SageMaker では 因数分解機アルゴリズム アルゴリズムを用意しています。

     

前述の例のすべての質問は、回答を含むサンプルデータがあることに依存しています。時には、回答を含むサンプルデータを必要としない場合や、取得できない場合があります。これは、回答によってグループが識別される問題に当てはまります。たとえば:

  • 「現在の顧客と、見込み顧客を属性に基づいて 10 のグループに分けたいです。どのようにグループ分けできますか。 " 現在の顧客の割合が最も高いグループの顧客にメールを送信するよう選択できます。つまり、一連の同じ属性に基づいて、現在の顧客に最もよく似ている見込み顧客です。このタイプの問題について、Amazon SageMaker では K-Means アルゴリズム を用意しています。

     

  • 「これらの顧客を差別化する属性は何ですか。また、これらの側面から見たそれぞれの顧客の価値は何ですか。」 これらの回答を使用して、現在の顧客および見込み顧客を単純化し、これらの顧客の属性をより一層理解できるようになります。このタイプの問題について、Amazon SageMaker では 主成分分析法 (PCA) アルゴリズム アルゴリズムを用意しています。

これらの汎用アルゴリズムに加えて、Amazon SageMaker では特定のユースケースに合わせてカスタマイズされたアルゴリズムを用意しています。これには、以下のものが含まれます。