機械学習製品を作成するための要件とベストプラクティス - AWS Marketplace

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

機械学習製品を作成するための要件とベストプラクティス

モデルパッケージとアルゴリズム製品を購入者が簡単にテストできるかを確認することが重要です。以下のセクションでは、機械学習 (ML) 製品リストを作成するための要件と ML 製品のベストプラクティスについて説明します。要件と推奨事項の完全な要約については、「ML 製品リストの要件と推奨事項の要約」を参照してください。

注記

公開された製品がこれらの要件を満たしていない場合は、これらの要件を満たすために AWS Marketplace 担当者から連絡されることがあります。

必須アセット

機械学習製品リストを作成する前に、次の必須アセットがあることを確認してください。

  • Amazon リソースネーム (ARN) – AWS リージョン 発行元の にモデルパッケージまたはアルゴリズムリソースARNの を指定します (「」を参照公開 AWS リージョン でサポート)。

    • モデルパッケージARNの には、次の形式があります。 arn:aws:sagemaker:<region>:<account-id>:model-package/<model-package-name>

    • アルゴリズムARNの には、次の形式があります。 arn:aws:sagemaker:<region>:<account-id>:algorithm/<algorithm-name>

  • 使用状況情報の要件 - 入力、出力、およびコード例に関する詳細を提供します。

  • 入力と出力の要件 - ファイルまたはテキストのいずれかを提供します。

  • Jupyter Notebook の要件 - 製品の使用方法をすべてデモンストレーションします。

ML 製品の一般的なベストプラクティス

使用している機械学習製品について、以下の情報を提供します。

  • 製品の説明には、以下を含めます。

    • モデルの機能

    • ターゲットとなる顧客

    • 最も重要なユースケース

    • モデルのトレーニング方法、または使用されたデータの量

    • パフォーマンスメトリクスと、使用された検証データ

    • 医療機器の場合、モデルが診断用かどうか

  • デフォルトでは、機械学習製品は一般に公開されるよう設定されています。ただし、非公開で製品を作成することもできます。詳細については、「製品リストの作成」を参照してください。

  • (オプション) 有料製品の場合は、顧客に対して 14~30 日間の無料試用期間を提供し、製品を試してもらいます。詳細については、「の機械学習製品の料金 AWS Marketplace」を参照してください。

  • (オプション) モデルパッケージ製品について、商品一覧ページでリアルタイムの製品デモを有効にする場合は、AWS Marketplace Seller Operations チームにお問い合わせください。製品デモでは、見込み客が自分でモデルをサブスクライブしたりデプロイしたりしなくても、出品ページでモデルを直接試すことができます。

使用状況情報の要件

購入者の満足度を高めるには、製品の期待される入力と出力を説明した明確な使用情報 (例を含む) が不可欠です。

新しいバージョンのリソースを製品リストに追加するたびに、使用状況情報を提供する必要があります。

初めて公開する新製品の使用情報を追加するには、 AWS Marketplace 管理ポータル コンソールにサインインします。[製品] ドロップダウンから [機械学習] を選択します。製品を選択します。起動オプション の製品概要で、モデルパッケージまたはアルゴリズムリソースARNの を指定し、 の追加 を選択します。

特定のバージョンの既存の使用状況情報を編集するには、[起動オプション][編集] を選択して、[バージョンを編集] を選択します。

入力と出力の要件

バイヤーが製品を理解して使用できるよう、入力と出力の例を含め、形式を明確に説明することが重要です。製品を理解すると、購入者は、入力データに対して必要な変換を行って最適な推論結果を得られるようになります。

Amazon SageMaker リソースを製品リストに追加すると、次のメッセージが表示されます。

推論の入力と出力

推論入力では、リアルタイムエンドポイントとバッチ変換ジョブの両方の入力形式を指定します。データの前処理に必要なコードスニペットを含めてください。サポートされているMIMEコンテンツタイプ (例: image/jpeg image/png image/bmp )、該当する場合は値の説明、および制限を含めます。でホストされている入力サンプルを含めますGitHub

推論出力では、リアルタイムエンドポイントとバッチ変換ジョブの両方の出力形式を指定します。必要に応じて、出力MIMEコンテンツタイプ (application/json、image/jpeg など) と値の説明を含めます。でホストされている出力サンプルを含めますGitHub

サンプルには、お使いの製品に対応する入力ファイルを提供してください。モデルが多クラス分類を実行する場合は、クラスごとに少なくとも 1 つのサンプル入力ファイルを提供してください。

トレーニング入力

モデルをトレーニングするための情報」セクションに、データの前処理に必要な入力データ形式とコードスニペットを指定します。サポートされているMIMEコンテンツタイプ (例: image/jpeg image/png image/bmp )、該当する場合は値の説明、および制限を含めます。でホストされている入力サンプルを必ず含めてくださいGitHub

購入者が提供できるオプション機能と必須機能の両方を説明し、PIPE 入力モードがサポートされているかどうかを明記します。分散トレーニング (1 CPUインスタンスあたりGPU 1 つ以上のトレーニング) がサポートされている場合は、これを指定します。チューニングについては、推奨されるハイパーパラメータを一覧で表示してください。

Jupyter Notebook の要件

SageMaker リソースを製品リストに追加するときは、購入者にデータのアップロードや検索を依頼することなく、完全なワークフローを示す でホストGitHubされているサンプル Jupyter ノートブックへのリンクを提供します。

AWS SDK for Python (Boto)を使用します。優れたサンプルノートブックを開発して提供できれば、購入者はリストを簡単に試して使用することができます。

モデルパッケージ製品の場合、サンプルノートブックには、入力データの準備、リアルタイム推論用エンドポイントの作成、バッチ変換ジョブの実行などが示されています。詳細については、「」の「モデルパッケージのリストとサンプルノートブック」を参照してください GitHub。サンプルノートブックについては、auto_insurance を参照してください。ノートブックはすべての で機能します。パラメータを入力する必要はなく AWS リージョン、購入者がサンプルデータを見つける必要もありません。

注記

未開発のサンプル Jupyter Notebook ノートブックで、考えられる入力やデータの前処理手順が複数表示されていないと、購入者が製品の価値提案を完全に理解するのが難しい場合があります。

アルゴリズム製品の場合、サンプルノートブックは、完全なトレーニング、チューニング、モデル作成、リアルタイム推論用のエンドポイントの作成、バッチ変換ジョブのパフォーマンスを示します。詳細については、「」の「アルゴリズムのリストとサンプルノートブック」を参照してください GitHub。サンプルノートブックについては、「」の「amazon_demo_product」と「automl」を参照してください GitHub。これらのサンプルノートブックはすべてのリージョンで機能し、パラメータを入力したり、購入者がサンプルデータを探したりする必要はありません。

注記

サンプルのトレーニングデータが不足していると、購入者が Jupyter Notebook を正常に実行できなくなります。サンプルノートブックが開発されていないと、購入者が製品を使用できなくなり、採用が見合わされるおそれがあります。

ML 製品リストの要件と推奨事項の要約

次の表に、機械学習製品の出品ページの要件と推奨事項の概要を示します。

詳細 モデルパッケージリスト用 アルゴリズムリスト用
Product descriptions
サポートされているコンテンツタイプ (例: 画像で X を検出する) に対して製品が何をするかを詳しく説明します。 必須 必須
製品に関する説得力のある差別化情報を提供します (「best」や根拠のないクレームなどの形容詞は避けてください)。 推奨 推奨
この製品の最も重要なユースケースを一覧表示します (複数可)。 必須 必須
トレーニングしたデータ (ソースとサイズ) を説明し、既知の制限があればリストします。 必須 該当しない
モデルが構築されたコアフレームワークについて説明します。 推奨 推奨
検証データに関するモデルパフォーマンスメトリクスを要約する (Z データセットを使用してベンチマークされた「XX.YY パーセントの精度」など)。 必須 該当しない
推奨されるインスタンスタイプのモデルレイテンシーおよび/またはスループットメトリクスを要約します。 必須 該当しない
アルゴリズムカテゴリについて説明します。例えば、この決定フォレスト回帰アルゴリズムは、ブートストラップ集約の一般的な手法とランダムな特徴の選択を使用して構築された木構造化分類子のアンサンブルに基づいています。 該当しない 必須
Usage information
推論には、リアルタイムエンドポイントジョブとバッチ変換ジョブの両方の入力形式を指定します。サポートされているMIMEコンテンツタイプ (例: image/jpeg image/png image/bmp )、該当する場合は値の説明、および制限を含めます。「入力と出力の要件」を参照してください。 必須 必須
推論には、リアルタイムエンドポイントジョブとバッチ変換ジョブの両方の入力サンプルを指定します。サンプルは でホストする必要があります GitHub。「入力と出力の要件」を参照してください。 必須 必須
推論には、リアルタイムエンドポイントジョブとバッチ変換ジョブの両方の出力形式を指定します。必要に応じて、出力MIMEコンテンツタイプ (application/json、image/jpeg など) と値の説明を含めます。「入力と出力の要件」を参照してください。 必須 必須
推論には、リアルタイムエンドポイントジョブとバッチ変換ジョブの両方の出力サンプルを指定します。サンプルは でホストする必要があります GitHub。「入力と出力の要件」を参照してください。 必須 必須
推論には、エンドポイントまたはバッチ変換ジョブを使用する例を指定します。 AWS Command Line Interface (AWS CLI) コマンドまたは を使用してコード例を含めます AWS SDK。 必須 必須
トレーニングには、入力形式を指定します。サポートされているMIMEコンテンツタイプ (image/jpegimage/png image/bmp など)、該当する場合は値の説明、制限 (必要なデータの最小行など) を含めます。「入力と出力の要件」を参照してください。 該当しない 必須
トレーニングでは、 でホストされている入力サンプルを提供します GitHub。「入力と出力の要件」を参照してください。 該当しない 必須
トレーニングでは、トレーニングジョブの実行例を示します。サポートされているハイパーパラメータ、その範囲、および全体的な影響について説明します。アルゴリズムがハイパーパラメータチューニング、分散トレーニング、またはGPUインスタンスをサポートしているかどうかを指定します。 AWS CLI コマンドや の使用などのコード例を含めます AWS SDK。 該当しない 必須
製品の完全な使用 GitHub を示すためにホストされている Jupyter ノートブックを提供します。「Jupyter Notebook の要件」を参照してください。 必須 必須
ユーザーマニュアルやサンプルデータなど、製品の使用に関連する技術情報を提供します。 推奨 推奨