機械学習製品を作成するための要件とベストプラクティス - AWS Marketplace

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

機械学習製品を作成するための要件とベストプラクティス

購入者がモデルパッケージとアルゴリズム製品を簡単にテストできると感じることが重要です。以下のセクションでは、機械学習 (ML) 製品リストを作成するための要件と、ML 製品のベストプラクティスについて説明します。要件と推奨事項の完全な概要については、ML商品の出品に関する要件と推奨事項のまとめ

注記

AnAWS Marketplace公開された製品が要件を満たしていない場合、担当者がこれらの要件を満たすように連絡する場合があります。

必要な資産

機械学習製品の出品の出品の前に、次の必須資産が揃っていることを確認してください。

  • Amazon リソースネーム (ARN)— モデルパッケージまたはアルゴリズムリソースの ARN をAWS リージョンあなたが出版しているもの (サポート対象AWS リージョンの発行).

    • モデルパッケージの ARN の形式は次のとおりです。arn:aws:sagemaker:<region>:<account-id>:model-package/<model-package-name>

    • アルゴリズムの ARN は次の形式です。arn:aws:sagemaker:<region>:<account-id>:algorithm/<algorithm-name>

  • 使用状況の情報の要件— 入力、出力、およびコード例に関する詳細を提供します。

  • 入力と出力の要件— ファイルまたはテキストのいずれかを指定します。

  • Jupyter ノートブックの要件— 製品の完全な使用方法を示します。

ML 製品の一般的なベストプラクティス

機械学習製品に関する次の情報を提供します。

  • 製品の説明には、以下を含めてください。

    • あなたのモデルは何をしますか

    • ターゲット顧客は誰ですか

    • 最も重要なユースケースは何ですか

    • モデルがどのようにトレーニングされたか、または使用されたデータの量

    • パフォーマンス指標と使用される検証データは何ですか

    • 医療の場合、モデルが診断用であるかどうか

  • デフォルトでは、機械学習製品は公開されるように設定されています。ただし、非公開の製品を作成することはできます。詳細については、「製品の送信」を参照してください。

  • (オプション) 有料製品については、お客様が製品を試用できるように 14 ~ 30 日間の無料トライアルを提供します。詳細については、「機械学習製品の料金表」を参照してください。

  • (オプション)モデルパッケージ製品について、製品リストページでリアルタイムの製品デモを有効にする場合は、AWS Marketplace販売者オペレーション。製品デモでは、購入予定者は、モデル自体を購読したり展開したりすることなく、リストページから直接モデルを試すことができます。

使用状況の情報の要件

製品の予想されるインプットとアウトプットを説明する明確な使用情報(例を含む)は、ポジティブな購入体験を促進するために重要です。

新しいバージョンのリソースを製品リストに追加するたびに、使用情報を提供する必要があります。

初めて公開する新製品の使用情報を追加するには、AWS Marketplace 管理ポータルconsole. 開始元製品ドロップダウンで、機械学習。販売者の製品の場合。左製品の概要起動オプションで、モデルパッケージまたはアルゴリズムリソースの ARN を指定し、を追加します。

特定のバージョンの既存の使用情報を編集するには、編集起動オプションそしてそれからバージョンを編集

入力と出力の要件

入力と出力の例を含む形式を明確に説明することは、購入者が製品を理解して使用できるようにするために重要です。この理解は、購入者が最良の推論結果を得るために入力データに対して必要な変換を実行するのに役立ちます。

Amazonを追加する場合、次の入力が求められます SageMaker 販売者の製品の出品の場合。

推論入力と出力

推論入力には、リアルタイムエンドポイントとバッチ変換ジョブの両方の入力形式を指定します。データの必要な前処理のためのコードスニペットを含めます。サポートされている MIME コンテンツタイプを含める (たとえば、image/jpeg,image/png,イメージ)、値の説明 (該当する場合)、および制限事項が含まれます。ホストされている入力サンプルを含めるGitHub

推論出力には、リアルタイムエンドポイントとバッチ変換ジョブの両方の出力形式を指定します。出力 MIME コンテンツタイプを含める (たとえば、application/json,image/jpeg) と値の説明 (該当する場合)。ホストされている出力サンプルを含めるGitHub

サンプルについては、製品で動作する入力ファイルを提供します。モデルがマルチクラス分類を実行する場合、クラスごとに少なくとも 1 つのサンプル入力ファイルを提供します。

トレーニング入力

モデルをトレーニングするための情報セクションで、必要なデータの前処理のための入力データ形式とコードスニペットを指定します。サポートされている MIME コンテンツタイプを含める (たとえば、image/jpeg,image/png,イメージ)、値の説明 (該当する場合)、および制限事項が含まれます。ホストされている入力サンプルを必ず含めてくださいGitHub

購入者が提供できるオプション機能と必須機能の両方の指定PIPE入力モードがサポートされています。もし分散トレーニング(複数の CPU/GPU インスタンスでのトレーニング) がサポートされています。これを指定してください。チューニングのために、推奨されるハイパーパラメータを挙げてください。

Jupyter ノートブックの要件

あなたを追加するとき SageMaker リソースを製品リストに追加するには、でホストされているサンプルの Jupyter ノートブックへのリンクを提供しますGitHubこれは、購入者にデータのアップロードや検索を要求することなく、完全なワークフローを示しています。

AWS SDK for Python (Boto) を使用します。よく開発されたサンプルノートは、購入者があなたのリストを試して使用するのを容易にします。

モデルパッケージ製品の場合、サンプルノートブックは、入力データの準備、リアルタイム推論のためのエンドポイントの作成、およびバッチ変換ジョブのパフォーマンスを示します。詳細については、次を参照してください。モデルPackage リストとサンプルノートオン GitHub。ノートブックのサンプルについては、generic_sample_notebookそしてinsurance。後者のサンプルノートブックは全部で機能しますAWS リージョン、パラメータを入力せず、購入者がサンプルデータを見つける必要もありません。

注記

未開発のサンプル Jupyter ノートブックで、複数の入力やデータの前処理手順が示されていないと、購入者が製品の価値提案を完全に理解することが難しくなる可能性があります。

アルゴリズム製品の場合、サンプルノートブックは、完全なトレーニング、チューニング、モデル作成、リアルタイム推論のためのエンドポイントの作成、およびバッチ変換ジョブのパフォーマンスを示します (アルゴリズムリストとサンプルノートブックオン GitHub). ノートブックのサンプルについては、amazon_demo_productそしてautomlオン GitHub。これらのサンプルノートブックは、パラメータを入力しなくても、購入者がサンプルデータを探す必要なく、すべての地域で機能します。

注記

サンプルトレーニングデータがないと、購入者が Jupyter ノートブックを正常に実行できなくなる可能性があります。サンプルノートが未開発であると、購入者が製品を使用できなくなり、採用が妨げられる可能性があります。

ML商品の出品に関する要件と推奨事項のまとめ

次の表に、機械学習製品出品の出品の要件と推奨事項の概要を示します。

詳細 モデルパッケージ出品の場合 アルゴリズムリスト用
Product descriptions
Explain in detail what the product does for supported content types (for example, “detects X in images"). Required Required
Provide compelling and differentiating information about the product (avoid adjectives like "best" or unsubstantiated claims). Recommended Recommended
List most important use case(s) for this product. Required Required
Describe the data (source and size) it was trained on and list any known limitations. Required Not applicable
Describe the core framework that the model was built on. Recommended Recommended
Summarize model performance metric on validation data (for example, "XX.YY percent accuracy benchmarked using the Z dataset"). Required Not applicable
Summarize model latency and/or throughput metrics on recommended instance type. Required Not applicable
Describe the algorithm category. For example, “This decision forest regression algorithm is based on an ensemble of tree-structured classifiers that are built using the general technique of bootstrap aggregation and a random choice of features.” Not applicable Required
Usage information
For inference, provide the input format for both the real-time endpoint and batch transform job. Include supported MIME content types (for example, image/jpeg, image/png, イメージ), description of values if applicable, and limitations. See 入力と出力の要件. Required Required
For inference, provide input samples for both the real-time endpoint and batch transform job. Samples must be hosted on GitHub. See 入力と出力の要件. Required Required
For inference, provide the output format for both the real-time endpoint and batch transform job. Include output MIME content type (for example, application/json, image/jpeg) and description of values if applicable. See 入力と出力の要件. Required Required
For inference, provide output samples for both the real-time endpoint and batch transform job. Samples must be hosted on GitHub. See 入力と出力の要件. Required Required
For inference, provide an example of using an endpoint or batch transform job. Include a code example using the AWS Command Line Interface (AWS CLI) commands or using an AWS SDK. Required Required
For training, provide input format. Include supported MIME content types (for example, image/jpeg, image/png, イメージ), description of values if applicable, and limitations (for example, minimum rows of data required). See 入力と出力の要件. Not applicable Required
For training, provide input samples hosted on GitHub. See 入力と出力の要件. Not applicable Required
For training, provide an example of performing training jobs. Describe the supported hyperparameters, their ranges, and their overall impact. Specify if the algorithm supports hyperparameter tuning, distributed training, or GPU instances. Include code example such as AWS CLI commands or using an AWS SDK, for example. Not applicable Required
Provide a Jupyter notebook hosted on GitHub demonstrating complete use of your product. See Jupyter ノートブックの要件. Required Required
Provide technical information related to the usage of the product, including user manuals and sample data. Recommended Recommended