必須アセット ML 製品の一般的なベストプラクティス使用状況情報の要件入力と出力の要件 Jupyter Notebook の要件 ML 製品リストの要件と推奨事項の要約

機械学習製品を作成するための要件とベストプラクティス

モデルパッケージとアルゴリズム製品を購入者が簡単にテストできるかを確認することが重要です。以下のセクションでは、機械学習 (ML) 製品リストを作成するための要件と ML 製品のベストプラクティスについて説明します。要件と推奨事項の完全な要約については、「ML 製品リストの要件と推奨事項の要約」を参照してください。

注記

公開済み製品が要件を満たしていない場合、これらの要件を満たすためにの AWS Marketplace 担当者から連絡されることがあります。

必須アセット

機械学習製品リストを作成する前に、次の必須アセットがあることを確認してください。

Amazon リソースネーム (ARN) – 発行元のでモデルパッケージまたはアルゴリズムリソースの ARN AWS リージョンを指定します (「」を参照公開 AWS リージョンでサポート）。
- モデルパッケージの ARN の形式は arn:aws:sagemaker:<region>:<account-id>:model-package/<model-package-name> です。
- アルゴリズムの ARN の形式は arn:aws:sagemaker:<region>:<account-id>:algorithm/<algorithm-name> です。
使用状況情報の要件 - 入力、出力、およびコード例に関する詳細を提供します。
入力と出力の要件 - ファイルまたはテキストのいずれかを提供します。
Jupyter Notebook の要件 - 製品の使用方法をすべてデモンストレーションします。

ML 製品の一般的なベストプラクティス

使用している機械学習製品について、以下の情報を提供します。

製品の説明には、以下を含めます。
- モデルの機能
- ターゲットとなる顧客
- 最も重要なユースケース
- モデルのトレーニング方法、または使用されたデータの量
- パフォーマンスメトリクスと、使用された検証データ
- 医療機器の場合、モデルが診断用かどうか
デフォルトでは、機械学習製品は一般に公開されるよう設定されています。ただし、非公開で製品を作成することもできます。詳細については、「製品リストの作成」を参照してください。
(オプション) 有料製品の場合は、顧客に対して 14～30 日間の無料試用期間を提供し、製品を試してもらいます。詳細については、「の機械学習製品の料金 AWS Marketplace」を参照してください。
(オプション) モデルパッケージ製品について、商品一覧ページでリアルタイムの製品デモを有効にする場合は、AWS Marketplace Seller Operations チームにお問い合わせください。製品デモでは、見込み客が自分でモデルをサブスクライブしたりデプロイしたりしなくても、出品ページでモデルを直接試すことができます。

使用状況情報の要件

購入者の満足度を高めるには、製品の期待される入力と出力を説明した明確な使用情報 (例を含む) が不可欠です。

新しいバージョンのリソースを製品リストに追加するたびに、使用状況情報を提供する必要があります。

初めて公開する新製品の使用情報を追加するには、 AWS Marketplace 管理ポータルコンソールにサインインします。[製品] ドロップダウンから [機械学習] を選択します。製品を選択します。[製品概要] の [起動オプション] で、モデルパッケージまたはアルゴリズムリソースの ARN を入力し、[追加]を選択します。

特定のバージョンの既存の使用状況情報を編集するには、[起動オプション] の [編集] を選択して、[バージョンを編集] を選択します。

入力と出力の要件

バイヤーが製品を理解して使用できるよう、入力と出力の例を含め、形式を明確に説明することが重要です。製品を理解すると、購入者は、入力データに対して必要な変換を行って最適な推論結果を得られるようになります。

Amazon SageMaker AI リソースを製品リストに追加すると、次のプロンプトが表示されます。

推論の入力と出力

推論入力では、リアルタイムエンドポイントとバッチ変換ジョブの両方の入力形式を指定します。データの前処理に必要なコードスニペットを含めてください。サポートされている MIME コンテンツタイプ (例えば、image/jpeg、image/png、image/bmp)、値の説明 (該当する場合)、および制限事項を含めてください。GitHub でホストされている入力サンプルを含めます。

推論出力では、リアルタイムエンドポイントとバッチ変換ジョブの両方の出力形式を指定します。出力 MIME コンテンツタイプ (例えば、application/json、image/jpeg) と値の説明 (該当する場合) を含めてください。GitHub でホストされている出力サンプルを含めます。

サンプルには、お使いの製品に対応する入力ファイルを提供してください。モデルが多クラス分類を実行する場合は、クラスごとに少なくとも 1 つのサンプル入力ファイルを提供してください。

トレーニング入力

「モデルをトレーニングするための情報」セクションに、データの前処理に必要な入力データ形式とコードスニペットを指定します。サポートされている MIME コンテンツタイプ (例えば、image/jpeg、image/png、image/bmp)、値の説明 (該当する場合)、および制限事項を含めてください。GitHub でホストされている入力サンプルを必ず含めてください。

購入者が提供できるオプション機能と必須機能の両方を説明し、PIPE 入力モードがサポートされているかどうかを明記します。分散型トレーニング (複数の CPU/GPU インスタンスによるトレーニング) がサポートされている場合は、その旨を明記してください。チューニングについては、推奨されるハイパーパラメータを一覧で表示してください。

Jupyter Notebook の要件

SageMaker AI リソースを製品リストに追加するときは、GitHub でホストされているサンプル Jupyter Notebook へのリンクを提供します。このリンクは、購入者にデータのアップロードや検索を依頼することなく、ワークフロー全体を示しています。

AWS SDK for Python (Boto)を使用します。優れたサンプルノートブックを開発して提供できれば、購入者はリストを簡単に試して使用することができます。

モデルパッケージ製品の場合、サンプルノートブックには、入力データの準備、リアルタイム推論用エンドポイントの作成、バッチ変換ジョブの実行などが示されています。詳細については、GitHub の「Model Package listing and Sample notebook」を参照してください。サンプルノートブックについては、「auto_insurance」を参照してください。ノートブックは、パラメータを入力したり AWS リージョン、購入者がサンプルデータを見つけることなく、すべてで機能します。

注記

未開発のサンプル Jupyter Notebook ノートブックで、考えられる入力やデータの前処理手順が複数表示されていないと、購入者が製品の価値提案を完全に理解するのが難しい場合があります。

アルゴリズム製品の場合、サンプルノートブックには、トレーニング、調整、モデル作成、リアルタイム推論用エンドポイントの作成、バッチ変換ジョブのパフォーマンスがすべて示されています。詳細については、GitHub の「Algorithm listing and Sample notebook」を参照してください。サンプルノートブックについては、GitHub の「amazon_demo_product」と「automl」を参照してください。これらのサンプルノートブックはすべてのリージョンで機能し、パラメータを入力したり、購入者がサンプルデータを探したりする必要はありません。

注記

サンプルのトレーニングデータが不足していると、購入者が Jupyter Notebook を正常に実行できなくなります。サンプルノートブックが開発されていないと、購入者が製品を使用できなくなり、採用が見合わされるおそれがあります。

ML 製品リストの要件と推奨事項の要約

次の表に、機械学習製品の出品ページの要件と推奨事項の概要を示します。

詳細	モデルパッケージリスト用	アルゴリズムリスト用
Product descriptions
Explain in detail what the product does for supported content types (for example, “detects X in images").	Required	Required
Provide compelling and differentiating information about the product (avoid adjectives like "best" or unsubstantiated claims).	Recommended	Recommended
List most important use case(s) for this product.	Required	Required
Describe the data (source and size) it was trained on and list any known limitations.	Required	Not applicable
Describe the core framework that the model was built on.	Recommended	Recommended
Summarize model performance metric on validation data (for example, "XX.YY percent accuracy benchmarked using the Z dataset").	Required	Not applicable
Summarize model latency and/or throughput metrics on recommended instance type.	Required	Not applicable
Describe the algorithm category. For example, “This decision forest regression algorithm is based on an ensemble of tree-structured classifiers that are built using the general technique of bootstrap aggregation and a random choice of features.”	Not applicable	Required
Usage information
For inference, provide the input format for both the real-time endpoint and batch transform job. Include supported MIME content types (for example, image/jpeg, image/png, image/bmp), description of values if applicable, and limitations. See 入力と出力の要件.	Required	Required
For inference, provide input samples for both the real-time endpoint and batch transform job. Samples must be hosted on GitHub. See 入力と出力の要件.	Required	Required
For inference, provide the output format for both the real-time endpoint and batch transform job. Include output MIME content type (for example, application/json, image/jpeg) and description of values if applicable. See 入力と出力の要件.	Required	Required
For inference, provide output samples for both the real-time endpoint and batch transform job. Samples must be hosted on GitHub. See 入力と出力の要件.	Required	Required
For inference, provide an example of using an endpoint or batch transform job. Include a code example using the AWS Command Line Interface (AWS CLI) commands or using an AWS SDK.	Required	Required
For training, provide input format. Include supported MIME content types (for example, image/jpeg, image/png, image/bmp), description of values if applicable, and limitations (for example, minimum rows of data required). See 入力と出力の要件.	Not applicable	Required
For training, provide input samples hosted on GitHub. See 入力と出力の要件.	Not applicable	Required
For training, provide an example of performing training jobs. Describe the supported hyperparameters, their ranges, and their overall impact. Specify if the algorithm supports hyperparameter tuning, distributed training, or GPU instances. Include code example such as AWS CLI commands or using an AWS SDK, for example.	Not applicable	Required
Provide a Jupyter notebook hosted on GitHub demonstrating complete use of your product. See Jupyter Notebook の要件.	Required	Required
Provide technical information related to the usage of the product, including user manuals and sample data.	Recommended	Recommended

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

AWS Marketplaceでの製品の公開

サービスの制限とクォータ