服務限制和配額 - AWS Marketplace

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

服務限制和配額

本節說明中機器學習 (ML) 產品的限制和配額 AWS Marketplace。

網路隔離

為了安全起見,當買方訂閱您的容器化產品時,Docker 容器會在沒有網路存取權限的隔離環境中執行。創建容器時,請不要依賴通過 Internet 撥出電話,因為它們會失敗。呼叫也 AWS 服務 將失敗。

映像大小

您的碼頭映像大小受亞馬遜彈性容器登錄 (Amazon ECR) 服務配額管理。Docker 映像大小會影響訓練工作、批次轉換工作和端點建立期間的啟動時間。為了獲得更好的性能,請保持最佳的 Docker 圖像大小。

儲存體大小

當您建立端點時,Amazon 會 SageMaker 將 Amazon Elastic Block Store (Amazon EBS) 儲存磁碟區附加到託管端點的每個 ML 運算執行個體。端點也稱為即時推論Amazon SageMaker 託管服務。) 儲存磁碟區的大小取決於執行個體類型。如需詳細資訊,請參閱 Amazon SageMaker 開發人員指南中的主機執行個體儲存磁碟區。 

如需 Batch 轉換,請參閱 Amazon SageMaker 開發人員指南中的批次轉換中的儲存

執行個體大小

SageMaker 提供一系列針對不同 ML 使用案例進行最佳化的執行個體類型。執行個體類型由不同的 CPU、GPU、記憶體和網路容量組合所組成。執行個體類型可讓您彈性選擇適當的資源組合,以建置、訓練和部署 ML 模型。如需詳細資訊,請參閱 Amazon SageMaker ML 執行個體類型

推論的裝載大小

對於端點,請將每次呼叫的輸入資料大小上限為 6 MB。無法調整此值。

對於批次轉換,每次呼叫的輸入資料大小上限為 100 MB。 無法調整此值。

推論的處理時間

對於端點,每次調用的最長處理時間為 60 秒。 無法調整此值。

對於批次轉換,每次呼叫的最長處理時間為 60 分鐘。 無法調整此值。

Service Quotas

如需有關訓練和推論配額的詳細資訊,請參閱 Amazon Ser SageMaker vice Quotas

非同步推論

中發佈的模型套件和演算法 AWS Marketplace 無法部署到針對 Amazon SageMaker 非同步推論設定的端點。為非同步推論設定的端點需要模型具有網路連線能力。所有 AWS Marketplace 型號均以網路隔離運作。如需詳細資訊,請參閱無法存取網路

無伺服器推論

中發佈的模型套件和演算法 AWS Marketplace 無法部署到針對 Amazon SageMaker 無伺服器推論設定的端點。為無伺服器推論設定的端點需要模型具有網路連線能力。所有 AWS Marketplace 型號均以網路隔離運作。如需詳細資訊,請參閱無法存取網路

受管 Spot 訓練

對於來源的所有演算法 AWS Marketplace,即使已實作受管 Spot 訓練的檢查點,也會將的值設定為 3,600 秒 (60 分鐘)。MaxWaitTimeInSeconds無法調整此值。

碼頭圖像和 AWS 帳戶

若要發佈,映像檔必須儲存在賣方擁有 AWS 帳戶 的 Amazon ECR 儲存庫中。無法發佈儲存在另一個儲存庫中的映像檔 AWS 帳戶。

從內建演算法發佈模型套件或 AWS Marketplace

無法發佈使用 Amazon SageMaker 內建演算法或 AWS Marketplace 訂閱演算法從訓練任務建立的模型套件。

您仍然可以使用訓練工作中的模型加工品,但是發行模型封裝時需要您自己的推論影像。

支援 AWS 區域 發佈

AWS Marketplace 支援發行模型套件和演算法資源, AWS 區域 其中下列條件皆成立:

發佈模型套件或演算法產品所需的所有資產都必須儲存在您選擇發佈的相同「區域」中。這包含下列項目:

  • 在 Amazon 中創建的模型包和算法資源 SageMaker

  • 上傳至 Amazon ECR 儲存庫的推論和訓練影像

  • 存放在 Amazon 簡單儲存服務 (Amazon S3) 中並在模型部署期間動態載入模型套件資源的模型成品 (如果有的話)

  • 用於存放在 Amazon S3 中的推論和訓練驗證的測試資料

您可以在任何受支援的地區開發和訓練您的產品 SageMaker。但是,在發佈之前,您必須將所有資產複製到 AWS Marketplace 支援發佈的區域中,並重新建立資源。

在刊登過程中,無論您發佈的來源為何,您都可以選擇要發佈的地區,並在其中提供產品。 AWS 區域