本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
透過即時推論,您可以利用下列進階推論選項,進一步最佳化效能與成本:
多模型端點 – 如果您有使用相同架構且可共用容器的多個模型,請使用此選項。此選項可透過改善端點使用率並降低部署額外負荷,來協助您最佳化成本。
多容器端點 – 如果您有多個模型使用不同的架構,且需要自己的容器,請使用此選項。您可以獲得多模型端點的許多優點,並可部署各種架構和模型。
序列推論管道 – 如果您想要託管端點後方具有預先處理和後處理邏輯的模型,請使用此選項。推論管道完全由 管理 SageMaker ,並提供較低的延遲,因為所有容器都託管在相同的 Amazon EC2執行個體上。
您的瀏覽器已停用或無法使用 Javascript。
您必須啟用 Javascript,才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。
感謝您,讓我們知道我們做得很好!
若您有空,歡迎您告知我們值得讚許的地方,這樣才能保持良好服務。
感謝讓我們知道此頁面仍須改善。很抱歉,讓您失望。
若您有空,歡迎您提供改善文件的方式。