SageMaker AI HyperPod 訓練 - Amazon Nova

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

SageMaker AI HyperPod 訓練

您可以使用 Amazon Nova 配方自訂 Amazon Nova 模型,並在 SageMaker AI HyperPod 上對其進行訓練。配方是 YAML 組態檔案,可提供有關如何執行模型自訂任務的詳細資訊給 SageMaker AI。

SageMaker AI HyperPod 提供具有最佳化 GPU 執行個體和 Amazon FSx for Lustre 儲存的高效能運算, 透過與 TensorBoard、 靈活的檢查點管理可反覆改進, 無縫部署到 Amazon Bedrock 以進行推論, 和有效率的可擴展多節點分散式訓練,共同為組織提供安全、 執行者、 和彈性的環境,可根據其特定業務需求量身打造 Amazon Nova 模型。

SageMaker AI HyperPod 上的 Amazon Nova 自訂會在服務管理的 Amazon S3 儲存貯體中存放模型成品,包括模型檢查點。服務受管儲存貯體中的成品會使用 SageMaker 受管 KMS 金鑰加密。服務受管 Amazon S3 儲存貯體目前不支援使用客戶受管金鑰進行資料加密。您可以使用此檢查點位置進行評估任務或 Amazon Bedrock 推論。

本節提供有關您可以使用 SageMaker AI HyperPod 調校的 Amazon Nova 模型參數、何時可能想要調校它們,以及它們如何影響模型效能的詳細資訊。這些參數會依訓練技術呈現。如需如何提交任務的資訊,請參閱執行 SageMaker 訓練任務