SageMaker 模型平行程式庫 v2 的核心功能 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

SageMaker 模型平行程式庫 v2 的核心功能

Amazon SageMaker 模型平行程式庫 v2 (SMP v2) 提供分發策略和記憶體節省技術,例如分割資料平行程度、張量平行性和檢查點。SMP v2 提供的模型平行處理策略和技術有助於將大型模型分散到多個裝置,同時將訓練速度和記憶體消耗最佳化。SMP v2 也提供 Python 套件,協助您調整訓練指令碼,只torch.sagemaker要幾行程式碼變更即可。

本指南遵循中開始使用 SageMaker 模型平行程式庫 v2介紹的基本兩步流程。若要深入瞭解 SMP v2 的核心功能及其使用方式,請參閱下列主題。

注意

這些核心功能可在 SMP 版本 2.0.0 及更新版本以及 SageMaker Python SDK 版本 2.200.0 及更新版本中使用,並適用於 2.0.1 版及更高版本。 PyTorch 若要檢查套件的版本,請參閱支援的架構與 AWS 區域