Amazon SageMaker Studio 实验中的 Amazon SageMaker Debugger UI - Amazon SageMaker

Amazon SageMaker Studio 实验中的 Amazon SageMaker Debugger UI

在 Amazon Elastic Compute Cloud (Amazon EC2) 实例上运行训练作业时,使用 Amazon SageMaker Studio 中的 Amazon SageMaker Debugger Insights 控制面板来分析您的模型性能和系统瓶颈。借助 Debugger 控制面板,深入了解您的训练作业,提高模型训练性能和准确性。默认情况下,对于训练作业,Debugger 每 500 毫秒监控一次系统指标(CPU、GPU、GPU 内存、网络和数据 I/O),每 500 次迭代监控一次基本输出张量(损失和准确性)。您还可以通过 Studio UI 或使用 Amazon SageMaker Python SDK 进一步自定义 Debugger 配置参数值并调整保存间隔。

重要

如果您使用的是现有 Studio 应用程序,请删除该应用程序并重新启动以使用最新的 Studio 功能。有关如何重新启动和更新 Studio 环境的说明,请参阅更新 Amazon SageMaker Studio