為系統資源使用率的基本分析進行設定 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

為系統資源使用率的基本分析進行設定

若要調整收集使用率量度的時間間隔,請使用 ProfilerConfig API 作業建立參數物件,同時根據您的偏好建構 SageMaker 架構或一般估算器。

注意

根據預設,對於所有 SageMaker 訓練任務,偵錯工具會每 500 毫秒從 Amazon EC2 執行個體收集資源使用率指標以進行系統監控,而不需在估算器中指定任何除錯器特定參數。 SageMaker

偵錯工具會將系統指標儲存在預設的 S3 儲存貯體中。預設 S3 儲存貯體 URI 的格式為 s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/

下列程式碼範例示範如何以 1000 毫秒的系統監控時間間隔來設定 profiler_config 參數。

from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=1000 )
  • system_monitor_interval_millis (int) — 指定監控間隔 (以毫秒為單位) 記錄系統指標。可用的毫秒值為 100、200、500、1000 (1 秒)、5000 (5 秒) 和 60000 (1 分鐘)。預設值為 500 毫秒。

若要查看系統監控的進度,請參閱開啟 Amazon SageMaker 偵錯工具見解儀表板