Pantau pemanfaatan sumber daya AWS komputasi di Amazon Studio Classic SageMaker - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pantau pemanfaatan sumber daya AWS komputasi di Amazon Studio Classic SageMaker

Untuk melacak pemanfaatan sumber daya komputasi dari pekerjaan pelatihan Anda, gunakan alat pemantauan yang ditawarkan oleh Amazon SageMaker Debugger.

Untuk pekerjaan pelatihan apa pun yang Anda jalankan dalam SageMaker menggunakan SageMaker Python SDK, Debugger mengumpulkan metrik pemanfaatan sumber daya dasar, seperti pemanfaatan CPU, pemanfaatan GPU, pemanfaatan memori GPU, jaringan, dan waktu tunggu I/O setiap 500 milidetik. Untuk melihat dasbor metrik pemanfaatan sumber daya dari pekerjaan pelatihan Anda, cukup gunakan UI SageMaker Debugger di Studio Experiments. SageMaker

Operasi dan langkah-langkah pembelajaran mendalam dapat beroperasi dalam interval milidetik. Dibandingkan dengan CloudWatch metrik Amazon, yang mengumpulkan metrik pada interval 1 detik, Debugger memberikan perincian yang lebih halus ke dalam metrik pemanfaatan sumber daya hingga interval 100 milidetik (0,1 detik) sehingga Anda dapat menyelam jauh ke dalam metrik pada tingkat operasi atau langkah.

Jika Anda ingin mengubah interval waktu pengumpulan metrik, Anda dapat menambahkan parameter untuk konfigurasi profil ke peluncur pekerjaan pelatihan Anda. Misalnya, jika Anda menggunakan SageMaker Python SDK, Anda harus meneruskan profiler_config parameter saat membuat objek estimator. Untuk mempelajari cara menyesuaikan interval pengumpulan metrik pemanfaatan sumber daya, lihat Template kode untuk mengonfigurasi objek SageMaker estimator dengan modul SageMaker Debugger Python di Python SDK SageMaker dan kemudianKonfigurasikan pengaturan untuk pembuatan profil dasar pemanfaatan sumber daya sistem.

Selain itu, Anda dapat menambahkan alat pendeteksi masalah yang disebut aturan profil bawaan yang disediakan oleh SageMaker Debugger. Aturan pembuatan profil bawaan menjalankan analisis terhadap metrik pemanfaatan sumber daya dan mendeteksi masalah kinerja komputasi. Untuk informasi selengkapnya, lihat Konfigurasikan aturan profiler bawaan yang dikelola oleh Amazon SageMaker Debugger. Anda dapat menerima hasil analisis aturan melalui UI SageMaker Debugger di SageMaker Studio Experiments atau SageMaker Debugger Profiling Report. Anda juga dapat membuat aturan pembuatan profil khusus menggunakan SageMaker Python SDK.

Untuk mempelajari selengkapnya tentang fungsi pemantauan yang disediakan oleh SageMaker Debugger, lihat topik berikut.