Pembongkaran aktivasi

penting

Di SMP v2.2.0, fungsionalitas pembongkaran aktivasi perpustakaan SMP tidak berfungsi. Gunakan pembongkaran PyTorch aktivasi asli sebagai gantinya.

Biasanya, pass maju menghitung aktivasi di setiap lapisan dan menyimpannya dalam memori GPU sampai pass mundur untuk lapisan yang sesuai selesai. Membongkar tensor ini ke memori CPU setelah forward pass dan mengambilnya kembali ke GPU saat dibutuhkan dapat menghemat penggunaan memori GPU yang substansif. PyTorch mendukung aktivasi pembongkaran, tetapi implementasinya GPUs menyebabkan idle saat aktivasi diambil kembali dari CPU selama backward pass. Hal ini menyebabkan penurunan kinerja yang besar saat menggunakan pembongkaran aktivasi.

SMP v2 meningkatkan pembongkaran aktivasi ini. Ini melakukan pra-pengambilan aktivasi sebelumnya sebelum aktivasi diperlukan agar GPU mulai meneruskan aktivasi tersebut secara mundur. Fitur pra-pengambilan membantu kemajuan pelatihan dijalankan lebih efisien tanpa idle. GPUs Ini menghasilkan menawarkan manfaat dari penggunaan memori yang lebih rendah tanpa penurunan kinerja.

Anda dapat menyimpan PyTorch modul asli untuk pembongkaran aktivasi dalam skrip pelatihan Anda. Berikut ini adalah contoh struktur penerapan fitur pembongkaran aktivasi SMP di skrip Anda. Perhatikan bahwa pembongkaran aktivasi hanya berlaku jika digunakan bersama denganPos pemeriksaan aktivasi. Untuk mempelajari lebih lanjut tentang alat PyTorch pos pemeriksaan asli untuk pembongkaran aktivasi, lihat:

checkpoint_wrapper.py di PyTorch GitHubrepositori
Aktivasi Checkpointing di PyTorch blog Menskalakan Model Yayasan Multi-modal dengan Didistribusikan. TorchMultimodal PyTorch

Anda dapat menerapkan fitur pembongkaran aktivasi SMP pada pos pemeriksaan PyTorch aktivasi. Ini dilakukan dengan menambahkan activation_loading_horizon parameter sm_activation_offloading dan ke kamus konfigurasi SMP selamaLangkah 2: Luncurkan pekerjaan pelatihan.

Cuplikan kode berikut menunjukkan cara menambahkan modul inisialisasi SMP torch.sagemaker.init() ke skrip pelatihan Anda dan mengatur kamus konfigurasi SMP dalam format JSON untuk peluncur pekerjaan pelatihan sambil mengikuti proses dua langkah yang diperkenalkan. Gunakan perpustakaan paralelisme SageMaker model v2 Anda tidak perlu membuat perubahan apa pun pada PyTorch model atau konfigurasi PyTorch FSDP Anda. Untuk informasi tentang parameter sm_activation_offloading dan activation_loading_horizon, lihat Parameter konfigurasi fitur inti SMP v2.

Konfigurasi SMP


{
    "activation_loading_horizon": 2,
    "sm_activation_offloading": True
}

Dalam naskah pelatihan

catatan

Saat mengaktifkan fitur pembongkaran aktivasi SMP, pastikan Anda juga menggunakan PyTorch offload_wrapper fungsi tersebut dan menerapkannya ke modul root. Fitur pembongkaran aktivasi SMP menggunakan modul root untuk menentukan kapan pass maju dilakukan untuk memulai pra-pengambilan.


import torch.sagemaker as tsm
tsm.init()

# Native PyTorch module for activation offloading
from torch.distributed.algorithms._checkpoint.checkpoint_wrapper import (
    apply_activation_checkpointing, 
    offload_wrapper,
)

model = FSDP(...)

# Activation offloading requires activation checkpointing.
apply_activation_checkpointing(
    model,
    check_fn=checkpoint_transformer_layers_policy,
)

model = offload_wrapper(model)

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Pos pemeriksaan aktivasi

Paralelisme tensor