Addestramento iterativo

La formazione iterativa è un approccio sistematico per perfezionare i modelli attraverso più cicli di formazione, in cui ogni round si basa sul checkpoint precedente affrontando i punti deboli specifici scoperti durante la valutazione. Questo metodo consente miglioramenti mirati delle prestazioni del modello incorporando esempi curati che affrontano le modalità di errore, adattandosi ai requisiti in evoluzione e convalidando i miglioramenti in modo incrementale anziché impegnarsi in un unico lungo periodo di formazione. Il processo segue in genere modelli come SFT (Supervised Fine-Tuning) seguito da RFT (Reward-based Fine-Tuning), con checkpoint archiviati in bucket S3 escrow AWS gestiti a cui è possibile fare riferimento per le successive iterazioni di addestramento, mantenendo al contempo la coerenza nel tipo di modello e nella tecnica di addestramento in tutta la pipeline.

Per ulteriori informazioni, consulta Formazione iterativa.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Valutazione

Su SageMaker HyperPod