Esegui il debug e migliora le prestazioni del modello

L'essenza dell'addestramento di modelli di machine learning, reti neurali di deep learning e modelli di trasformazione consiste nel raggiungere una convergenza stabile dei modelli e, pertanto, state-of-the-art i modelli hanno milioni, miliardi o trilioni di parametri del modello. Il numero di operazioni per aggiornare l'enorme numero di parametri del modello durante ogni iterazione può facilmente diventare astronomico. Per identificare i problemi di convergenza del modello, è importante poter accedere ai parametri, alle attivazioni e ai gradienti del modello calcolati durante i processi di ottimizzazione.

Amazon SageMaker fornisce due strumenti di debug per aiutarti a identificare tali problemi di convergenza e ottenere visibilità nei tuoi modelli.

Amazon SageMaker con TensorBoard

Per offrire una maggiore compatibilità con gli strumenti della community open source all'interno della piattaforma SageMaker Training, SageMaker ospita TensorBoard come applicazione nel dominio. SageMaker Puoi completare i tuoi lavori di formazione SageMaker e continuare a utilizzare lo scrittore di TensorBoard riepilogo per raccogliere i tensori di output del modello. Poiché TensorBoard è implementato in SageMaker domain, offre anche più opzioni per gestire i profili utente relativi al SageMaker dominio del proprio AWS account e fornisce un controllo preciso sui profili utente concedendo l'accesso a azioni e risorse specifiche. Per ulteriori informazioni, vedi Utilizzalo TensorBoard per eseguire il debug e analizzare i lavori di formazione in Amazon SageMaker.

Amazon SageMaker Debugger

Amazon SageMaker Debugger è una funzionalità SageMaker che fornisce strumenti per registrare gli hook ai callback per estrarre i tensori di output del modello e salvarli in Amazon Simple Storage Service. Fornisce regole incorporate per rilevare problemi di convergenza del modello, ad esempio sovradimensionamento, funzioni di attivazione saturate, gradienti decrescenti e altro ancora. Puoi anche configurare le regole integrate con Amazon CloudWatch Events AWS Lambda per intraprendere azioni automatiche contro i problemi rilevati e configurare Amazon Simple Notification Service per ricevere notifiche via e-mail o SMS. Per ulteriori informazioni, consulta Usa Amazon SageMaker Debugger per eseguire il debug e migliorare le prestazioni del modello.

Argomenti

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Note di rilascio

Usa TensorBoard