Dati post-allenamento e distorsioni dei modelli

L'analisi delle distorsioni post-addestramento può aiutare a rivelare distorsioni che potrebbero essere state causate da distorsioni nei dati o introdotte dagli algoritmi di classificazione e previsione. Queste analisi prendono in considerazione i dati, comprese le etichette, nonché le previsioni di un modello. Le prestazioni vengono valutate analizzando le etichette previste o confrontando le previsioni con i valori target osservati nei dati rispetto a gruppi con attributi diversi. Esistono diverse nozioni di equità, ognuna delle quali richiede metriche di distorsione diverse per essere misurata.

Esistono concetti legali di equità che potrebbero non essere facili da comprendere poiché difficili da individuare. Si riporta ad esempio il concetto statunitense di impatto diversificato che si verifica quando un gruppo, definito come facet svantaggiato d, subisce un effetto negativo anche quando l'approccio adottato sembra equo. Questo tipo di distorsione potrebbe non essere dovuto a un modello di machine learning, ma potrebbe comunque essere rilevabile mediante l'analisi di distorsioni post-addestramento.

Amazon SageMaker Clarify cerca di garantire un uso coerente della terminologia. Per un elenco dei termini e delle relative definizioni, consulta Amazon SageMaker chiarisce i termini relativi a parzialità ed equità.

Per ulteriori informazioni sulle metriche relative ai pregiudizi post-formazione, consulta Scopri come Amazon SageMaker Clarify aiuta a rilevare pregiudizi e misure di equità per il Machine Learning in Finance. .

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Genera report per eventuali distorsioni nei dati di pre-allenamento in Studio SageMaker

Dati post-allenamento e metriche di distorsione dei modelli