Rilevamento dei dati post-addestramento e delle distorsioni dei modelli - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Rilevamento dei dati post-addestramento e delle distorsioni dei modelli

L'analisi delle distorsioni post-addestramento può aiutare a rivelare distorsioni che potrebbero essere state causate da distorsioni nei dati o introdotte dagli algoritmi di classificazione e previsione. Queste analisi prendono in considerazione i dati, comprese le etichette, nonché le previsioni di un modello. Le prestazioni vengono valutate analizzando le etichette previste o confrontando le previsioni con i valori target osservati nei dati rispetto a gruppi con attributi diversi. Esistono diverse nozioni di equità, ognuna delle quali richiede metriche di distorsione diverse per essere misurata.

Esistono concetti legali di equità che potrebbero non essere facili da comprendere poiché difficili da individuare. Si riporta ad esempio il concetto statunitense di impatto diversificato che si verifica quando un gruppo, definito come facet svantaggiato d, subisce un effetto negativo anche quando l'approccio adottato sembra equo. Questo tipo di distorsione potrebbe non essere dovuto a un modello di machine learning, ma potrebbe comunque essere rilevabile mediante l'analisi di distorsioni post-addestramento.

Amazon SageMaker Clarify cerca di garantire un uso coerente della terminologia. Per un elenco dei termini e delle relative definizioni, consulta Amazon SageMaker chiarisce i termini relativi a parzialità ed equità.

Per ulteriori informazioni sulle metriche relative ai pregiudizi post-formazione, consulta Scopri come Amazon SageMaker Clarify aiuta a rilevare pregiudizi e misure di equità per il Machine Learning in Finance. .