Differenza nelle percentuali di rifiuto (DRR) - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Differenza nelle percentuali di rifiuto (DRR)

La metrica della differenza nei tassi di rifiuto (DRR) è la differenza nei rapporti tra le previsioni vere negative (TN) e quelle negative osservate (TN + FN) per i facet a e d. Questa metrica misura la differenza nella precisione del modello per la previsione dei rifiuti in base a questi due facet. La precisione misura la frazione di candidati non qualificati dal pool di candidati non qualificati identificati come tali dal modello. Se la precisione del modello per prevedere i candidati non qualificati diverge tra i facet, si tratta di un errore e la sua entità viene misurata dal DRR.

La formula per la differenza nei tassi di rifiuto tra i facet a e d è la seguente:

        DRR = TNd/(TNd + FNd) - TNa/(TNa + FNa)

I componenti della precedente equazione DRR sono i seguenti.

  • TNd sono i veri negativi previsti per il facet d.

  • FNd sono i falsi negativi previsti per il facet d.

  • TNa sono i veri negativi previsti per il facet a.

  • FNa sono i falsi negativi previsti per il facet a.

Ad esempio, supponiamo che il modello respinga 100 richiedenti (facet a) di mezza età per un prestito (etichetta negativa prevista) di cui 80 non sono effettivamente qualificati (etichette negative osservate). Supponiamo inoltre che il modello respinga 50 richiedenti di altra età (facet d) per un prestito (etichetta negativa prevista) di cui solo 40 sono effettivamente non qualificati (etichette negative osservate). Quindi, DRR = 40/50 - 80/100 = 0, e non viene indicata alcuna distorsione.

L’intervallo di valori per DRR per etichette di facet binarie, multicategoria e continue è [-1, +1].

  • I valori positivi si verificano quando il rapporto tra i facet negativi previsti (rifiuti) e gli esiti negativi osservati (richiedenti non qualificati) per il facet d è maggiore dello stesso rapporto per il facet a. Questi valori indicano una possibile distorsione nei confronti del facet favorito a causata dalla presenza di un numero relativamente maggiore di falsi negativi nel facet a. Maggiore è la differenza tra i rapporti, più estrema è la distorsione apparente.

  • I valori prossimi allo zero si verificano quando il rapporto tra i facet negativi previsti (rifiuti) e gli esiti negativi osservati (richiedenti non qualificati) per i facet a e d ha valori simili, il che indica che le etichette osservate per gli esiti negativi vengono previste con uguale precisione dal modello.

  • I valori negativi si verificano quando il rapporto tra i facet negativi previsti (rifiuti) e gli esiti negativi osservati (richiedenti non qualificati) per il facet a è maggiore del rapporto del facet d. Questi valori indicano una possibile distorsione rispetto al facet sfavorito d causata dalla presenza di un numero relativamente maggiore di falsi positivi nel facet d. Quanto più negativa è la differenza tra i rapporti, più estrema è la distorsione apparente.