Caratterizzazione delle attribuzioni che utilizzano i valori Shapley - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Caratterizzazione delle attribuzioni che utilizzano i valori Shapley

SageMaker Clarify fornisce attribuzioni di funzionalità basate sul concetto di valore Shapley. È possibile utilizzare i valori Shapley per determinare il contributo apportato da ciascuna funzionalità ai modelli di previsione. Queste attribuzioni possono essere fornite per previsioni specifiche e a livello globale per il modello nel suo insieme. Ad esempio, se avete utilizzato un modello di apprendimento automatico per le ammissioni all'università, le spiegazioni potrebbero aiutare a determinare se il punteggio GPA o il SAT punteggio fosse la caratteristica più responsabile delle previsioni del modello, e quindi potete determinare la responsabilità di ciascuna caratteristica nel determinare una decisione di ammissione relativa a un determinato studente.

SageMaker Clarify ha preso il concetto dei valori di Shapley dalla teoria dei giochi e lo ha implementato in un contesto di apprendimento automatico. Il valore Shapley fornisce un modo per quantificare il contributo di ogni giocatore a un gioco e quindi i mezzi per distribuire il guadagno totale generato da un gioco ai giocatori in base ai loro contributi. In questo contesto di apprendimento automatico, SageMaker Clarify considera la previsione del modello su una determinata istanza come un gioco e le funzionalità incluse nel modello come i giocatori. Per una prima approssimazione, si potrebbe essere tentati di determinare il contributo o l'effetto marginale di ciascuna caratteristica quantificando il risultato dell'eliminazione di quella caratteristica dal modello o dell'eliminazione di tutte le altre caratteristiche dal modello. Tuttavia, questo approccio non tiene conto del fatto che le funzionalità incluse in un modello spesso non sono indipendenti l'una dall'altra. Ad esempio, se due caratteristiche sono altamente correlate, l'eliminazione di una delle due potrebbe non alterare in modo significativo la previsione del modello.

Per risolvere queste potenziali dipendenze, il valore di Shapley richiede che venga considerato il risultato di ogni possibile combinazione (o coalizione) di caratteristiche per determinare l'importanza di ciascuna caratteristiche. Date le caratteristiche di d, esistono 2d combinazioni possibili di funzionalità, ciascuna corrispondente a un modello potenziale. Per determinare l'attribuzione di una determinata caratteristica f, considera il contributo marginale dell'inclusione di f in tutte le combinazioni di funzionalità (e nei modelli associati) che non contengono f e calcola la media. Si può dimostrare che il valore di Shapley è l’unico modo di assegnare il contributo o l'importanza di ciascuna caratteristica che soddisfa determinate proprietà desiderabili. In particolare, la somma dei valori Shapley di ciascuna caratteristiche corrisponde alla differenza tra le previsioni del modello e quelle di un modello fittizio senza caratteristiche. Tuttavia, anche per valori ragionevoli di d, ad esempio 50 caratteristiche, è proibitivo a livello computazionale e poco pratico addestrare 2d modelli possibili. Di conseguenza, SageMaker Clarify deve utilizzare varie tecniche di approssimazione. A tale scopo, SageMaker Clarify utilizza Shapley Additive exPlanations (SHAP), che incorpora tali approssimazioni e ha ideato un'implementazione scalabile ed efficiente dell'algoritmo Kernel attraverso ottimizzazioni aggiuntive. SHAP

Per ulteriori informazioni sui valori di Shapley, vedere Approccio unificato all'interpretazione delle previsioni dei modelli.