Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Disparidade demográfica condicional (CDD)

Modo de foco
Disparidade demográfica condicional (CDD) - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

A métrica de disparidade demográfica (DD) determina se uma faceta tem uma proporção maior de resultados rejeitados no conjunto de dados do que de resultados aceitos. No caso binário em que há duas facetas, homens e mulheres, por exemplo, que constituem o conjunto de dados, a desfavorecida é rotulada como faceta d e a favorita é rotulada como faceta a. Por exemplo, no caso de admissões em faculdades, se as candidatas (mulheres) representassem 46% dos candidatos rejeitados e representassem apenas 32% dos candidatos aceitos, afirmamos que há disparidade demográfica porque a taxa de rejeição de mulheres excede a taxa de aceitação. As candidatas mulheres são rotuladas como faceta d neste caso. Se os candidatos (homens) representavam 54% dos candidatos rejeitados e 68% dos candidatos aceitos, então não há uma disparidade demográfica para essa faceta, pois a taxa de rejeição é menor que a taxa de aceitação. Os candidatos (homens) são rotulados como faceta d neste caso.

A fórmula para a disparidade demográfica para a faceta d menos favorecida é a seguinte:

        DDd = nd(0)/n(0) - nd(1)/n(1) = PdR(y0) - PdA(y1)

Em que:

  • n(0) = na(0) + nd(0) é o número total de resultados rejeitados no conjunto de dados para a faceta favorecida a e a faceta desfavorecida d.

  • n(1) = na(1) + nd(1) é o número total de resultados aceitos no conjunto de dados para a faceta favorecida a e a faceta desfavorecida d.

  • PdR(y0) é a proporção de resultados rejeitados (com valor 0) na faceta d.

  • PdA(y1) é a proporção de resultados aceitos (valor 1) na faceta d.

Para o exemplo de admissão na faculdade, a disparidade demográfica para mulheres é DDd = 0,46 - 0,32 = 0,14. Para homens DDa = 0,54 - 0,68 = - 0,14.

Uma métrica de disparidade demográfica condicional (CDD) que condiciona DD em atributos que definem um estrato de subgrupos no conjunto de dados é necessária para descartar o paradoxo de Simpson. O reagrupamento pode fornecer insights sobre a causa das aparentes disparidades demográficas nas facetas menos favorecidas. O caso clássico surgiu no caso de admissões em Berkeley, onde os homens foram aceitos com uma taxa geral mais alta do que as mulheres. As estatísticas desse caso foram usadas nos cálculos de exemplo de DD. No entanto, quando os subgrupos departamentais foram examinados, as mulheres demonstraram ter taxas de admissão mais altas do que os homens quando condicionadas pelo departamento. A explicação foi que as mulheres se inscreveram em departamentos com taxas de aceitação mais baixas do que os homens. O exame das taxas de aceitação subagrupadas revelou que as mulheres foram realmente aceitas em uma taxa mais alta do que os homens nos departamentos com taxas de aceitação mais baixas.

A métrica CDD fornece uma medida única para todas as disparidades encontradas nos subgrupos definidos por um atributo de um conjunto de dados por meio da média deles. É definida como a média ponderada das disparidades demográficas (DDi) para cada um dos subgrupos, com cada disparidade de subgrupo ponderada em proporção ao número de observações contidas. A fórmula para a disparidade demográfica condicional é a seguinte:

        CDD = (1/n)*ini *DDi

Em que:

  • ini = n é o número total de observações e ni é o número de observações para cada subgrupo.

  • DDi = ni(0)/n(0) - ni(1)/n(1) = PiR(y0) - PiA(y1) é a disparidade demográfica para o i-ésimo subgrupo.

A disparidade demográfica de um subgrupo (DDi) é a diferença entre a proporção de resultados rejeitados e a proporção de resultados aceitos para cada subgrupo.

O intervalo de valores de DD para resultados binários para o conjunto de dados completo DDd ou para seus subgrupos condicionalizados DDi é [-1, +1].

  • +1: quando não há rejeições na faceta a ou subgrupo e nenhuma aceitação na faceta d ou subgrupo

  • Valores positivos indicam que há uma disparidade demográfica, pois a faceta d ou subgrupo tem uma proporção maior dos resultados rejeitados no conjunto de dados do que dos resultados aceitos. Quanto maior o valor, menos favorece a faceta e maior a disparidade.

  • Valores negativos indicam que não há uma disparidade demográfica, pois a faceta d ou subgrupo tem uma proporção maior dos resultados aceitos no conjunto de dados do que dos resultados rejeitados. Quanto menor o valor, mais favorecida é a faceta.

  • -1: quando não há rejeições na faceta d ou subgrupo e nenhuma aceitação na faceta a ou subgrupo

Se você não condicionar nada, o CDD será zero se e somente se o DPL for zero.

Essa métrica é útil para explorar os conceitos de discriminação direta e indireta e de justificativa objetiva na legislação e jurisprudência de não discriminação da UE e do Reino Unido. Para obter informações adicionais, consulte Por que a imparcialidade não pode ser automatizada. Este documento também contém dados e análises relevantes do caso de admissões em Berkeley, que mostram como a condicionalização em subgrupos de taxas de admissão departamental ilustra o paradoxo de Simpson.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.