Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Distância de variação total (TVD)

Modo de foco
Distância de variação total (TVD) - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

A métrica de polarização de dados da distância de variação total (TVD) é metade da norma L1. O TVD é a maior diferença possível entre as distribuições de probabilidade para resultados de rótulos das facetas a e d. A 1 norma L é a distância de Hamming, uma métrica usada para comparar duas strings de dados binários determinando o número mínimo de substituições necessárias para alterar uma sequência para outra. Se as strings fossem cópias umas das outras, isso determinaria a quantidade de erros que ocorreram durante a cópia. No contexto de detecção de desvio, o TVD quantifica quantos resultados na faceta a precisariam ser alterados para corresponder aos resultados na faceta d.

A fórmula para a distância de variação total é a seguinte:

        TVD = ½*L1(Pa, Pd)

Por exemplo, suponha que você tenha uma distribuição de resultados com três categorias, yi = {y0, y1, y2} = {aceito, na lista de espera, rejeitado} em um cenário multicategórico de admissões em faculdades. Você usa as diferenças entre as contagens das facetas a e d para cada resultado para calcular o TVD. O resultado é o seguinte:

        L1(Pa, Pd) = |na(0) - nd(0)| + |na(1) - nd(1)| + |na(2) - nd(2)|

Em que:

  • Númeroa(i) é o número dos resultados da i-ésima categoria na faceta a: por exemplo, na(0) é o número de aceitações da faceta a.

  • nd(i) é o número dos resultados da i-ésima categoria na faceta d: por exemplo, nd(2) é o número de rejeições da faceta d.

    O intervalo de valores de TVD para resultados binários, multicategóricos e contínuos é [0, 1), onde:

    • Valores próximos de zero significam que os rótulos estão distribuídos de forma semelhante.

    • Valores positivos significam que as distribuições dos rótulos divergem; quanto mais positivas, maior a divergência.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.