Norma Lp (LP) - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Norma Lp (LP)

A norma Lp (LP) mede a distância da norma p entre as distribuições de facetas dos rótulos observados em um conjunto de dados de treinamento. Essa métrica não é negativa e, portanto, não pode detectar desvios reversos.

A fórmula para a norma Lp é a seguinte:

        Lp(Pa, Pd) = (∑y||Pa - Pd||p)1/p

Onde a distância da norma p entre os pontos x e y é definida da seguinte forma:

        Lp(x, y) = (|x1-y1|p + |x2-y2|p + … +|xn-yn|p)1/p

A norma 2 é a norma euclidiana. Suponha que você tenha uma distribuição de resultados com três categorias, por exemplo, yi = {y0, y1, y2} = {aceito, na lista de espera, rejeitado} em um cenário multicategórico de admissões em faculdades. Você obtém a soma dos quadrados das diferenças entre as contagens de resultados para as facetas a e d. A distância euclidiana resultante é calculada da seguinte forma:

        L2(Pa, Pd) = [(na(0) - nd(0))2 + (na(1) - nd(1))2 + (na(2) - nd(2))2]1/2

Em que:

  • Númeroa(i) é o número dos resultados da iésima categoria na faceta a: por exemplo, na(0) é o número de aceitações da faceta a.

  • nd(i) é o número dos resultados da iésima categoria na faceta d: por exemplo, nd(2) é o número de rejeições da faceta d.

    O intervalo de valores de LP para resultados binários, multicategóricos e contínuos é [0, √2), onde:

    • Valores próximos de zero significam que os rótulos estão distribuídos de forma semelhante.

    • Valores positivos significam que as distribuições dos rótulos divergem; quanto mais positivas, maior a divergência.