DistinctValuesCount - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

DistinctValuesCount

Seleziona il numero di valori distinti in una colonna rispetto a una determinata espressione.

Sintassi

DistinctValuesCount <COL_NAME> <EXPRESSION>
  • COL_ NAME — Il nome della colonna in base alla quale si desidera valutare la regola di qualità dei dati.

    Tipi di colonna supportati: qualsiasi tipo di colonna

  • EXPRESSION— Un'espressione da eseguire sulla risposta del tipo di regola per produrre un valore booleano. Per ulteriori informazioni, consulta Espressioni.

Esempio: conteggio dei valori distinti delle colonne

La seguente regola di esempio verifica che la colonna denominata State contenga più di 3 valori distinti.

DistinctValuesCount "State" > 3 DistinctValuesCount "Customer_ID" < 6 where "Customer_ID < 10"

Regole dinamiche di esempio

  • DistinctValuesCount "colA" between avg(last(10))-1 and avg(last(10))+1

  • DistinctValuesCount "colA" <= index(last(10),2) + std(last(5))