平均值
检查列中所有值的均值(平均值)是否与给定表达式匹配。
语法
Mean
<COL_NAME>
<EXPRESSION>
COL_NAME — 要根据其评估数据质量规则的列的名称。
支持的列类型:字节、十进制、双精度、浮点数、整数、长整数、短整数
EXPRESSION — 针对规则类型响应运行以生成布尔值的表达式。有关更多信息,请参阅 Expressions。
示例:平均值
以下示例规则检查列中所有值的平均值是否超过阈值。
Mean "Star_Rating" > 3 Mean "Salary" < 6200 where "Customer_ID < 10"
示例动态规则
Mean "colA" > avg(last(10)) + std(last(2))
Mean "colA" between min(last(5)) - 1 and max(last(5)) + 1
零值行为
在计算均值时,Mean
规则将忽略含有 NULL
值的行。例如:
+---+-----------+ |id |units | +---+-----------+ |100|0 | |101|null | |102|20 | |103|null | |104|40 | +---+-----------+
列 units
的均值将为 (0 + 20 + 40)/3 = 20。在此计算中不会考虑第 101 行和第 103 行。