Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Lo schema definito nel file statistics.json
specifica i parametri statistici da calcolare per la linea di base e i dati acquisiti. Configura anche il bucket che deve essere utilizzato da KLL
{
"version": 0,
# dataset level stats
"dataset": {
"item_count": number
},
# feature level stats
"features": [
{
"name": "feature-name",
"inferred_type": "Fractional" | "Integral",
"numerical_statistics": {
"common": {
"num_present": number,
"num_missing": number
},
"mean": number,
"sum": number,
"std_dev": number,
"min": number,
"max": number,
"distribution": {
"kll": {
"buckets": [
{
"lower_bound": number,
"upper_bound": number,
"count": number
}
],
"sketch": {
"parameters": {
"c": number,
"k": number
},
"data": [
[
num,
num,
num,
num
],
[
num,
num
][
num,
num
]
]
}#sketch
}#KLL
}#distribution
}#num_stats
},
{
"name": "feature-name",
"inferred_type": "String",
"string_statistics": {
"common": {
"num_present": number,
"num_missing": number
},
"distinct_count": number,
"distribution": {
"categorical": {
"buckets": [
{
"value": "string",
"count": number
}
]
}
}
},
#provision for custom stats
}
]
}
Note
-
Le metriche specificate vengono riconosciute dall' SageMaker IA nelle successive modifiche di visualizzazione. Il container può emettere più parametri se necessario.
-
Lo sketch KLL
è lo sketch riconosciuto. I contenitori personalizzati possono scrivere la propria rappresentazione, ma questa non verrà riconosciuta dall' SageMaker IA nelle visualizzazioni. -
Per impostazione predefinita, la distribuzione è materializzata in 10 bucket. Non puoi modificare questo valore.