Visualizzazione dell'anteprima del modello - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Visualizzazione dell'anteprima del modello

Nota

Le seguenti funzionalità sono disponibili solo per i modelli personalizzati creati con set di dati tabulari. Sono esclusi anche i modelli di previsione del testo multicategoria.

SageMaker Canvas fornisce strumenti per visualizzare in anteprima il modello e convalidare i dati prima di iniziare a costruire. Le seguenti funzionalità includono l'anteprima dell'accuratezza del modello, la convalida del set di dati per prevenire problemi durante la creazione del modello e la modifica della dimensione del campione casuale per il modello.

Anteprima di un modello

Con Amazon SageMaker Canvas, puoi ottenere informazioni dettagliate dai tuoi dati prima di creare un modello scegliendo il modello di anteprima. Ad esempio, è possibile vedere come vengono distribuiti i dati in ogni colonna. Per i modelli creati utilizzando dati categorici, è possibile anche scegliere Anteprima modello per generare una previsione con precisione stimata dell'efficacia con cui il modello potrebbe analizzare i dati. La precisione di una Creazione rapida o di una Creazione standard rappresenta l’efficacia delle prestazioni del modello su dati reali ed è generalmente superiore alla precisione stimata.

Amazon SageMaker Canvas gestisce automaticamente i valori mancanti nel set di dati durante la creazione del modello. Deduce i valori mancanti utilizzando valori adiacenti presenti nel set di dati.

Screenshot della scheda Crea per un modello in Canvas.

Convalida dei dati

Prima di creare il modello, SageMaker Canvas controlla il set di dati per individuare eventuali problemi che potrebbero causare il fallimento della compilazione. Se SageMaker Canvas rileva dei problemi, ti avvisa nella pagina Build prima di tentare di creare un modello.

È possibile scegliere Convalida dati per visualizzare un elenco dei problemi con il tuo set di dati. È quindi possibile utilizzare le funzionalità di preparazione dei dati di SageMaker Canvas o i propri strumenti per correggere il set di dati prima di iniziare una compilazione. Se non risolvi i problemi con il set di dati, la creazione fallisce.

Se apporti modifiche al set di dati per risolvere i problemi, hai la possibilità di riconvalidarlo prima di tentare una creazione. Si consiglia di riconvalidare il set di dati prima di procedere alla creazione.

La tabella seguente mostra i problemi che SageMaker Canvas verifica nel set di dati e come risolverli.

Problema Risoluzione

Tipo di modello errato per i dati

Prova un altro tipo di modello o utilizza un set di dati diverso.

Valori mancanti nella colonna di destinazione

Sostituisci i valori mancanti, elimina le righe con i valori mancanti o utilizza un set di dati diverso.

Troppe etichette univoche nella colonna di destinazione

Verifica di aver utilizzato la colonna corretta per la colonna di destinazione o utilizza un set di dati diverso.

Troppi valori non numerici nella colonna di destinazione

Scegli una colonna di destinazione diversa, seleziona un altro tipo di modello o utilizza un set di dati diverso.

I nomi di uno o più nomi di colonne contengono caratteri di sottolineatura doppi

Rinomina le colonne per rimuovere i doppi caratteri di sottolineatura e riprova.

Nessuna riga del set di dati è completa

Sostituisci i valori mancanti o utilizza un set di dati diverso.

Troppe etichette univoche per il numero di righe dei dati

Verifica di utilizzare la colonna di destinazione giusta, aumenta il numero di righe nel set di dati, consolida etichette simili o utilizza un set di dati diverso.

Campione casuale

SageMaker Canvas utilizza il metodo di campionamento casuale per campionare il set di dati. Il metodo di campionamento casuale significa che ogni riga ha la stessa probabilità di essere selezionata per il campione. È possibile scegliere una colonna nell'anteprima per ottenere statistiche di riepilogo per il campione casuale, come la media e la modalità.

Per impostazione predefinita, SageMaker Canvas utilizza una dimensione del campione casuale di 20.000 righe del set di dati per set di dati con più di 20.000 righe. Per set di dati inferiori a 20.000 righe, la dimensione del campione predefinita è il numero di righe del set di dati. Puoi aumentare o diminuire la dimensione del campione scegliendo Campione casuale nella scheda Build dell'applicazione Canvas. SageMaker Puoi utilizzare il dispositivo di scorrimento per selezionare la dimensione del campione desiderata, quindi scegliere Aggiorna per modificare la dimensione del campione. La dimensione massima del campione che è possibile scegliere per un set di dati è di 40.000 righe e la dimensione minima del campione è di 500 righe. Se scegli una dimensione del campione grande, il caricamento dell'anteprima del set di dati e del riepilogo delle statistiche potrebbe richiedere alcuni istanti.

La pagina Crea mostra un'anteprima di 100 righe del set di dati. Se la dimensione del campione è la stessa del set di dati, l'anteprima utilizza le prime 100 righe del set di dati. Altrimenti, l'anteprima utilizza le prime 100 righe del campione casuale.