SageMaker Lavori su notebook - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker Lavori su notebook

Puoi usare Amazon SageMaker per creare, addestrare e distribuire in modo interattivo modelli di machine learning dal tuo notebook Jupyter in qualsiasi ambiente. JupyterLab Tuttavia, esistono diversi scenari in cui potresti voler eseguire il tuo notebook come un processo pianificato e non interattivo. Ad esempio, è possibile creare rapporti di controllo periodici che analizzino tutti i processi di addestramento eseguiti in un determinato periodo di tempo e analizzino il valore aziendale derivante dall'implementazione di tali modelli in produzione. Potresti anche voler ampliare un processo di progettazione delle funzionalità dopo aver testato la logica di trasformazione dei dati su un sottoinsieme di dati ridotto. Altri casi d’uso comuni comprendono:

  • Pianificazione dei processi per il monitoraggio delle variazioni dei modelli

  • Esplorazione dello spazio dei parametri per modelli ottimizzati

In questi scenari, puoi utilizzare SageMaker Notebook Jobs per creare un processo non interattivo (che SageMaker viene eseguito come processo di formazione sottostante) da eseguire su richiesta o secondo una pianificazione. SageMaker Notebook Jobs offre un'interfaccia utente intuitiva che consente di pianificare i lavori direttamente JupyterLab scegliendo il widget Notebook Jobs ( ) nel notebook. Puoi anche pianificare i tuoi lavori utilizzando SageMaker Python SDK, che offre la flessibilità di pianificare più lavori su notebook in un flusso di lavoro di pipeline. È possibile eseguire più notebook in parallelo e parametrizzare le celle dei notebook per personalizzare i parametri di input.

Questa funzionalità sfrutta i servizi Amazon EventBridge, SageMaker Training e SageMaker Pipelines ed è disponibile per l'uso nel notebook Jupyter in uno dei seguenti ambienti:

  • Istanze Studio, Studio Lab, Studio Classic o Notebook

  • Configurazione locale, ad esempio sul computer locale, su cui si esegue JupyterLab

Prerequisiti

Per pianificare un processo relativo al notebook, verifica che siano soddisfatti i seguenti criteri:

  • Assicurati che il tuo notebook Jupyter e tutti gli script di inizializzazione o avvio siano autonomi per quanto riguarda il codice e i pacchetti software. In caso contrario, il processo non interattivo potrebbe comportare errori.

  • Controlla Vincoli e considerazioni per assicurarti di aver configurato correttamente il notebook Jupyter, le impostazioni di rete e le impostazioni del container.

  • Assicurati che il tuo notebook possa accedere alle risorse esterne necessarie, come i cluster Amazon EMR.

  • Se stai configurando Notebook Jobs su un notebook Jupyter locale, completa l'installazione. Per istruzioni, consulta Guida all'installazione.

  • Se ti connetti a un cluster Amazon EMR sul tuo notebook e desideri parametrizzare il comando di connessione Amazon EMR, devi applicare una soluzione alternativa utilizzando le variabili di ambiente per trasmettere i parametri. Per informazioni dettagliate, vedi Connect a un cluster Amazon EMR dal tuo notebook.

  • Se ti connetti a un cluster Amazon EMR utilizzando l'autenticazione Kerberos, LDAP o HTTP Basic Auth, devi utilizzare l' AWS Secrets Manager per passare le credenziali di sicurezza al comando di connessione Amazon EMR. Per informazioni dettagliate, vedi Connect a un cluster Amazon EMR dal tuo notebook.

  • (Facoltativo) Se desideri che l'interfaccia utente precarichi uno script da eseguire all'avvio del notebook, l'amministratore deve installarlo con una configurazione del ciclo di vita (LCC). Per informazioni su come utilizzare uno script LCC, consulta Personalizzazione di un'istanza del notebook utilizzando uno script di configurazione del ciclo di vita.