Inizia con le sessioni AWS Glue interattive - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Inizia con le sessioni AWS Glue interattive

In questa guida, imparerai come avviare una sessione AWS Glue interattiva in SageMaker Studio Classic e gestire il tuo ambiente con Jupyter magics.

Autorizzazioni per sessioni interattive in Studio Classic AWS Glue SageMaker

Questa sezione elenca le politiche richieste per eseguire sessioni AWS Glue interattive in Studio Classic e spiega come configurarle. In particolare, descrive in dettaglio come:

  • Allega la policy AwsGlueSessionUserRestrictedServiceRole gestita al tuo ruolo di SageMaker esecuzione.

  • Crea una politica personalizzata in linea sul tuo ruolo di SageMaker esecuzione.

  • Modifica la relazione di fiducia del tuo ruolo di SageMaker esecuzione.

Per collegare la policy gestita AwsGlueSessionUserRestrictedServiceRole al tuo ruolo di esecuzione
  1. Apri la console IAM.

  2. Selezionare Ruoli nel pannello a sinistra.

  3. Trova il tuo ruolo di esecuzione in Studio Classic. Scegliere il nome del ruolo per accedere alla relativa pagina di riepilogo.

  4. Nella scheda Autorizzazioni, selezionare Collega policy dal menu a discesa Aggiungi autorizzazioni.

  5. Seleziona la casella di controllo accanto alla policy gestita AwsGlueSessionUserRestrictedServiceRole.

  6. Scegli Collega policy.

    La pagina di riepilogo mostra le policy gestite appena aggiunte.

Per creare una policy personalizzata in linea sul tuo ruolo di esecuzione
  1. Seleziona Crea policy in linea nel menu a discesa Aggiungi autorizzazioni.

  2. Seleziona la scheda JSON.

  3. Copia e incolla nella seguente policy.

    { "Version": "2012-10-17", "Statement": [ { "Sid": "unique_statement_id", "Effect": "Allow", "Action": [ "iam:GetRole", "iam:PassRole", "sts:GetCallerIdentity" ], "Resource": "*" } ] }
  4. Scegli Verifica policy.

  5. Inserisci un Nome, quindi seleziona Crea policy.

    La pagina di riepilogo mostra le policy personalizzate appena aggiunte.

Per modificare la relazione di attendibilità del ruolo di esecuzione
  1. Seleziona la scheda Relazioni di attendibilità.

  2. Seleziona Modifica policy di attendibilità.

  3. Copia e incolla nella seguente policy.

    { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "glue.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }
  4. Scegli Aggiorna policy.

Puoi aggiungere ruoli e policy aggiuntivi se devi accedere ad altre risorse AWS . Per una descrizione dei ruoli e delle policy aggiuntivi che puoi includere, consulta Sessioni interattive con IAM nella AWS Glue documentazione.

Propagazione di tag

I tag vengono comunemente utilizzati per tenere traccia e allocare i costi, controllare l'accesso alla sessione, isolare le risorse e altro ancora. Per ulteriori informazioni sull'aggiunta di metadati alle risorse AWS utilizzando i tag o per dettagli sui casi d'uso comuni, consulta Informazioni aggiuntive.

Puoi abilitare la propagazione automatica dei AWS tag in nuove sessioni AWS Glue interattive create dall'interno dell'interfaccia utente di Studio Classic. Quando viene creata una sessione AWS Glue interattiva da SageMaker Studio Classic, tutti i tag definiti dall'utente allegati al profilo utente o allo spazio condiviso vengono trasferiti nella nuova sessione AWS Glue interattiva. Inoltre, SageMaker Studio Classic aggiunge automaticamente due tag interni AWS generati (sagemaker:user-profile-arnesagemaker:domain-arn) o (sagemaker:shared-space-arne)sagemaker:domain-arn) alle nuove sessioni AWS Glue interattive create dall'interfaccia utente di Studio Classic. È possibile utilizzare questi tag per aggregare i costi su singoli domini, profili utente o spazi.

Abilitare la propagazione di tag

Per abilitare la propagazione automatica dei tag in nuove sessioni AWS Glue interattive, imposta le seguenti autorizzazioni per il tuo ruolo di SageMaker esecuzione e il ruolo IAM associato alla sessione: AWS Glue

Nota

Per impostazione predefinita, il ruolo associato alla sessione AWS Glue interattiva è lo stesso del ruolo di SageMaker esecuzione. È possibile specificare un ruolo di esecuzione diverso per la sessione AWS Glue interattiva utilizzando il comando %iam_role magico. Per informazioni sui comandi magici di Jupyter disponibili per configurare le sessioni AWS Glue interattive, vedere. Configura la tua sessione AWS Glue interattiva in Studio Classic SageMaker

  • Sul tuo ruolo di SageMaker esecuzione: crea una nuova politica in linea e incolla il seguente file JSON. La policy concede al ruolo di esecuzione l'autorizzazione a descrivere (DescribeUserProfile,DescribeSpace,DescribeDomain) ed elencare i tag (ListTag) impostati nei profili utente, negli spazi condivisi e nel dominio. SageMaker

    { "Effect": "Allow", "Action": [ "sagemaker:ListTags" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*", "arn:aws:sagemaker:*:*:space/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeUserProfile" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeSpace" ], "Resource": [ "arn:aws:sagemaker:*:*:space/*" ] } { "Effect": "Allow", "Action": [ "sagemaker:DescribeDomain" ], "Resource": [ "arn:aws:sagemaker:*:*:domain/*" ] }
  • Sul ruolo IAM della tua sessione AWS Glue : crea una nuova policy in linea e incolla il seguente file JSON. La policy concede al tuo ruolo l’autorizzazione per collegare tag (TagResource) alla sessione o di recuperarne l'elenco di tag (GetTags).

    { "Effect": "Allow", "Action": [ "glue:TagResource", "glue:GetTags" ], "Resource": [ "arn:aws:glue:*:*:session/*" ] }
Nota
  • Gli errori che si verificano durante l'applicazione di tali autorizzazioni non impediscono la creazione di sessioni interattive. AWS Glue I dettagli sul motivo dell'errore sono disponibili nei log di SageMaker Studio Classic. CloudWatch

  • È necessario riavviare il kernel della sessione AWS Glue interattiva per propagare l'aggiornamento del valore di un tag.

È importante tenere a mente i seguenti punti:

  • Una volta che un tag è collegato a una sessione, non può essere rimosso mediante propagazione.

    È possibile rimuovere i tag da una sessione AWS Glue interattiva direttamente tramite l' AWS CLIAWS Glue API o https://console.aws.amazon.com/sagemaker/. Ad esempio, utilizzando AWS CLI, puoi rimuovere un tag fornendo l'ARN della sessione e le chiavi dei tag che desideri rimuovere come segue:

    aws glue untag-resource \ --resource-arn arn:aws:glue:region:account-id:session:session-name \ --tags-to-remove tag-key1,tag-key2
  • SageMaker Studio Classic aggiunge due tag interni AWS generati ((sagemaker:user-profile-arnandsagemaker:domain-arn) o (sagemaker:shared-space-arnand)sagemaker:domain-arn) alle nuove sessioni AWS Glue interattive create dall'interfaccia utente di Studio Classic. Questi tag vengono conteggiati nel limite di 50 tag impostato su tutte le AWS risorse. Entrambi sagemaker:shared-space-arn contengono sagemaker:user-profile-arn l'ID di dominio a cui appartengono.

  • Le chiavi dei tag che iniziano con aws: o qualsiasi combinazione di lettere maiuscole e minuscole come prefisso per le chiavi non vengono propagate e sono riservate all'uso. AWS: AWS

Informazioni aggiuntive

Per ulteriori informazioni tagging, fai riferimento alle seguenti risorse.

Avvia la sessione AWS Glue interattiva su SageMaker Studio Classic

Dopo aver creato i ruoli, le politiche e il SageMaker dominio, puoi avviare la sessione AWS Glue interattiva in SageMaker Studio Classic.

Per avviare AWS Glue in SageMaker Studio Classic
  1. Crea un SageMaker dominio. Per istruzioni su come creare un nuovo dominio, consultaPanoramica SageMaker del dominio Amazon.

  2. Accedi alla SageMaker console all'indirizzo https://console.aws.amazon.com/sagemaker/.

  3. Seleziona Pannello di controllo nel pannello a sinistra.

  4. Nel menu a discesa Avvia l’applicazione accanto al nome utente, seleziona Studio.

  5. Nella vista Jupyter, scegli File, quindi Nuovo, quindi Notebook.

  6. Nel menu a discesa Immagine, seleziona SparkAnalytics 1.0 o SparkAnalytics2.0. Nel menu a discesa del kernel, seleziona Glue Spark o Glue Python [and Ray]. PySpark Scegli Seleziona.

  7. (facoltativo) Utilizza le magie Jupyter per personalizzare il tuo ambiente. Per ulteriori informazioni sulle magie Jupyter, consulta Configura la tua sessione AWS Glue interattiva in Studio Classic SageMaker.

  8. Inizia a scrivere gli script di elaborazione di dati Spark.

Configura la tua sessione AWS Glue interattiva in Studio Classic SageMaker

Nota

Tutte le configurazioni magiche vengono trasferite alle sessioni successive per tutta la durata del kernel. AWS Glue

Puoi usare Jupyter magics nella tua sessione AWS Glue interattiva per modificare i parametri di sessione e configurazione. Le magie sono brevi comandi con il prefisso % all’inizio delle celle di Jupyter che forniscono un modo semplice e veloce per aiutarti a controllare l'ambiente. Nella sessione AWS Glue interattiva, le seguenti magie sono impostate automaticamente per te:

Magia Valore predefinito
%glue_version

3.0

%iam_role

ruolo di esecuzione associato al tuo dominio SageMaker

%region

la tua regione

Puoi usare le magie per personalizzare ulteriormente il tuo ambiente. Ad esempio, se desideri modificare il numero di worker assegnati al tuo lavoro dal valore predefinito di cinque a 10, puoi specificare %number_of_workers 10. Se desideri configurare la sessione in modo che si interrompa dopo 10 minuti di inattività anziché il 2880 predefinito, puoi specificare %idle_timeout 10.

Tutte le magie di Jupyter attualmente disponibili in AWS Glue sono disponibili anche in Studio Classic. SageMaker Per l'elenco completo dei AWS Glue magics disponibili, consulta Configurazione delle sessioni AWS Glue interattive per i notebook Jupyter e Studio Classic. AWS Glue