Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Monitora, aggiorna ed elimina le risorse di Amazon EMR Studio
Questa sezione include istruzioni per monitorare, aggiornare o eliminare una risorsa EMR Studio. Per informazioni su come assegnare utenti o aggiornare le autorizzazioni utente, consulta Assegnazione e gestione degli utenti di EMR Studio.
Visualizzazione dei dettagli dello Studio
Monitoraggio delle operazioni di Amazon EMR Studio
Visualizzazione dell'attività di EMR Studio e dell'API
EMR Studio è integrato con AWS CloudTrail, un servizio che fornisce un registro delle azioni intraprese da un utente, da un ruolo IAM o da un altro AWS servizio in EMR Studio. CloudTrail acquisisce le chiamate API per EMR Studio come eventi. È possibile visualizzare gli eventi utilizzando la CloudTrail console all'indirizzo. https://console.aws.amazon.com/cloudtrail/
Gli eventi EMR Studio forniscono informazioni come quale utente Studio o IAM effettua una richiesta e il tipo di richiesta.
Nota
Le operazioni on-cluster come l'esecuzione di processi notebook non emetto AWS CloudTrail.
Puoi anche creare un percorso per la distribuzione continua degli CloudTrail eventi EMR Studio a un bucket Amazon S3. Per ulteriori informazioni, consulta la Guida per l'utente AWS CloudTrail.
CloudTrail Evento di esempio: un utente chiama l'API DescribeStudio
Di seguito è riportato un AWS CloudTrail evento di esempio che viene creato quando un utente chiama l'DescribeStudioAPI. admin
CloudTrail registra il nome utente comeadmin
.
Nota
Per proteggere i dettagli di Studio, l'evento API EMR Studio per DescribeStudio esclude un valore per. responseElements
{
"eventVersion":"1.08",
"userIdentity":{
"type":"IAMUser",
"principalId":"AIDXXXXXXXXXXXXXXXXXX",
"arn":"arn:aws:iam::653XXXXXXXXX:user/admin
",
"accountId":"653XXXXXXXXX",
"accessKeyId":"AKIAIOSFODNN7EXAMPLE",
"userName":"admin
"
},
"eventTime":"2021-01-07T19:13:58Z",
"eventSource":"elasticmapreduce.amazonaws.com",
"eventName":"DescribeStudio",
"awsRegion":"us-east-1",
"sourceIPAddress":"72.XX.XXX.XX",
"userAgent":"aws-cli/1.18.188 Python/3.8.5 Darwin/18.7.0 botocore/1.19.28",
"requestParameters":{
"studioId":"es-9O5XXXXXXXXXXXXXXXXXXXXXX"
},
"responseElements":null,
"requestID":"0fxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
"eventID":"b0xxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
"readOnly":true,
"eventType":"AwsApiCall",
"managementEvent":true,
"eventCategory":"Management",
"recipientAccountId":"653XXXXXXXXX"
}
Visualizzazione dell'attività degli utenti e dei processi Spark
Per visualizzare l'attività dei processi Spark da parte degli utenti di Amazon EMR Studio, è possibile configurare la rappresentazione utente in un cluster. Con la rappresentazione utente, ogni processo Spark inviato da un Workspace è associato all'utente Studio che ha eseguito il codice.
Quando la rappresentazione utente è abilitata, Amazon EMR crea una directory utente HDFS nel nodo primario del cluster per ogni utente che esegue il codice nel Workspace. Ad esempio, se l'utente studio-user-1@example.com
esegue il codice, puoi collegarti al nodo primario per riscontrare che hadoop fs -ls /user
ha una directory per studio-user-1@example.com
.
Per impostare la rappresentazione utente di Spark, imposta le seguenti proprietà nelle classificazioni di configurazione:
-
core-site
-
livy-conf
[ { "Classification": "core-site", "Properties": { "hadoop.proxyuser.livy.groups": "*", "hadoop.proxyuser.livy.hosts": "*" } }, { "Classification": "livy-conf", "Properties": { "livy.impersonation.enabled": "true" } } ]
Per visualizzare le pagine del server della cronologia, consulta Debug di applicazioni e processi con EMR Studio. È inoltre possibile connettersi al nodo primario del cluster utilizzando SSH per visualizzare le interfacce Web dell'applicazione. Per ulteriori informazioni, consulta Visualizzazione di interfacce Web ospitate su cluster Amazon EMR.
Aggiornamento di un Amazon EMR Studio
Dopo aver creato un EMR Studio, puoi aggiornare i seguenti attributi utilizzando la AWS CLI:
-
Nome
-
Descrizione
-
Percorso S3 predefinito
-
Sottoreti
Per aggiornare un EMR Studio utilizzando il AWS CLI
Usa il update-studio
AWS CLI comando per aggiornare un EMR Studio. Per ulteriori informazioni, consulta la sezione relativa alle informazioni di riferimento ai comandi della AWS CLI .
Nota
Puoi associare uno Studio a un massimo di 5 sottoreti. Queste sottoreti devono appartenere allo stesso VPC dello Studio. L'elenco di IDs sottoreti inviato al update-studio
comando può includere una nuova sottorete IDs, ma deve includere anche tutta la sottorete IDs già associata a Studio. Non è possibile rimuovere le sottoreti da uno Studio.
aws emr update-studio \ --studio-id
<example-studio-id-to-update>
\ --name<example-new-studio-name>
\ --subnet-ids<old-subnet-id-1 old-subnet-id-2 old-subnet-id-3 new-subnet-id>
\
Per verificare le modifiche, utilizzate il describe-studio
AWS CLI comando e specificate il vostro ID Studio. Per ulteriori informazioni, consulta la Guida di riferimento ai comandi della AWS CLI .
aws emr describe-studio \ --studio-id
<id-of-updated-studio>
\
Eliminazione di un Amazon EMR Studio e di Workspace
Quando elimini uno Studio, EMR Studio elimina tutte le assegnazioni di utenti e gruppi IAM Identity Center che sono associate allo Studio.
Nota
Quando elimini uno Studio, Amazon EMR non elimina i Workspace a esso associati. È necessario eliminare separatamente i Workspace nello Studio.
Eliminazione dei Workspace
Eliminazione di un EMR Studio