Considerazioni sull'ottimizzazione dei processi - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Considerazioni sull'ottimizzazione dei processi

Il committer EMRFS ottimizzato per S3 consuma una piccola quantità di memoria per ogni file scritto da un tentativo di task fino a quando l'operazione non viene confermata o interrotta. Nella maggior parte dei processi la quantità di memoria consumata è trascurabile. Per i processi che presentano attività di lunga esecuzione che scrivono un numero elevato di file, la memoria che il committer consuma può essere notevole e richiede l'adeguamento della memoria allocata per gli executor Spark. Puoi ottimizzare la memoria dell'executor mediante la proprietà spark.executor.memory. Orientativamente, un'unica attività che scrive 100.000 file in genere richiede ulteriori 100 MB di memoria. Per ulteriori informazioni, consulta le Proprietà delle applicazioni nella documentazione relativa alla configurazione di Apache Spark.