作業調校考量 - Amazon EMR

作業調校考量

針對由任務嘗試寫入的每個檔案,EMRFS S3 最佳化遞交器會耗用少量記憶體,直到任務遞交或中止。在大多數任務中,記憶體的消耗量極少。對於具有寫入大量檔案之長期執行任務的工作,遞交器耗用的記憶體量可能會很明顯,並需要調整配置給 Spark 執行器的記憶體。您可以使用 spark.executor.memory 屬性調校執行器記憶體。根據準則,寫入 100,000 個檔案的單一任務通常需要額外 100 MB 的記憶體。如需詳細資訊,請參閱 Apache Spark 組態文件中的應用程式屬性