拒否リストに登録されたノード - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

拒否リストに登録されたノード

- NodeManager デーモンは、コアとタスクノードでコンテナの起動や管理を行います。コンテナは、 NodeManager によるデーモン ResourceManager マスターノードで実行されるデーモン。- ResourceManager を監視する NodeManager ハートビートを介してノードを実行します。

いくつかの状況があります。 ResourceManager デーモン deny NodeManager をリストに記載し、タスク処理に利用できるノードのプールから削除します。

  • そのファイルに NodeManager にハートビートを送信していない ResourceManager 過去 10 分 (60,000 ミリ秒) のデーモン。この時間は yarn.nm.liveness-monitor.expiry-interval-ms 設定で設定できます。Yarn 設定の変更の詳細については「Amazon EMR リリースガイド」の「アプリケーションの設定」を参照してください。

  • NodeManager は yarn.nodemanager.local-dirsyarn.nodemanager.log-dirs が決定するディスクの正常性をチェックします。このチェックにはアクセス権限と空きディスク容量 (< 90%) が含まれます。ディスクがチェックに失敗した場合、 NodeManager その特定のディスクの使用を停止しますが、ノードのステータスが正常であるとレポートされます。多数のディスクがチェックに失敗した場合、ノードは異常であるとレポートされます。 ResourceManager 新しいコンテナはノードに割り当てられません。

アプリケーションマスターはリスト a を拒否することもできます。 NodeManager 失敗したタスクが 3 つ以上ある場合、ノード。mapreduce.job.maxtaskfailures.per.tracker 設定パラメータを利用し、この値を増やすことができます。他には、タスクを失敗と判定するまでに試行する回数を制御する設定を変更できます。マップタスクの場合は mapreduce.map.max.attempts を、リデュースタスクの場合は mapreduce.reduce.maxattempts を変更します。設定の変更の詳細については「Amazon EMR リリースガイド」の「アプリケーションの設定」を参照してください。