集群问题排查 - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

集群问题排查

集EMR群在复杂的生态系统中运行,该生态系统包括开源软件、自定义应用程序代码和 AWS 服务。当以上任何环节出现问题时,集群都可能失败,或者花费比您预期更长的时间才能完成。以下主题可帮助您识别集群的问题以及如何修复它们。

在开发新的 Hadoop 应用程序时,我们建议您启用调试并处理一小部分但具有代表性的数据子集以测试应用程序。您可能还需要运行应用程序 step-by-step 来分别测试每个步骤。有关更多信息,请参阅配置集群日志记录和调试步骤 5:分步测试集群