파일을 1개 노드가 아니라 0개 노드로만 복제할 수 있습니다. - 아마존 EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

파일을 1개 노드가 아니라 0개 노드로만 복제할 수 있습니다.

파일에 기록되면 여러 코어 HDFS 노드에 복제됩니다. 이 오류가 표시되면 NameNode 데몬에 데이터를 쓸 수 있는 사용 가능한 DataNode 인스턴스가 없다는 의미입니다. HDFS 다시 말해서, 블록 복제가 발생하지 않는 것입니다. 이 오류는 여러 문제로 인해 발생할 수 있습니다.

  • HDFS파일 시스템 공간이 부족했을 수 있습니다. 이 문제는 가장 큰 원인입니다.

  • DataNode 작업이 실행되었을 때 인스턴스를 사용할 수 없었을 수 있습니다.

  • DataNode 인스턴스가 마스터 노드와의 통신이 차단되었을 수 있습니다.

  • 코어 인스턴스 그룹 내 인스턴스의 사용이 불가능할 수도 있습니다.

  • 권한이 없을 수도 있습니다. 예를 들어, JobTracker 데몬은 작업 추적기 정보를 생성할 권한이 없을 수 있습니다.

  • DataNode 인스턴스의 예약 공간 설정이 충분하지 않을 수 있습니다. dfs.datanode.du.reserved 구성 설정을 확인하여 이 경우에 해당하는지 확인합니다.

이 문제가 디스크 공간 HDFS 부족으로 인한 것인지 확인하려면 의 HDFSUtilization 지표를 살펴보십시오 CloudWatch. 이 값이 너무 높은 경우 코어 노드를 클러스터에 더 추가할 수 있습니다. 클러스터에 HDFS 디스크 공간이 부족할 것으로 생각되는 경우 값이 특정 수준 HDFSUtilization 이상으로 올라가면 CloudWatch 경고하도록 경보를 설정할 수 있습니다. 자세한 내용은 실행 중인 클러스터의 크기를 수동으로 조정합니다.다음을 사용하여 Amazon EMR 메트릭을 모니터링합니다. CloudWatch 단원을 참조하세요.

공간 HDFS 부족이 문제가 아닌 경우 DataNode 로그, NameNode 로그 및 네트워크 HDFS 연결에서 데이터 복제를 방해할 수 있는 다른 문제가 없는지 확인하십시오. 자세한 내용은 로그 파일 보기 단원을 참조하십시오.