Solución de problemas de Amazon EFS: problemas generales - Amazon Elastic File System

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas de Amazon EFS: problemas generales

Utilice esta información para solucionar problemas generales de Amazon EFS. Para obtener más información acerca del rendimiento, consulte Rendimiento de Amazon EFS.

En general, si surge algún problema con Amazon EFS que le resulta difícil resolver, confirme que está utilizando un kernel de Linux reciente. Si utiliza una distribución de Linux empresarial, le recomendamos lo siguiente:

  • Amazon Linux 2 con kernel 4.3 o posterior

  • Amazon Linux 2015.09 o posterior

  • RHEL 7.3 o posterior

  • Todas las versiones de Ubuntu 16.04

  • Ubuntu 14.04 con kernel 3.13.0-83 o posterior

  • SLES 12 Sp2 o posterior

Si utiliza otra distribución o un kernel personalizado, le recomendamos la versión de kernel 4.3 o posterior.

nota

RHEL 6.9 podría ser inadecuado para determinadas cargas de trabajo debido a Rendimiento bajo al abrir muchos archivos en paralelo.

No se puede crear un sistema de archivos de EFS

Se produce un error en la solicitud de creación de un sistema de archivos de EFS y aparece el siguiente mensaje:

User: arn:aws:iam::111122223333:user/username is not authorized to perform: elasticfilesystem:CreateFileSystem on the specified resource.
Acción que debe ejecutarse

Compruebe su política AWS Identity and Access Management (de IAM) para confirmar que está autorizado a crear sistemas de archivos EFS con las condiciones de recursos especificadas. Para obtener más información, consulte Administración de identidades y acceso Amazon Elastic File System.

Acceso denegado a los archivos permitidos en el sistema de archivos NFS

Cuando un usuario al que se le asignan más de 16 identificadores de grupos de acceso (GID) intenta realizar una operación en un sistema de archivos NFS, se le puede denegar el acceso a los archivos permitidos en el sistema de archivos. Este problema se produce porque el protocolo NFS admite un máximo de 16 GID por usuario y cualquier GID adicional se trunca con respecto a la solicitud del cliente de NFS, tal como se define en el RFC 5531.

Acción que debe ejecutarse

Reestructure las asignaciones de usuarios y grupos de NFS para que a cada usuario no se le asignen más de 16 grupos de acceso (GID).

Errores al acceder a la consola de Amazon EFS

En esta sección se describen los errores que pueden experimentar los usuarios al acceder a la consola de administración de Amazon EFS.

Error al autenticar las credenciales de ec2:DescribeVPCs

Al acceder a la consola de Amazon EFS, aparece el siguiente mensaje de error:

AuthFailure: An error occurred authenticating your credentials for ec2:DescribeVPCs.

Este error indica que sus credenciales de inicio de sesión no se autenticaron correctamente con el servicio de Amazon EC2. La consola de Amazon EFS llama al servicio de Amazon EC2 en su nombre al crear sistemas de archivos de EFS en la VPC que elija.

Acción que debe ejecutarse

Asegúrese de que la hora en que el cliente accede a la consola de Amazon EFS esté configurada correctamente.

La instancia de Amazon EC2 deja de responder

Una instancia de Amazon EC2 puede dejar de responder porque ha eliminado un destino de montaje de sistema de archivos sin desmontar primero el sistema de archivos.

Acción que debe ejecutarse

Antes de eliminar un destino de montaje de sistema de archivos, desmonte el sistema de archivos. Para obtener más información sobre el desmontaje de su sistema de archivos de Amazon EFS, consulte Desmontaje de sistemas de archivos.

La aplicación deja de responder al escribir grandes cantidades de datos

Una aplicación que escribe una gran cantidad de datos en Amazon EFS deja de responder y hace que la instancia se reinicie.

Acción que ejecutar

Si una aplicación tarda demasiado tiempo en escribir todos sus datos en Amazon EFS, Linux podría reiniciarse, ya que parece que el proceso ha dejado de responder. Dos parámetros de configuración de kernel definen este comportamiento, kernel.hung_task_panic y kernel.hung_task_timeout_secs.

En el ejemplo siguiente, el estado del proceso que ha dejado de responder se notifica mediante el comando ps con D antes de reiniciar la instancia, lo que indica que el proceso está a la espera de E/S.

$ ps aux | grep large_io.py root 33253 0.5 0.0 126652 5020 pts/3 D+ 18:22 0:00 python large_io.py /efs/large_file

Para evitar un reinicio, aumente el periodo de tiempo de espera o deshabilite el modo de pánico del kernel cuando detecte una tarea que ha dejado de responder. El siguiente comando deshabilita el modo de pánico de kernel de la tarea que ha dejado de responder en la mayoría de los sistemas de Linux.

$ sudo sysctl -w kernel.hung_task_panic=0

Rendimiento bajo al abrir muchos archivos en paralelo

Las aplicaciones que abren varios archivos en paralelo no experimentan el aumento esperado del rendimiento de paralelización de E/S.

Acción que ejecutar

Este problema se produce en los clientes de la versión 4 de Network File System (NFSv4) y en los clientes RHEL 6 que utilizan NFSv4.1 ya que estos clientes de NFS serializan operaciones de APERTURA y de CIERRE de NFS. Utilice la versión 4.1 del protocolo NFS y una de las distribuciones de Linux sugeridas que no tiene este problema.

Si no puede utilizar NFSv4.1, tenga en cuenta que el cliente NFSv4.0 de Linux serializa las solicitudes de apertura y cierre por ID de usuario e ID de grupo. Esta serialización sucede incluso si varios procesos o varios subprocesos realizan solicitudes al mismo tiempo. El cliente solo envía una operación de apertura o cierre a un servidor de NFS a la vez, cuando todos los ID coinciden. Para solucionar estos problemas, puede realizar cualquiera de las siguientes acciones:

  • Puede ejecutar cada proceso desde un ID de usuario distinto en la misma instancia de Amazon EC2.

  • Puede dejar el ID de usuario igual en todas las solicitudes abiertas y modificar el conjunto de ID de grupo en su lugar.

  • Puede ejecutar cada proceso desde una instancia de Amazon EC2 independiente.

La configuración de NFS personalizada provoca retrasos de escritura

Dispone de configuración de cliente NFS personalizada y una instancia de Amazon EC2 tarda hasta tres segundos en llevar a cabo una operación de escritura en un sistema de archivos desde otra instancia de Amazon EC2.

Acción que ejecutar

Si detecta este problema, puede resolverlo de una de las siguientes formas:

  • Si el cliente NFS en la instancia de Amazon EC2 que está leyendo los datos tiene el almacenamiento en caché de atributos activado, desmonte su sistema de archivos. A continuación, vuelva a montarlo con la opción noac para deshabilitar el almacenamiento en caché de atributos. El almacenamiento en caché de atributos en NFSv4.1 está habilitado de forma predeterminada.

    nota

    Deshabilitar el almacenamiento en caché en el lado del cliente podría reducir el desempeño de la aplicación.

  • También puede borrar la caché de atributos bajo demanda a través de un lenguaje de programación compatible con los procedimientos de NFS. Para ello, puede enviar una solicitud de procedimiento ACCESS inmediatamente antes de una solicitud de lectura.

    Por ejemplo, utilizando el lenguaje de programación Python, puede construir la siguiente llamada.

    # Does an NFS ACCESS procedure request to clear the attribute cache, given a path to the file import os os.access(path, os.W_OK)

La creación de copias de seguridad con Oracle Recovery Manager es lenta

La creación de backup con Oracle Recovery Manager puede ser lenta si Oracle Recovery Manager se detiene durante 120 segundos antes de iniciar un trabajo de backup.

Acción que ejecutar

Si detecta este problema, deshabilite Oracle Direct NFS, tal como se describe en Enabling and Disabling Direct NFS Client Control of NFS en el centro de ayuda de Oracle.

nota

Amazon EFS no admite Oracle Direct NFS.