Solución de problemas de rendimiento de Amazon EFS - Amazon Elastic File System

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas de rendimiento de Amazon EFS

En general, si surge algún problema con Amazon EFS que le resulta difícil resolver, confirme que está utilizando un kernel de Linux reciente. Si utiliza una distribución de Linux empresarial, le recomendamos lo siguiente:

  • Amazon Linux 2 con kernel 4.3 o posterior

  • Amazon Linux 2015.09 o posterior

  • RHEL 7.3 o posterior

  • Todas las versiones de Ubuntu 16.04

  • Ubuntu 14.04 con kernel 3.13.0-83 o posterior

  • SLES 12 Sp2 o posterior

Si utiliza otra distribución o un kernel personalizado, le recomendamos la versión de kernel 4.3 o posterior.

nota

RHEL 6.9 podría ser inadecuado para determinadas cargas de trabajo debido a Rendimiento bajo al abrir muchos archivos en paralelo.

No se puede crear un sistema de archivos de EFS

Se produce un error en la solicitud de creación de un sistema de archivos de EFS y aparece el siguiente mensaje:

User: arn:aws:iam::111122223333:user/username is not authorized to perform: elasticfilesystem:CreateFileSystem on the specified resource.
Acción que debe ejecutarse

Compruebe su política AWS Identity and Access Management (de IAM) para confirmar que está autorizado a crear sistemas de archivos EFS con las condiciones de recursos especificadas. Para obtener más información, consulte Administración de identidades y accesos para Amazon EFS.

Acceso denegado a los archivos permitidos en el sistema de archivos NFS

Cuando un usuario al que se han asignado más de 16 grupos de acceso IDs (GIDs) intenta realizar una operación en un sistema de archivos NFS, es posible que se le niegue el acceso a los archivos permitidos en el sistema de archivos. Este problema se produce porque el protocolo NFS admite un máximo de 16 GIDs por usuario y los demás GIDs se truncan a partir de la solicitud del cliente de NFS, tal como se define en el RFC 5531.

Acción que debe ejecutarse

Reestructure las asignaciones de usuarios y grupos de NFS para que a cada usuario no se le asignen más de 16 grupos de acceso (). GIDs

Errores al acceder a la consola de Amazon EFS

En esta sección se describen los errores que pueden experimentar los usuarios al acceder a la consola de administración de Amazon EFS.

Error al autenticar las credenciales de ec2:DescribeVPCs

Al acceder a la consola de Amazon EFS, aparece el siguiente mensaje de error:

AuthFailure: An error occurred authenticating your credentials for ec2:DescribeVPCs.

Este error indica que tus credenciales de inicio de sesión no se autenticaron correctamente con el EC2 servicio de Amazon. La consola Amazon EFS llama al EC2 servicio de Amazon en su nombre al crear sistemas de archivos EFS en la VPC que elija.

Acción que debe ejecutarse

Asegúrese de que la hora en que el cliente accede a la consola de Amazon EFS esté configurada correctamente.

La EC2 instancia de Amazon se bloquea

Una EC2 instancia de Amazon puede bloquearse porque eliminaste un destino de montaje del sistema de archivos sin desmontar primero el sistema de archivos.

Acción que debe ejecutarse

Antes de eliminar un destino de montaje de sistema de archivos, desmonte el sistema de archivos. Para obtener más información sobre el desmontaje de su sistema de archivos de Amazon EFS, consulte Desmontaje de sistemas de archivos.

La aplicación deja de responder al escribir grandes cantidades de datos

Una aplicación que escribe una gran cantidad de datos en Amazon EFS deja de responder y hace que la instancia se reinicie.

Acción que ejecutar

Si una aplicación tarda demasiado tiempo en escribir todos sus datos en Amazon EFS, Linux podría reiniciarse, ya que parece que el proceso ha dejado de responder. Dos parámetros de configuración de kernel definen este comportamiento, kernel.hung_task_panic y kernel.hung_task_timeout_secs.

En el ejemplo siguiente, el estado del proceso que ha dejado de responder se notifica mediante el comando ps con D antes de reiniciar la instancia, lo que indica que el proceso está a la espera de E/S.

$ ps aux | grep large_io.py root 33253 0.5 0.0 126652 5020 pts/3 D+ 18:22 0:00 python large_io.py /efs/large_file

Para evitar un reinicio, aumente el periodo de tiempo de espera o deshabilite el modo de pánico del kernel cuando detecte una tarea que ha dejado de responder. El siguiente comando deshabilita el modo de pánico de kernel de la tarea que ha dejado de responder en la mayoría de los sistemas de Linux.

$ sudo sysctl -w kernel.hung_task_panic=0

Rendimiento bajo al abrir muchos archivos en paralelo

Las aplicaciones que abren varios archivos en paralelo no experimentan el aumento esperado del rendimiento de paralelización de E/S.

Acción que ejecutar

Este problema se produce en los clientes de Network File System versión 4 (NFSv4) y en los clientes de RHEL 6 que utilizan la versión NFSv4 .1, ya que estos clientes NFS serializan las operaciones de apertura y cierre de NFS. Utilice la versión 4.1 del protocolo NFS y una de las distribuciones de Linux sugeridas que no tiene este problema.

Si no puede usar NFSv4 .1, tenga en cuenta que el cliente Linux NFSv4 2.0 serializa las solicitudes de apertura y cierre por ID de usuario y grupo. IDs Esta serialización sucede incluso si varios procesos o varios subprocesos realizan solicitudes al mismo tiempo. El cliente solo envía una operación de apertura o cierre a un servidor NFS a la vez, cuando todas coinciden. IDs Para solucionar estos problemas, puede realizar cualquiera de las siguientes acciones:

  • Puedes ejecutar cada proceso desde un seudónimo diferente en la misma EC2 instancia de Amazon.

  • Puedes dejar el mismo usuario IDs en todas las solicitudes abiertas y, en IDs su lugar, modificar el conjunto de grupos.

  • Puedes ejecutar cada proceso desde una EC2 instancia de Amazon independiente.

La configuración de NFS personalizada provoca retrasos de escritura

Tiene una configuración de cliente NFS personalizada y una EC2 instancia de Amazon tarda hasta tres segundos en ver una operación de escritura realizada en un sistema de archivos desde otra EC2 instancia de Amazon.

Acción que ejecutar

Si detecta este problema, puede resolverlo de una de las siguientes formas:

  • Si el cliente NFS de la EC2 instancia de Amazon que lee datos tiene activado el almacenamiento en caché de atributos, desmonta el sistema de archivos. A continuación, vuelva a montarlo con la opción noac para deshabilitar el almacenamiento en caché de atributos. El almacenamiento en caché de atributos en NFSv4 .1 está activado de forma predeterminada.

    nota

    Deshabilitar el almacenamiento en caché en el lado del cliente podría reducir el desempeño de la aplicación.

  • También puede borrar la caché de atributos bajo demanda a través de un lenguaje de programación compatible con los procedimientos de NFS. Para ello, puede enviar una solicitud de procedimiento ACCESS inmediatamente antes de una solicitud de lectura.

    Por ejemplo, utilizando el lenguaje de programación Python, puede construir la siguiente llamada.

    # Does an NFS ACCESS procedure request to clear the attribute cache, given a path to the file import os os.access(path, os.W_OK)

La creación de copias de seguridad con Oracle Recovery Manager es lenta

La creación de backup con Oracle Recovery Manager puede ser lenta si Oracle Recovery Manager se detiene durante 120 segundos antes de iniciar un trabajo de backup.

Acción que ejecutar

Si detecta este problema, deshabilite Oracle Direct NFS, tal como se describe en Enabling and Disabling Direct NFS Client Control of NFS en el centro de ayuda de Oracle.

nota

Amazon EFS no admite Oracle Direct NFS.