

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Prediga las estructuras de las proteínas con ESMfold en Deadline Cloud
<a name="examples-jb-esmfold"></a>

El paquete de tareas [esmfold\_predict](https://github.com/aws-deadline/deadline-cloud-samples/tree/mainline/job_bundles/esmfold_predict) ejecuta la predicción de la estructura de las proteínas con ESMfold (licencia MIT de Meta's). `facebook/esmfold_v1` El paquete toma un archivo FASTA como entrada y produce un `.pdb` archivo por secuencia como salida, junto con métricas de confianza y un informe de validación opcional con estructuras de referencia experimentales.

El trabajo consta de cuatro pasos:

1. Analice el FASTA de entrada, valide las secuencias (hasta 1024 aminoácidos, residuos estándar más X) y divida los registros según las tareas de los trabajadores.

1. Ejecute la inferencia de ESMfold en cada lote de secuencias de la GPU.

1. Represente una imagen de traza troncal de cada estructura prevista, coloreada según la confianza del PLDDT por residuo.

1. Opcional: si proporciona un directorio de PDB de referencia experimentales, realice un cálculo TM-score, un RMSD y una gráfica de calibración por residuo. pLDDT/error

El paquete requiere una granja con una flota de GPU NVIDIA gestionada por el servicio (A10G, L4 o A100; al menos 16 GB de VRAM y 16 GB de RAM de sistema) y una cola con un entorno de cola conda que consuma los parámetros y los del trabajo. `CondaPackages` `CondaChannels` [La configuración más rápida es la plantilla cuda\_farm ().](https://github.com/aws-deadline/deadline-cloud-samples/tree/mainline/cloudformation/farm_templates/cuda_farm) AWS CloudFormation CloudFormation Las instancias de GPU de Amazon Elastic Compute Cloud (Amazon EC2) están restringidas según las cuotas de vCPU por región; si su flota no se amplía, solicite un aumento *para las instancias G y VT en On-Demand ejecución en* la consola Service Quotas.

Envíe la demostración, que incluye tres proteínas de referencia breves (las Trp-cage variantes 1L2Y y 2JOF, y el casco de villina 1VII):

```
deadline bundle submit ./job_bundles/esmfold_predict/ \
  -p InputFasta=./job_bundles/esmfold_predict/sample_inputs/demo.fasta
```

Al doblar el primer pliegue, un trabajador nuevo descarga las `facebook/esmfold_v1` pesas de 5,2 GB (unos tres minutos en `<OutputDir>/.hf_cache/` una). `g5.2xlarge` Las siguientes tareas de plegado del mismo trabajo reutilizan la memoria caché.

Para validar las predicciones con referencias experimentales, coloque `<seq_id>.pdb` los archivos en un directorio y páselos como`ReferencePdbDir`. El `Validate` paso escribe `validation.csv` y uno por secuencia`calibration.png`.