View a markdown version of this page

Prediga las estructuras de las proteínas con ESMfold en Deadline Cloud - Nube de plazos

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Prediga las estructuras de las proteínas con ESMfold en Deadline Cloud

El paquete de tareas esmfold_predict ejecuta la predicción de la estructura de las proteínas con ESMfold (licencia MIT de Meta's). facebook/esmfold_v1 El paquete toma un archivo FASTA como entrada y produce un .pdb archivo por secuencia como salida, junto con métricas de confianza y un informe de validación opcional con estructuras de referencia experimentales.

El trabajo consta de cuatro pasos:

  1. Analice el FASTA de entrada, valide las secuencias (hasta 1024 aminoácidos, residuos estándar más X) y divida los registros según las tareas de los trabajadores.

  2. Ejecute la inferencia de ESMfold en cada lote de secuencias de la GPU.

  3. Represente una imagen de traza troncal de cada estructura prevista, coloreada según la confianza del PLDDT por residuo.

  4. Opcional: si proporciona un directorio de PDB de referencia experimentales, realice un cálculo TM-score, un RMSD y una gráfica de calibración por residuo. pLDDT/error

El paquete requiere una granja con una flota de GPU NVIDIA gestionada por el servicio (A10G, L4 o A100; al menos 16 GB de VRAM y 16 GB de RAM de sistema) y una cola con un entorno de cola conda que consuma los parámetros y los del trabajo. CondaPackages CondaChannels La configuración más rápida es la plantilla cuda_farm (). AWS CloudFormation CloudFormation Las instancias de GPU de Amazon Elastic Compute Cloud (Amazon EC2) están restringidas según las cuotas de vCPU por región; si su flota no se amplía, solicite un aumento para las instancias G y VT en On-Demand ejecución en la consola Service Quotas.

Envíe la demostración, que incluye tres proteínas de referencia breves (las Trp-cage variantes 1L2Y y 2JOF, y el casco de villina 1VII):

deadline bundle submit ./job_bundles/esmfold_predict/ \ -p InputFasta=./job_bundles/esmfold_predict/sample_inputs/demo.fasta

Al doblar el primer pliegue, un trabajador nuevo descarga las facebook/esmfold_v1 pesas de 5,2 GB (unos tres minutos en <OutputDir>/.hf_cache/ una). g5.2xlarge Las siguientes tareas de plegado del mismo trabajo reutilizan la memoria caché.

Para validar las predicciones con referencias experimentales, coloque <seq_id>.pdb los archivos en un directorio y páselos comoReferencePdbDir. El Validate paso escribe validation.csv y uno por secuenciacalibration.png.