View a markdown version of this page

Preveja estruturas de proteínas com o ESMfold no Deadline Cloud - Nuvem de prazos

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Preveja estruturas de proteínas com o ESMfold no Deadline Cloud

O pacote de tarefas esmfold_predict executa a previsão da estrutura da proteína com o ESMfold (Meta, licença MIT). facebook/esmfold_v1 O pacote usa um arquivo FASTA como entrada e produz um .pdb arquivo por sequência como saída, junto com métricas de confiança e um relatório de validação opcional em relação a estruturas de referência experimentais.

O trabalho executa quatro etapas:

  1. Analise o FASTA de entrada, valide as sequências (até 1024 aminoácidos, resíduos padrão mais X) e divida os registros nas tarefas do trabalhador.

  2. Execute a inferência ESMfold em cada lote de sequências na GPU.

  3. Renderize uma imagem de rastreamento de backbone de cada estrutura prevista, colorida pela confiança de pLdDT por resíduo.

  4. Opcional: quando você fornece um diretório de PDBs de referência experimental, computação TM-score, RMSD e um gráfico de calibração por resíduo. pLDDT/error

O pacote requer uma fazenda com uma frota gerenciada por serviços de GPU NVIDIA (A10G, L4 ou A100; pelo menos 16 GB de VRAM e 16 GB de RAM do sistema) e uma fila com um ambiente de fila conda que consuma os parâmetros e do trabalho. CondaPackages CondaChannels A configuração mais rápida é o modelo cuda_farm AWS CloudFormation ()CloudFormation. As instâncias de GPU do Amazon Elastic Compute Cloud (Amazon EC2) são controladas por cotas de vCPU por região; se sua frota não aumentar, solicite um aumento para as instâncias G e VT em execução no console Service Quotas. On-Demand

Envie a demonstração, que inclui três proteínas curtas de referência (Trp-cage variantes 1L2Y e 2JOF e capacete de vilina 1VII):

deadline bundle submit ./job_bundles/esmfold_predict/ \ -p InputFasta=./job_bundles/esmfold_predict/sample_inputs/demo.fasta

A primeira dobra de um trabalhador novato baixa os facebook/esmfold_v1 pesos de 5,2 GB em <OutputDir>/.hf_cache/ (cerca de três minutos em umag5.2xlarge). As tarefas subsequentes de dobra na mesma tarefa reutilizam o cache.

Para validar as previsões em relação às referências experimentais, coloque <seq_id>.pdb os arquivos em um diretório e passe-os como. ReferencePdbDir A Validate etapa grava validation.csv e uma por sequênciacalibration.png.