Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
HealthOmics requisitos de definición del flujo de trabajo
Los archivos HealthOmics de definición del flujo de trabajo deben cumplir los siguientes requisitos:
-
Las tareas deben definir input/output los parámetros, los repositorios de contenedores de Amazon ECR y las especificaciones de tiempo de ejecución, como la asignación de memoria o CPU.
-
Compruebe que sus funciones de IAM tienen los permisos necesarios.
-
Su flujo de trabajo tiene acceso a los datos de entrada de AWS recursos, como Amazon S3.
-
Su flujo de trabajo tiene acceso a los servicios de repositorio externos cuando los necesita.
-
-
Declare los archivos de salida en la definición del flujo de trabajo. Para copiar los archivos de ejecución intermedia a la ubicación de salida, declare que son salidas del flujo de trabajo.
-
Las ubicaciones de entrada y salida deben estar en la misma región que el flujo de trabajo.
-
HealthOmics Las entradas del flujo de trabajo de almacenamiento deben estar en
ACTIVE
estado. HealthOmics no importará las entradas con unARCHIVED
estado, lo que provocará un error en el flujo de trabajo. Para obtener información sobre las entradas de objetos de Amazon S3, consulteHealthOmics ejecutar entradas. -
La main ubicación del flujo de trabajo es opcional si el archivo ZIP contiene una única definición de flujo de trabajo o un archivo denominado «principal».
-
Ruta de ejemplo:
workflow-definition/main-file.wdl
-
-
Antes de crear un flujo de trabajo desde Amazon S3 o desde su unidad local, cree un archivo zip con los archivos de definición del flujo de trabajo y cualquier dependencia, como los subflujos de trabajo.
-
Le recomendamos que declare los contenedores de Amazon ECR en el flujo de trabajo como parámetros de entrada para la validación de los permisos de Amazon ECR.
Consideraciones adicionales sobre Nextflow:
-
/bin
Las definiciones del flujo de trabajo de Nextflow pueden incluir una carpeta /bin con scripts ejecutables. Esta ruta tiene acceso a las tareas de solo lectura y a los ejecutables. Las tareas que se basan en estos scripts deben usar un contenedor creado con los intérpretes de scripts adecuados. La mejor práctica es llamar directamente al intérprete. Por ejemplo:
process my_bin_task { ... script: """ python3 my_python_script.py """ }
-
includeConfig
Las definiciones de flujo de trabajo basadas en NextFlow pueden incluir archivos nextflow.config que ayudan a abstraer las definiciones de parámetros o procesar los perfiles de recursos. Para facilitar el desarrollo y la ejecución de canalizaciones de Nextflow en varios entornos, utilice una configuración HealthOmics específica que añada a la configuración global mediante la directiva IncludeConfig. Para mantener la portabilidad, configure el flujo de trabajo para que incluya el archivo solo cuando se esté ejecutando mediante el HealthOmics siguiente código:
// at the end of the nextflow.config file if ("$AWS_WORKFLOW_RUN") { includeConfig 'conf/omics.config' }
-
Reports
HealthOmics no admite los informes de arrastre, rastreo y ejecución generados por el motor. Puede generar alternativas a los informes de seguimiento y ejecución mediante una combinación de GetRun llamadas a la GetRunTask API.
Consideraciones adicionales sobre la CWL:
-
Container image uri interpolation
HealthOmics permite que la propiedad DockerPull del sea una expresión DockerRequirement de javascript en línea. Por ejemplo:
requirements: DockerRequirement: dockerPull: "$(inputs.container_image)"
Esto le permite especificar la imagen del contenedor URIs como parámetros de entrada al flujo de trabajo.
-
Javascript expressions
Las expresiones de JavaScript deben ser
strict mode
compatibles. -
Operation process
HealthOmics no es compatible con los procesos de operación de CWL.