HealthOmics 워크플로 정의 요구 사항 - AWS HealthOmics

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

HealthOmics 워크플로 정의 요구 사항

HealthOmics 워크플로 정의 파일은 다음 요구 사항을 충족해야 합니다.

  • 작업은 입력/출력 파라미터, Amazon ECR 컨테이너 리포지토리, 메모리 또는 CPU 할당과 같은 런타임 사양을 정의해야 합니다.

  • IAM 역할에 필요한 권한이 있는지 확인합니다.

    • 워크플로는 Amazon S3와 같은 AWS 리소스의 입력 데이터에 액세스할 수 있습니다.

    • 워크플로는 필요한 경우 외부 리포지토리 서비스에 액세스할 수 있습니다.

  • 워크플로 정의에서 출력 파일을 선언합니다. 중간 실행 파일을 출력 위치에 복사하려면 워크플로 출력으로 선언합니다.

  • 입력 및 출력 위치는 워크플로와 동일한 리전에 있어야 합니다.

  • HealthOmics 스토리지 워크플로 입력은 ACTIVE 상태여야 합니다. HealthOmics는 ARCHIVED 상태의 입력을 가져오지 않으므로 워크플로가 실패합니다. Amazon S3 객체 입력에 대한 자세한 내용은 섹션을 참조하세요HealthOmics 실행 입력.

  • ZIP 아카이브에 단일 워크플로 정의 또는 'main'이라는 파일이 포함된 경우 워크플로의 main 위치는 선택 사항입니다.

    • 예시 경로: workflow-definition/main-file.wdl

  • Amazon S3 또는 로컬 드라이브에서 워크플로를 생성하기 전에 워크플로 정의 파일과 하위 워크플로와 같은 모든 종속성의 zip 아카이브를 생성합니다.

  • 워크플로에서 Amazon ECR 컨테이너를 Amazon ECR 권한 검증을 위한 입력 파라미터로 선언하는 것이 좋습니다.

추가 Nextflow 고려 사항:

  • /bin

    Nextflow 워크플로 정의에는 실행 가능한 스크립트가 있는 /bin 폴더가 포함될 수 있습니다. 이 경로에는 작업에 대한 읽기 전용 및 실행 가능한 액세스 권한이 있습니다. 이러한 스크립트에 의존하는 작업은 적절한 스크립트 인터프리터로 빌드된 컨테이너를 사용해야 합니다. 인터프리터를 직접 호출하는 것이 가장 좋습니다. 예:

    process my_bin_task { ... script: """ python3 my_python_script.py """ }
  • includeConfig

    Nextflow 기반 워크플로 정의에는 파라미터 정의를 추상화하거나 리소스 프로파일을 처리하는 데 도움이 되는 nextflow.config 파일이 포함될 수 있습니다. 여러 환경에서 Nextflow 파이프라인의 개발 및 실행을 지원하려면 includeConfig 지시문을 사용하여 글로벌 구성에 추가하는 HealthOmics별 구성을 사용합니다. 이식성을 유지하려면 다음 코드를 사용하여 HealthOmics에서 실행할 때만 파일을 포함하도록 워크플로를 구성합니다.

    // at the end of the nextflow.config file if ("$AWS_WORKFLOW_RUN") { includeConfig 'conf/omics.config' }
  • Reports

    HealthOmics는 엔진 생성 Dag, 추적 및 실행 보고서를 지원하지 않습니다. GetRun 및 GetRunTask API 호출을 조합하여 추적 및 실행 보고서에 대한 대안을 생성할 수 있습니다.

추가 CWL 고려 사항:

  • Container image uri interpolation

    HealthOmics를 사용하면 DockerRequirement의 dockerPull 속성이 인라인 Javascript 표현식이 될 수 있습니다. 예:

    requirements: DockerRequirement: dockerPull: "$(inputs.container_image)"

    이렇게 하면 컨테이너 이미지 URIs 워크플로의 입력 파라미터로 지정할 수 있습니다.

  • Javascript expressions

    Javascript 표현식은 strict mode 규정을 준수해야 합니다.

  • Operation process

    HealthOmics는 CWL 작업 프로세스를 지원하지 않습니다.