중요 공지 사항 HealthOmics 기능 개념 관련 서비스 HealthOmics에 액세스하는 방법 AWS HealthOmics의 리전 및 엔드포인트 자세히 알아보기

AWS HealthOmics란 무엇인가요?

AWS HealthOmics 는 생물 정보학 워크플로 뒤에 있는 복잡한 인프라를 완전히 관리하여 임상 진단 테스트, 약물 발견 및 농업 연구를 가속화하는 HIPAA 적격 서비스입니다. HealthOmics는 업계 표준 워크플로 언어(WDL, Nextflow, CWL)를 지원하고 생물 정보 인프라를 원활하게 확장하여 매일 수만 건의 테스트 데이터를 지원하며,이 모든 것이 예측 가능한 샘플당 비용으로 이루어집니다. HealthOmics는 컴퓨팅 리소스 관리 및 워크플로 엔진 유지 관리와 같은 기술적 복잡성을 처리하므로 과학적 혁신에 전적으로 집중할 수 있습니다.

중요 공지 사항

HealthOmics는 데이터 전송, 저장, 형식 지정 또는 표시와 워크플로 관리를 위한 인프라 및 구성 지원 제공에만 사용됩니다. HealthOmics는 전문적인 의학적 조언, 진단 또는 치료를 대체하지 않으며 질병 또는 건강 상태를 치료, 치료, 완화, 예방 또는 진단하기 위한 것이 아닙니다. 사용자는 임상 의사 결정을 알리기 위한 타사 제품과 관련된 경우를 AWS HealthOmics포함하여 사용의 일부로 인적 검토를 도입할 책임이 있습니다.

HealthOmics 기능

HealthOmics의 기본 사용 사례:

임상 진단 - 예측 가능한 비용과 테스트 볼륨에 따라 증가하는 완전 관리형 인프라를 사용하여 진단 테스트 워크플로를 구축하고 확장합니다.
약물 검색 - 수백만 명의 잠재적 후보에 걸쳐 신속한 반복을 가능하게 하는 대규모로 생물학적 파운데이션 모델을 오케스트레이션하여 치료 연구를 가속화합니다.
농업 연구 - 식품 보안 및 농업 생산성을 개선하는 AI 기반 워크플로를 통해 가뭄 방지 및 내충격성과 같은 작물 특성을 개선합니다.

HealthOmics의 주요 이점:

확장성 - 100,000개 이상의 동시 vCPUs에서 워크플로를 확장하여 인프라 관리 없이 샘플당 예측 가능한 비용으로 매일 수만 개의 테스트를 지원합니다.
인프라가 아닌 과학에 집중 -가 인프라 오케스트레이션 및 APIs를 사용합니다. AWS
규정 준수 유지 - 포괄적인 감사 추적, 데이터 출처 추적 및 즉시 사용 가능한 임상 워크플로용으로 설계된 HIPAA 적격 인프라 out-of-the-box는 규제 요구 사항을 충족하는 솔루션 개발을 지원합니다.

HealthOmics는 세 가지 주요 구성 요소로 구성됩니다.

HealthOmics 워크플로 - 자동으로 프로비저닝되고 규모가 조정된 인프라에서 생물 정보학 계산을 실행합니다.
HealthOmics 스토리지 - 기가베이스당 저렴한 비용으로 페타바이트의 유전체학 데이터를 효율적으로 저장하고 공유합니다.
HealthOmics 분석 - 멀티오믹스 및 멀티모달 분석을 위한 게놈 데이터를 준비합니다.

이러한 구성 요소를 독립적으로 사용하거나 end-to-end 솔루션을 위해 결합합니다.

HealthOmics 개념

이 주제에서는이 가이드에서 사용한 HealthOmics의 용어를 이해하는 데 도움이 되도록 HealthOmics와 관련된 주요 개념 및 용어에 대한 정의를 다룹니다.

주제

워크플로
스토리지
분석

워크플로

HealthOmics 워크플로를 사용하면 게놈 데이터를 처리하고 분석할 수 있습니다.

워크플로 - 파라미터 및 도구에 대한 참조를 포함한 엔드 투 엔드 프로세스의 전체 정의입니다. 워크플로 정의는 WDL, Nextflow 또는 CWL로 표현할 수 있습니다. 생성된 각 워크플로에는 고유한 식별자가 있습니다.
실행 - 워크플로의 단일 호출입니다. 개별 실행은 정의된 입력 데이터를 사용하고 출력을 생성합니다. 생성된 각 실행에는 고유한 식별자가 있습니다.
작업 - 실행 내의 개별 프로세스입니다. HealthOmics 워크플로는 이러한 정의된 컴퓨팅 사양을 사용하여 작업을 실행합니다. 각 작업에는 고유한 식별자가 있습니다.
실행 그룹 - 최대 vCPU, 최대 기간 또는 최대 동시 실행을 설정하여 실행당 사용되는 컴퓨팅 리소스를 제한할 수 있는 실행 그룹입니다. 실행 그룹 내에서 실행에 대한 우선 순위를 지정하고 구성할 수 있습니다. 예를 들어 우선 순위가 낮은 실행보다 우선 순위가 높은 실행을 수행하여 우선 순위 대기열을 생성하도록 지정할 수 있습니다. 실행 그룹을 사용하는 것은 선택 사항이며 각 실행 그룹에는 고유한 식별자가 있습니다.

스토리지

데이터 스토리지는 게놈 시퀀스 및 관련 정보에 대한 시퀀스 저장소와 모든 참조 게놈에 대한 참조 저장소로 구분됩니다. 다음 용어는 HealthOmics와 관련된 구현을 설명합니다.

시퀀스 스토어 - 게놈 파일을 저장하기 위한 데이터 스토어입니다. HealthOmics 내에 하나 이상의 시퀀스 스토어가 있을 수 있습니다. 시퀀스 스토어에서 액세스 권한 및 AWS KMS 암호화를 설정하여 데이터에 액세스할 수 있는 사용자를 제어할 수 있습니다.
읽기 세트 - 읽기 세트는 FASTQ, BAM 또는 CRAM 형식으로 저장되는 게놈 읽기의 추상화입니다. 읽기 세트는 시퀀스 저장소로 가져오고 메타데이터로 주석을 달 수 있습니다. 속성 기반 액세스 제어(ABAC)를 사용하여 읽기 세트에 권한을 적용할 수 있습니다.
참조 - 유전체 참조는 유전체에서 특정 읽기 또는 읽기 그룹이 매핑되는 위치를 식별하기 위해 읽기와 함께 사용됩니다. FASTA 형식이며 참조 스토어에 저장됩니다.
참조 스토어 - 참조 유전체의 저장을 위한 데이터 스토어입니다. 각 계정 및 리전에 단일 참조 저장소를 가질 수 있습니다.

분석

HealthOmics Analytics를 사용하여 게놈 데이터를 변환하고 분석할 수 있습니다. 변형 저장소 또는 주석 저장소를 생성하여 쿼리에 대한 추가 정보를 포함합니다.

변형 저장소 - 변형 데이터를 모집단 규모로 저장하는 데이터 저장소입니다. 변형 저장소는 게놈 변형 호출 형식(gVCF)과 VCF 입력을 모두 지원합니다.
주석 저장소 - TSV/CSV, VCF 또는 일반 기능 형식(GFF3) 파일의 주석 데이터베이스와 같은 주석 데이터베이스를 나타내는 데이터 저장소입니다. 주석 저장소는 가져오기 중에 변형 저장소와 동일한 좌표계에 매핑됩니다.

다음 서비스는 HealthOmics에서 작동합니다.

Amazon Elastic Container Registry - 각 프라이빗 워크플로는 Amazon ECR 이미지(프라이빗 Amazon ECR 리포지토리)를 사용하여 워크플로를 실행하는 데 필요한 모든 실행 파일, 라이브러리 및 스크립트를 포함합니다.
Amazon Simple Storage Service – Amazon S3는 저장 및 워크플로 데이터를 위한 파일 스토리지를 제공합니다.
AWS Lake Formation - Lake Formation은 Analytics 데이터 스토어에 대한 데이터 액세스를 관리합니다.
Amazon Athena - Athena를 사용하여 변형 저장소에 대한 쿼리를 수행합니다.
Amazon SageMaker AI - SageMaker AI를 사용하여 Jupyter 노트북을 사용하여 HealthOmics 작업을 실행합니다.
GitHub connections - 연결을 사용하여 외부 코드 리포지토리를 HealthOmics 워크플로에 연결합니다.

HealthOmics에 액세스하는 방법

관리 콘솔, CLI, SDKs 또는 API를 사용하여 AWS HealthOmics 기능에 액세스할 수 있습니다.

AWS 관리 콘솔 - HealthOmics에 액세스하는 데 사용할 수 있는 웹 인터페이스를 제공합니다.
AWS Command Line Interface (AWS CLI) - Windows, macOS 및 Linux AWS HealthOmics를 포함하여 다양한 AWS 서비스에 대한 명령을 제공합니다. 설치에 대한 자세한 내용은 단원을 AWS CLI참조하십시오AWS Command Line Interface.
AWS SDKs- 다양한 프로그래밍 언어 및 플랫폼(Java, Python, Ruby, .NET, iOS 및 Android 포함)을 위한 라이브러리 및 샘플 코드로 구성된 SDKs(소프트웨어 개발 키트)를 AWS 제공합니다. SDKs는 프로그래밍 방식으로 HealthOmics를 사용하는 편리한 방법을 제공합니다. 자세한 내용은 AWS SDK 개발자 센터를 참조하세요.
AWS API - API 작업을 사용하여 HealthOmics에 프로그래밍 방식으로 액세스하고 관리할 수 있습니다. 자세한 내용은 HealthOmics API 참조를 참조하세요.

AWS HealthOmics의 리전 및 엔드포인트

리전 및 엔드포인트의 전체 목록은 AWS 일반 참조를 참조하세요.

기본적으로 활성 상태인 AWS 리전 외에도 활성화해야 하는 옵트인 리전도 있습니다. 리전을 활성화하거나 비활성화하는 방법에 대한 자세한 내용은 AWS 계정 관리 안내서의 계정에서 사용할 수 있는 AWS 리전 지정을 참조하세요.

자세히 알아보기

다음 워크숍 및 자습서에서 HealthOmics에 대해 자세히 알아보세요.

HealthOmics 워크숍 - HealthOmics 엔드 투 엔드 워크숍
AWS 게놈 리소스 - 게놈과 관련된 퍼블릭 Amazon ECR 리포지토리
Python 자습서 - HealthOmics 스토리지, 분석 및 워크플로를 다루는 GitHub의 Jupyter 노트북 자습서

다음을 AWS 제공하는 추가 HealthOmics 도구에 익숙해지세요.

WDL 린터 - WDL용 HealthOmics 린터
Nextflow linter – Nextflow용 HealthOmics linter
HealthOmics Amazon ECR 헬퍼 도구 - HealthOmics용 Amazon ECR 헬퍼 도구
GitHub의 HealthOmics 도구 - HealthOmics 작업 도구(전송 관리자, URI 구문 분석기, Omics 재실행, 분석기 실행).

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경