とは AWS HealthOmics - AWS HealthOmics

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

とは AWS HealthOmics

AWS HealthOmics は、バイオインフォマティクス、研究者、科学者などのユーザーが、ゲノミクスやその他の生体データを保存、クエリ、分析、およびインサイトを生成できるようにする AWS サービスです。研究組織や臨床組織のゲノム情報の保存と分析のプロセスを簡素化および高速化し、科学的発見とインサイトの生成を高速化します。

HealthOmics には 3 つの主要コンポーネントがあります。HealthOmics Storage を使用すると、ペタバイトのゲノミクスデータをギガベースあたり低コストで効率的に保存および共有できます。HealthOmics Analytics は、マルチオミクスおよびマルチモーダル分析用のゲノムデータを準備する方法を簡素化します。HealthOmics ワークフローは、バイオインフォマティクス計算の基盤となるインフラストラクチャを自動的にプロビジョニングおよびスケーリングします。

重要な注意点

HealthOmics は、専門的な医療上のアドバイス、診断、または治療に代わるものではなく、疾患や病状の修復、治療、緩和、予防、または診断を目的としていません。お客様は、臨床上の意思決定を通知することを目的としたサードパーティー製品に関連するものを含め AWS HealthOmics、 の使用の一環として人間によるレビューを代行する責任があります。

HealthOmics は、データの転送、保存、フォーマット、表示、およびワークフロー管理のためのインフラストラクチャと設定のサポートの提供のみを目的としています。 AWS HealthOmics は、バリアント呼び出しやゲノム分析と解釈を直接実行することを目的としたものではありません。 AWS HealthOmics は、臨床ラボテストやその他のデバイスデータ、結果、結果の解釈や分析を目的としたものではなく、ゲノム分析での使用を目的としたサードパーティー製ツールに代わるものではありません。

HealthOmics の概念

このトピックでは、このガイドで使用されている HealthOmics の用語を理解するのに役立つ、HealthOmics に固有の主要な概念と用語の定義について説明します。

[Storage (ストレージ)]

データストレージは、ゲノミクスシーケンスおよび関連情報についてはシーケンスストアに、すべての参照ゲノムについてはリファレンスストアに分割されます。以下の用語では、HealthOmics に固有の実装について説明します。

  • シーケンスストア – ゲノミクスファイルを保存するためのデータストア。HealthOmics 内に 1 つ以上のシーケンスストアを持つことができます。アクセス許可と AWS KMS 暗号化をシーケンスストアに設定して、データにアクセスできるユーザーを制御できます。

  • リードセット – リードセットは、ゲノム読み取りの抽象化であり、FASTQ、BAM、または CRAM 形式で保存されます。リードセットはシーケンスストアにインポートし、メタデータで注釈を付けることができます。属性ベースのアクセスコントロール (ABAC) を使用して、読み取りセットにアクセス許可を適用できます。

  • リファレンス – ゲノムリファレンスは、ゲノム内の特定の読み取り、または読み取りグループがマッピングされている場所を特定するために、読み取りとともに使用されます。これらは FASTA 形式で、リファレンスストアに保存されます。

  • リファレンスストア – リファレンスゲノムを保存するためのデータストア。各アカウントとリージョンに 1 つのリファレンスストアを持つことができます。

分析

HealthOmics Analytics を使用して、ゲノムデータを変換および分析できます。バリアントストアまたは注釈ストアを作成して、クエリの追加情報を含めます。

  • バリアントストア – バリアントデータを母集団規模で保存するデータストア。バリアントストアは、ゲノムバリアントコール形式 (gVCF) と VCF 入力の両方をサポートします。

  • 注釈ストア – TSV/CSV、VPC、一般機能形式 (GFF3) ファイルなどの注釈データベースを表すデータストア。Annotation Stores は、インポート中にバリアントストアと同じ座標系にマッピングされます。

ワークフロー

HealthOmics ワークフローを使用すると、ゲノミクスデータを処理および分析できます。

  • ワークフロー – パラメータやツールへの参照を含むエンドツーエンドプロセスの全体的な定義。ワークフロー定義は、WDL、Nextflow、または CWL として表現できます。作成された各ワークフローには一意の識別子があります。

  • 実行 — ワークフローの 1 回の呼び出し。個々の実行では、定義された入力データを使用して出力が生成されます。作成された各実行には一意の識別子があります。

  • タスク – 実行内の個々のプロセス。HealthOmics ワークフローは、これらの定義されたコンピューティング仕様を使用してタスクを実行します。各タスクには一意の識別子があります。

  • 実行グループ – 最大 vCPU、最大継続時間、または最大同時実行を設定して、実行ごとに使用されるコンピューティングリソースを制限するのに役立つ実行のグループ。実行グループ内で実行の優先順位を指定および設定できます。たとえば、優先度の低い実行の前に優先度の高い実行を実行し、優先度キューを作成するように指定できます。実行グループの使用はオプションであり、各実行グループには一意の識別子があります。

HealthOmics の機能

HealthOmics には以下の機能があります。

  • HealthOmics Storage — ペタバイトの未加工のゲノムデータを、ギガベースあたり低コストで効率的に保存および共有できます。

  • HealthOmics Analytics — マルチオミクスおよびマルチモーダル分析用のゲノミクスデータを準備する方法を簡素化します。

  • HealthOmics ワークフロー — バイオインフォマティクスワークフローの基盤となるインフラストラクチャを自動的にプロビジョニングおよびスケーリングします。

各コンポーネントを個別に使用することも、統合されたend-to-endソリューションの一部として使用することもできます。

HealthOmics には以下の利点があります。

  • ゲノムデータを安全に保存して組み合わせる — HealthOmics は、 や Amazon Athena などの AWS Lake Formation 他の AWS サービスと統合します。ゲノミクスデータを安全に保存し、クエリを実行したり、履歴データと組み合わせたりして、より良い診断とパーソナライズされた治療計画を実現できます。

  • 患者のプライバシーを保護する — HealthOmics は HIPAA の対象となります。また、IAM および Amazon CloudWatch と統合されているため、データアクセスを制御およびログ記録し、分析でのデータの使用方法を追跡できます。

  • スケーリング用に構築 — 請求を簡素化し、新しいコラボレーションツールを使用して、大規模な母集団データ分析をサポートします。

  • 効率を最大化する — 自動化されたワークフローと統合されたツールを使用して、データ処理と分析を合理化します。

HealthOmics は、以下の生体医療アプリケーションに使用できます。

  • 母集団シーケンス — 数千のゲノムを一度にクエリして、母集団全体でゲノムのバリエーションがどのような類似点にマッピングされるかを理解します。

  • 臨床ゲノミクス — シーケンサーの出力から報告可能なデータまで、再現可能なゲノミクスワークフローを構築します。また、大量のスループットを最適化し、優先度の高い臨床サンプルのコンピューティング要件を設定して、ターンアラウンド時間を短縮することもできます。

  • 臨床試験 — ゲノム分析を臨床試験に統合して、新しい薬剤候補の有効性をよりよく理解します。管理機関からの規制を満たすために、長期的なコスト削減とデータ出所により、臨床試験を簡素化および高速化します。

  • 研究とイノベーションの強化 — 行と列ベースのアクセス制御を組み込み、匿名化されたゲノムデータのストレージ、アクセス、分析を合理化して制御します。

以下のサービスは HealthOmics で動作します。

  • Amazon Elastic Container Registry – 各プライベートワークフローは、Amazon ECR イメージ (プライベート Amazon ECR リポジトリ内) を使用して、ワークフローの実行に必要なすべての実行可能ファイル、ライブラリ、スクリプトを含めます。

  • Amazon Simple Storage Service – Amazon S3 は、ストアデータとワークフローデータ用のファイルストレージを提供します。

  • AWS Lake Formation – Lake Formation は、分析データストアへのデータアクセスを管理します。

  • Amazon Athena – Athena を使用してバリアントストアでクエリを実行します。

  • Amazon SageMaker AI – SageMaker AI を使用して、Jupyter ノートブックを使用して HealthOmics タスクを実行します。

AWS HealthOmics のリージョンとエンドポイント

リージョンとエンドポイントの完全なリストについては、AWS 「 全般のリファレンス」を参照してください。

デフォルトでアクティブになっている AWS リージョンに加えて、アクティブ化する必要があるオプトインリージョンもあります。リージョンをアクティブ化または非アクティブ化する方法の詳細については、「 アカウント管理ガイド」の「アカウントで使用できる AWS リージョンを指定する」を参照してください。 AWS

HealthOmics にアクセスする方法

AWS HealthOmics 機能には、 マネジメントコンソール、 CLI、 SDKs、または API を使用してアクセスできます。

  • AWS マネジメントコンソール – HealthOmics へのアクセスに使用できるウェブインターフェイスを提供します。

  • AWS Command Line Interface (AWS CLI) – Windows、macOS AWS HealthOmics、Linux など、さまざまな AWS サービス用のコマンドを提供します。のインストールの詳細については AWS CLI、「」を参照してくださいAWS Command Line Interface

  • AWS SDKs – さまざまなプログラミング言語とプラットフォーム (Java、Python、Ruby、.NET、iOS、Android を含む) のライブラリとサンプルコードで構成される SDKs (ソフトウェア開発キット) AWS を提供します。SDKs を使用すると、プログラムで HealthOmics を使用するのに便利です。詳細については、AWS 「 SDK デベロッパーセンター」を参照してください。

  • AWS API – API オペレーションを使用して、プログラムで HealthOmics にアクセスして管理できます。詳細については、HealthOmics API リファレンス」を参照してください。

詳細はこちら

HealthOmics の詳細については、以下のワークショップとチュートリアルを参照してください。

AWS 以下を提供する追加の HealthOmics ツールに精通してください。