Was ist AWS HealthOmics? - AWS HealthOmics

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Was ist AWS HealthOmics?

AWS HealthOmics ist ein AWS Dienst, der Benutzern wie Bioinformatikern, Forschern und Wissenschaftlern hilft, genomische und andere biologische Daten zu speichern, abzufragen, zu analysieren und Erkenntnisse daraus zu gewinnen. Er vereinfacht und beschleunigt den Prozess der Speicherung und Analyse genomischer Informationen für Forschungs- und klinische Organisationen und beschleunigt wissenschaftliche Entdeckungen und die Generierung von Erkenntnissen.

HealthOmics besteht aus drei Hauptkomponenten. HealthOmics Speicher hilft Ihnen dabei, Petabyte an Genomdaten effizient und zu niedrigen Kosten pro Gigabase zu speichern und gemeinsam zu nutzen. HealthOmics Analytics vereinfacht die Aufbereitung von Genomikdaten für multimodale und multimodale Analysen. HealthOmics Workflows stellt automatisch die zugrunde liegende Infrastruktur für Ihre bioinformatischen Berechnungen bereit und skaliert sie.

Wichtiger Hinweis

HealthOmics ist kein Ersatz für professionelle medizinische Beratung, Diagnose oder Behandlung und ist nicht dazu bestimmt, Krankheiten oder Gesundheitsprobleme zu heilen, zu behandeln, zu mildern, zu verhindern oder zu diagnostizieren. Sie sind dafür verantwortlich, im Rahmen der Verwendung von Produkten von Drittanbietern, die als Grundlage für klinische Entscheidungen dienen AWS HealthOmics, Untersuchungen am Menschen durchzuführen, auch in Verbindung mit Produkten von Drittanbietern.

HealthOmics ist ausschließlich für die Übertragung, Speicherung, Formatierung oder Anzeige von Daten sowie für die Bereitstellung von Infrastruktur- und Konfigurationsunterstützung für die Verwaltung von Workflows vorgesehen. AWS HealthOmics ist nicht dafür vorgesehen, direkt Varianten aufzurufen oder Genomanalysen und -interpretationen durchzuführen. AWS HealthOmics ist nicht dazu bestimmt, klinische Labortests oder andere Gerätedaten, Ergebnisse und Ergebnisse zu interpretieren oder zu analysieren, und ist kein Ersatz für Tools von Drittanbietern, die für die Verwendung bei Genomanalysen vorgesehen sind.

HealthOmics Konzepte

Dieses Thema behandelt Definitionen für wichtige Konzepte und Begriffe, die spezifisch für dieses Handbuch sind HealthOmics, um Ihnen das Verständnis der in diesem Handbuch HealthOmics verwendeten Terminologie zu erleichtern.

Speicher

Der Datenspeicher ist aufgeteilt in Sequenzspeicher für Ihre Genomsequenzen und zugehörige Informationen und einen Referenzspeicher für all Ihre Referenzgenome. Die folgenden Begriffe beschreiben die Implementierungen, die spezifisch für sind. HealthOmics

  • Sequenzspeicher — Ein Datenspeicher für die Speicherung von Genomikdateien. Sie können einen oder mehrere Sequenzspeicher darin HealthOmics haben. Zugriffsberechtigungen und AWS KMS Verschlüsselung können für einen Sequenzspeicher festgelegt werden, um zu kontrollieren, wer Zugriff auf die Daten hat.

  • Lesesatz — Ein Lesesatz ist eine Abstraktion von genomischen Lesevorgängen, die in den Formaten FASTQ, BAM oder CRAM gespeichert werden. Lesesätze können in Sequenzspeicher importiert und mit Metadaten versehen werden. Mithilfe der attributebasierten Zugriffskontrolle (ABAC) können Sie Lesesätzen Berechtigungen zuweisen.

  • Referenz — Eine Genomreferenz wird bei Lesevorgängen verwendet, um zu ermitteln, welcher Stelle in einem Genom ein bestimmter Lesevorgang oder eine Gruppe von Lesevorgängen zugeordnet ist. Diese sind im FASTA-Format und werden im Referenzspeicher gespeichert.

  • Referenzspeicher — Ein Datenspeicher für die Speicherung von Referenzgenomen. Sie können in jedem Konto und jeder Region einen einzigen Referenzspeicher einrichten.

Analysen

Sie können Ihre Genomdaten mit HealthOmics Analytics transformieren und analysieren. Erstellen Sie einen Variantenspeicher oder einen Annotationsspeicher, um zusätzliche Informationen für Ihre Abfragen aufzunehmen.

  • Variantenspeicher — Datenspeicher, der Variantendaten auf Populationsebene speichert. Variantenspeicher unterstützen sowohl GvCF (Genomic Variant Call Format) als auch VCF-Eingaben.

  • Annotationsspeicher — Ein Datenspeicher, der eine Annotationsdatenbank darstellt, z. B. eine aus einer TSV/CSV-, VCF- oder General Feature Format () -Datei. GFF3 Annotationsspeicher werden während eines Imports demselben Koordinatensystem zugeordnet wie Variantenspeicher.

Workflows

Mit HealthOmics Workflows können Sie Ihre Genomdaten verarbeiten und analysieren.

  • Workflow — Die allgemeine Definition eines durchgängigen Prozesses, einschließlich Parametern und Verweisen auf Tools. Workflow-Definitionen können als WDL, Nextflow oder CWL ausgedrückt werden. Jeder erstellte Workflow hat eine eindeutige Kennung.

  • Ausführen — Ein einziger Aufruf eines Workflows. Ein einzelner Lauf verwendet Ihre definierten Eingabedaten und erzeugt eine Ausgabe. Jeder erstellte Lauf hat eine eindeutige Kennung.

  • Aufgabe — Die einzelnen Prozesse innerhalb eines Laufs. HealthOmics Workflows verwenden diese definierten Rechenspezifikationen, um Ihre Aufgabe auszuführen. Jede Aufgabe hat eine eindeutige Kennung.

  • Ausführungsgruppe — Eine Gruppe von Läufen, für die Sie die maximale vCPU, die maximale Dauer oder die maximale Anzahl gleichzeitiger Läufe festlegen können, um die pro Lauf verwendeten Rechenressourcen zu begrenzen. Sie können Prioritäten für Ihre Läufe innerhalb einer Ausführungsgruppe angeben und konfigurieren. Sie können beispielsweise angeben, dass ein Lauf mit hoher Priorität vor einem Lauf mit niedrigerer Priorität ausgeführt wird, wodurch eine Prioritätswarteschlange entsteht. Die Verwendung einer Ausführungsgruppe ist optional, und jede Ausführungsgruppe hat eine eindeutige Kennung.

HealthOmics features

HealthOmics bietet die folgenden Funktionen.

  • HealthOmics Speicher — hilft Ihnen dabei, Petabyte an genomischen Rohdaten effizient und zu niedrigen Kosten pro Gigabase zu speichern und gemeinsam zu nutzen.

  • HealthOmics Analytik — vereinfacht die Aufbereitung von Genomikdaten für multimodale und multimodale Analysen.

  • HealthOmics Workflows — stellt automatisch die zugrunde liegende Infrastruktur für Ihre bioinformatischen Workflows bereit und skaliert sie.

Sie können jede Komponente unabhängig oder als Teil einer integrierten end-to-end Lösung verwenden.

HealthOmics bietet Ihnen die folgenden Vorteile.

  • Genomdaten sicher speichern und kombinieren — HealthOmics lässt sich in andere AWS Dienste wie Amazon AWS Lake Formation Athena integrieren. Sie können Ihre Genomdaten sicher speichern und sie dann abfragen oder mit Anamnesedaten kombinieren, um bessere Diagnosen und personalisierte Behandlungspläne zu erhalten.

  • Schützen Sie die Privatsphäre Ihrer Patienten — HealthOmics ist HIPAA-fähig. Es ist auch in IAM und Amazon integriert, CloudWatch sodass Sie den Datenzugriff kontrollieren und protokollieren und verfolgen können, wie die Daten in Analysen verwendet werden.

  • Maßgeschneidert — Support Sie Analysen großer Bevölkerungsdaten mit vereinfachter Abrechnung und neuen Tools für die Zusammenarbeit.

  • Maximieren Sie die Effizienz — Verwenden Sie automatisierte Workflows und integrierte Tools, um die Datenverarbeitung und -analyse zu optimieren.

Sie können es HealthOmics für die folgenden biomedizinischen Anwendungen verwenden:

  • Populationssequenzierung — Fragen Sie Tausende von Genomen gleichzeitig ab, um zu verstehen, wie genomische Variationen den Phänotypen in einer Population zugeordnet werden.

  • Klinische Genomik — Erstellen Sie reproduzierbare Genomik-Workflows von der Sequenzerausgabe bis hin zu berichtspflichtigen Daten. Sie können auch für einen hohen Durchsatz optimieren und die Rechenanforderungen für klinische Proben mit hoher Priorität festlegen, um die Bearbeitungszeit zu verkürzen.

  • Klinische Studien — Integrieren Sie Genomanalysen in klinische Studien, um die Wirksamkeit neuer Arzneimittelkandidaten besser zu verstehen. Vereinfachen und beschleunigen Sie klinische Studien mit langfristigen Kosteneinsparungen und Datenherkunft, um die Vorschriften der Aufsichtsbehörden zu erfüllen.

  • Verbessern Sie Forschung und Innovation — Optimieren und kontrollieren Sie die Speicherung, den Zugriff und die Analyse anonymisierter Genomdaten mit der integrierten zeilen- und spaltenbasierten Zugriffskontrolle.

Die folgenden Dienste funktionieren mit. HealthOmics

  • Amazon Elastic Container Registry — Jeder private Workflow verwendet ein Amazon ECR-Image (in einem privaten Amazon ECR-Repository), um alle ausführbaren Dateien, Bibliotheken und Skripten zu enthalten, die für die Ausführung des Workflows erforderlich sind.

  • Amazon Simple Storage Service — Amazon S3 bietet Dateispeicher für Store- und Workflow-Daten.

  • AWS Lake Formation — Lake Formation verwaltet den Datenzugriff auf Ihre Analytics-Datenspeicher.

  • Amazon Athena — Verwenden Sie Athena, um Abfragen in Ihren Variant-Shops durchzuführen.

  • Amazon SageMaker AI — Verwenden Sie SageMaker KI, um HealthOmics Aufgaben mit Jupyter-Notebooks auszuführen.

Regionen und Endpunkte für AWS HealthOmics

Eine vollständige Liste der Regionen und Endpunkte finden Sie in der AWS Allgemeinen Referenz.

Zusätzlich zu den AWS Regionen, die standardmäßig aktiv sind, gibt es auch Opt-in-Regionen, die aktiviert werden müssen. Weitere Informationen zur Aktivierung oder Deaktivierung einer Region findest du im Leitfaden zur Kontoverwaltung unter „Geben Sie an, welche AWS Regionen Ihr AWS Konto verwenden kann“.

Wie greife ich zu HealthOmics

Sie können über die Managementkonsole, CLI SDKs oder API auf AWS HealthOmics Funktionen zugreifen.

  • AWS Managementkonsole — Stellt eine Weboberfläche bereit, über die Sie darauf zugreifen können HealthOmics.

  • AWS Command Line Interface (AWS CLI) — Stellt Befehle für eine Vielzahl von AWS Diensten bereit, darunter Windows AWS HealthOmics, MacOS und Linux, und wird unter diesen unterstützt. Weitere Informationen zur Installation von finden Sie unter AWS Command Line Interface. AWS CLI

  • AWS SDKs — AWS stellt SDKs (Software Development Kits) bereit, die aus Bibliotheken und Beispielcode für verschiedene Programmiersprachen und Plattformen (einschließlich Java, Python, Ruby, .NET, iOS und Android) bestehen. SDKs Sie bieten eine bequeme Möglichkeit, sie HealthOmics programmgesteuert zu verwenden. Weitere Informationen finden Sie im AWS SDK Developer Center.

  • AWS API — Sie können API-Operationen verwenden, um HealthOmics programmgesteuert darauf zuzugreifen und diese zu verwalten. Weitere Informationen finden Sie in der HealthOmics -API-Referenz.

Weitere Informationen

In diesen Workshops und HealthOmics Tutorials erfahren Sie mehr darüber:

Machen Sie sich mit zusätzlichen HealthOmics Tools vertraut, die Folgendes bieten: AWS