Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
¿Qué es AWS HealthOmics?
AWS HealthOmics es un AWS servicio que ayuda a los usuarios, como bioinformáticos, investigadores y científicos, a almacenar, consultar, analizar y generar información a partir de la genómica y otros datos biológicos. Simplifica y acelera el proceso de almacenamiento y análisis de la información genómica para las organizaciones clínicas y de investigación, y acelera los descubrimientos científicos y la generación de información.
HealthOmics tiene tres componentes principales. HealthOmics El almacenamiento le ayuda a almacenar y compartir petabytes de datos genómicos de manera eficiente y a un bajo costo por gigabase. HealthOmics La analítica simplifica la forma de preparar los datos genómicos para los análisis multiómicos y multimodales. HealthOmics Los flujos de trabajo aprovisionan y escalan automáticamente la infraestructura subyacente de sus cálculos bioinformáticos.
Temas
Aviso importante
HealthOmics no sustituye el asesoramiento, el diagnóstico o el tratamiento de un médico profesional, y no pretende curar, tratar, mitigar, prevenir o diagnosticar ninguna enfermedad o afección de salud. Usted es responsable de instituir una revisión humana como parte de cualquier uso de cualquier producto de terceros destinado a fundamentar la toma de decisiones clínicas AWS HealthOmics, incluso en asociación con él.
HealthOmics está destinado únicamente a transferir, almacenar, formatear o mostrar datos y a proporcionar soporte de infraestructura y configuración para gestionar los flujos de trabajo. AWS HealthOmics no está diseñado para realizar directamente la búsqueda de variantes ni el análisis e interpretación genómicos. AWS HealthOmics no pretende interpretar ni analizar las pruebas de laboratorio clínico ni los datos, resultados y hallazgos de otros dispositivos, ni sustituye a las herramientas de terceros destinadas a utilizarse en los análisis genómicos.
HealthOmics conceptos
Este tema cubre las definiciones de los conceptos y términos clave específicos de HealthOmics, para ayudarlo a comprender la terminología HealthOmics utilizada en esta guía.
Almacenamiento
El almacenamiento de datos se divide en almacenes de secuencias, para las secuencias genómicas e información relacionada, y un almacén de referencia, para todos los genomas de referencia. Los siguientes términos describen las implementaciones específicas de. HealthOmics
-
Almacén de secuencias: almacén de datos para el almacenamiento de archivos genómicos. Puede tener uno o más almacenes de secuencias en su interior HealthOmics. Los permisos de acceso y el AWS KMS cifrado se pueden configurar en un almacén de secuencias para controlar quién tiene acceso a los datos.
-
Conjunto de lecturas: un conjunto de lecturas es una abstracción de las lecturas genómicas, que se almacenan en los formatos FASTQ, BAM o CRAM. Los conjuntos de lectura pueden importarse a almacenes de secuencias y anotarse con metadatos. Puede aplicar permisos a los conjuntos de lectura mediante el control de acceso basado en atributos (ABAC).
-
Referencia: una referencia genómica se utiliza con las lecturas para identificar en qué parte del genoma se mapea una lectura específica o un grupo de lecturas. Están en formato FASTA y se almacenan en el almacén de referencias.
-
Almacén de referencia: almacén de datos para el almacenamiento de genomas de referencia. Puede tener un único almacén de referencias en cada cuenta y región.
Análisis
Puede transformar y analizar sus datos genómicos con HealthOmics Analytics. Cree un almacén de variantes o un almacén de anotaciones para incluir información adicional para sus consultas.
-
Almacén de variantes: almacén de datos que almacena datos de variantes a escala de población. Los almacenes de variantes admiten tanto el formato de llamada de variantes genómicas (gvCF) como las entradas VCF.
-
Almacén de anotaciones: banco de datos que representa una base de datos de anotaciones, como una de un archivo TSV/CSV, VCF o General Feature Format (). GFF3 Los almacenes de anotaciones se asignan al mismo sistema de coordenadas que los almacenes de variantes durante una importación.
Flujos de trabajo
Con HealthOmics los flujos de trabajo, puede procesar y analizar sus datos genómicos.
-
Flujo de trabajo: la definición general de un proceso integral, incluidos los parámetros y las referencias a las herramientas. Las definiciones de flujo de trabajo se pueden expresar como WDL, Nextflow o CWL. Cada flujo de trabajo creado tiene un identificador único.
-
Ejecutar: una sola invocación de un flujo de trabajo. Una ejecución individual utiliza los datos de entrada definidos y produce una salida. Cada ejecución creada tiene un identificador único.
-
Tarea: los procesos individuales de una ejecución. HealthOmics Los flujos de trabajo utilizan estas especificaciones informáticas definidas para ejecutar la tarea. Cada tarea tiene un identificador único.
-
Grupo de ejecuciones: grupo de ejecuciones para el que puedes establecer el número máximo de vCPU, la duración máxima o el máximo de ejecuciones simultáneas para limitar los recursos informáticos utilizados por ejecución. Puedes especificar y configurar las prioridades de tus ejecuciones dentro de un grupo de ejecuciones. Por ejemplo, puedes especificar que se ejecute una ejecución de alta prioridad antes que una de menor prioridad, creando una cola de prioridad. El uso de un grupo de ejecución es opcional y cada grupo de ejecución tiene un identificador único.
HealthOmics features
HealthOmics ofrece las siguientes funciones.
-
HealthOmics Almacenamiento: le ayuda a almacenar y compartir petabytes de datos genómicos sin procesar de manera eficiente y a un bajo costo por gigabase.
-
HealthOmics Análisis: simplifica la forma de preparar los datos genómicos para los análisis multiómicos y multimodales.
-
HealthOmics Flujos de trabajo: aprovisiona y escala automáticamente la infraestructura subyacente para sus flujos de trabajo bioinformáticos.
Puede utilizar cada componente de forma independiente o como parte de una solución integrada end-to-end.
HealthOmics le ofrece las siguientes ventajas.
-
Almacene y combine datos genómicos de forma segura: HealthOmics se integra con otros AWS servicios, como Amazon AWS Lake Formation Athena. Puede almacenar de forma segura sus datos genómicos y, a continuación, consultarlos o combinarlos con los datos del historial médico para obtener mejores diagnósticos y planes de tratamiento personalizados.
-
Proteja la privacidad de los pacientes: HealthOmics ¿cumple con los requisitos de la HIPAA? También se integra con IAM y Amazon CloudWatch para que pueda controlar y registrar el acceso a los datos y realizar un seguimiento de cómo se utilizan los datos en los análisis.
-
Creado para escalar: Support análisis de datos de gran población con una facturación simplificada y nuevas herramientas de colaboración.
-
Maximice la eficiencia: utilice flujos de trabajo automatizados y herramientas integradas para agilizar el procesamiento y el análisis de datos.
Se puede utilizar HealthOmics para las siguientes aplicaciones biomédicas:
-
Secuenciación de poblaciones: consulte miles de genomas a la vez para comprender cómo se asigna la variación genómica a los fenotipos de una población.
-
Genómica clínica: cree flujos de trabajo genómicos reproducibles, desde la salida del secuenciador hasta los datos declarables. También puede optimizarlos para obtener un rendimiento de gran volumen y establecer los requisitos de cómputo para las muestras clínicas de alta prioridad a fin de reducir el tiempo de entrega.
-
Ensayos clínicos: integre el análisis del genoma en los ensayos clínicos para comprender mejor la eficacia de los nuevos fármacos candidatos. Simplifique y acelere los ensayos clínicos con ahorros de costos a largo plazo y la procedencia de los datos para cumplir con las regulaciones de los órganos rectores.
-
Mejore la investigación y la innovación: optimice y controle el almacenamiento, el acceso y el análisis de los datos genómicos anónimos con un control de acceso integrado basado en filas y columnas.
Servicios relacionados
Los siguientes servicios funcionan con. HealthOmics
-
Amazon Elastic Container Registry: cada flujo de trabajo privado utiliza una imagen de Amazon ECR (en un repositorio privado de Amazon ECR) para contener todos los ejecutables, bibliotecas y scripts necesarios para ejecutar el flujo de trabajo.
-
Amazon Simple Storage Service: Amazon S3 proporciona almacenamiento de archivos para los datos de la tienda y del flujo de trabajo.
-
AWS Lake Formation — Lake Formation gestiona el acceso a los datos de sus almacenes de datos de Analytics.
-
Amazon Athena: usa Athena para realizar consultas en tus tiendas de variantes.
-
Amazon SageMaker AI: utilice la SageMaker IA para ejecutar HealthOmics tareas con los cuadernos Jupyter.
Regiones y puntos finales para AWS HealthOmics
Para obtener una lista completa de regiones y puntos finales, consulte la Referencia AWS general.
Además de las AWS regiones que están activas de forma predeterminada, también hay regiones de suscripción que deben activarse. Para obtener más información sobre cómo activar o desactivar una región, consulta Especificar qué AWS regiones puede usar tu cuenta en la guía de administración de AWS cuentas.
¿Cómo acceder HealthOmics
Puede acceder a AWS HealthOmics las funciones mediante la consola de administración, la CLI SDKs o la API.
-
AWS Consola de administración: proporciona una interfaz web a la que puede acceder HealthOmics.
-
AWS Command Line Interface (AWS CLI): proporciona comandos para un amplio conjunto de AWS servicios AWS HealthOmics, incluidos y es compatible con Windows, macOS y Linux. Para obtener más información sobre la instalación de AWS CLI, consulte AWS Command Line Interface
. -
AWS SDKs — AWS proporciona SDKs (kits de desarrollo de software) que consisten en bibliotecas y código de muestra para varios lenguajes de programación y plataformas (incluidos Java, Python, Ruby, .NET, iOS y Android). SDKs Proporcionan una forma cómoda de utilizarlos HealthOmics mediante programación. Para obtener más información, consulta el Centro de desarrolladores del AWS SDK
. -
AWS API: puede usar las operaciones de la API para acceder a ellas y administrarlas HealthOmics mediante programación. Para obtener más información, consulte la Referencia de la API de HealthOmics .
Más información
Obtenga más información HealthOmics en estos talleres y tutoriales:
-
HealthOmics taller: taller de principio a HealthOmics fin
-
AWS recursos genómicos — Repositorios públicos de Amazon ECR relacionados
con la genómica -
Tutoriales de Python: tutoriales de Jupyter Notebook
sobre HealthOmics almacenamiento GitHub, análisis y flujos de trabajo
Familiarícese con HealthOmics herramientas adicionales que AWS ofrecen:
-
WDL linter: HealthOmics linter
para WDL -
HealthOmics Herramienta auxiliar de Amazon ECR: herramienta de ayuda de Amazon ECR para HealthOmics
-
HealthOmics herramientas sobre GitHub : herramientas con las que trabajar HealthOmics
(gestor de transferencias, analizador de URI, reejecución de Omics, analizador de ejecución).