Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Analítica
AWS proporciona un conjunto completo de servicios de análisis que se adaptan a todas sus necesidades de análisis de datos y permite a las organizaciones de todos los tamaños e industrias reinventar sus negocios con los datos. Desde el almacenamiento y la administración, el gobierno de los datos, las acciones y las experiencias, AWS ofrece servicios diseñados específicamente que ofrecen la mejor relación precio-rendimiento, escalabilidad y el menor costo.
Cada servicio se describe después del diagrama. Para ayudarle a decidir qué servicio se adapta mejor a sus necesidades, consulte Elegir un AWS servicio de análisis. Para obtener información general, consulte Analytics en AWS.
Regresar aAWS servicios.
Amazon Athena
Amazon Athena es un servicio de consultas interactivo que facilita el análisis de datos en Amazon S3 de forma estándar. SQL Athena no requiere un servidor, por lo que no hay una infraestructura para administrar y solo pagará por las consultas que ejecute.
Athena es fácil de usar. Solo tiene que apuntar a sus datos en Amazon S3, definir el esquema y empezar a realizar consultas de forma estándar. SQL La mayoría de los resultados se entregan en cuestión de segundos. Con Athena, no es necesario realizar tareas complejas de extracción, transformación y carga (ETL) para preparar los datos para el análisis. Esto facilita a cualquier persona con SQL habilidades el análisis rápido de conjuntos de datos a gran escala.
Athena está out-of-the-box integrada con AWS Glue Data Catalog, lo que le permite crear un repositorio de metadatos unificado para varios servicios, rastrear las fuentes de datos para descubrir esquemas y rellenar su catálogo con definiciones de tablas y particiones nuevas o modificadas, y mantener el control de versiones de los esquemas.
Amazon CloudSearch
Amazon CloudSearch es un servicio gestionado en Nube de AWS eso hace que sea sencillo y rentable configurar, administrar y escalar una solución de búsqueda para su sitio web o aplicación. Amazon CloudSearch admite 34 idiomas y funciones de búsqueda populares, como el resaltado, la función de autocompletar y la búsqueda geoespacial.
Amazon DataZone
Amazon DataZone es un servicio de administración de datos que puede utilizar para publicar datos y ponerlos a disposición del catálogo de datos empresariales a través de su aplicación web personalizada. Puede acceder a sus datos de forma más segura, independientemente del lugar donde estén almacenados: AWS, en las instalaciones o en aplicaciones SaaS como Salesforce. Amazon DataZone simplifica tu experiencia en todo AWS servicios como Amazon Redshift, Amazon Athena, AWS Glue, AWS Lake Formation y Amazon QuickSight.
Amazon EMR
Amazon EMR es la plataforma de macrodatos en la nube líder del sector para procesar grandes cantidades de datos mediante herramientas de código abierto como Apache Spark, Apache Hive, Apache, ApacheFlinkHBase, ApacheHudi y Presto. Amazon EMR facilita la configuración, el funcionamiento y el escalado de sus entornos de big data mediante la automatización de tareas que consumen mucho tiempo, como el aprovisionamiento de capacidad y el ajuste de los clústeres. Con AmazonEMR, puede ejecutar análisis a escala de petabytes a menos de la mitad del coste de las soluciones locales tradicionales y más de 3 veces más rápido que el Apache Spark estándar. Puede ejecutar cargas de trabajo en EC2 instancias de Amazon, en clústeres de Amazon Elastic Kubernetes Service EKS (Amazon) o de forma local mediante Amazon en EMR AWS Outposts.
Amazon FinSpace
Amazon FinSpacees un servicio de análisis y administración de datos diseñado específicamente para el sector de los servicios financieros (). FSI FinSpace reduce de meses a minutos el tiempo que dedica a buscar y preparar petabytes de datos financieros para que estén listos para el análisis.
Las organizaciones de servicios financieros analizan los datos de los almacenes de datos internos, como los sistemas de cartera, actuariales y de gestión de riesgos, así como los petabytes de datos de fuentes de datos de terceros, como los precios históricos de los valores bursátiles. Encontrar los datos correctos, obtener permisos para acceder a los datos de forma compatible y prepararlos para el análisis puede llevar meses.
FinSpace elimina la pesada tarea de crear y mantener un sistema de gestión de datos para el análisis financiero. Con él FinSpace, puede recopilar datos y catalogarlos según conceptos empresariales relevantes, como la clase de activo, la clasificación del riesgo o la región geográfica. FinSpace facilita el descubrimiento y el intercambio de datos en toda su organización de acuerdo con sus requisitos de conformidad. Defina sus políticas de acceso a los datos en un solo lugar y FinSpace las haga cumplir, a la vez que conserva los registros de auditoría para permitir la elaboración de informes sobre el cumplimiento y las actividades. FinSpace también incluye una biblioteca de más de 100 funciones, como barras de tiempo y bandas de Bollinger, para que pueda preparar los datos para su análisis.
Amazon Kinesis
Amazon Kinesis facilita la recopilación, el procesamiento y el análisis de datos de streaming en tiempo real para que pueda obtener información oportuna y reaccionar rápidamente ante la nueva información. Amazon Kinesis ofrece funciones clave para procesar de forma rentable los datos de streaming a cualquier escala, además de la flexibilidad necesaria para elegir las herramientas que mejor se adapten a los requisitos de su aplicación. Con Amazon Kinesis, puede incorporar datos en tiempo real, como vídeo, audio, registros de aplicaciones, secuencias de clics de sitios web y datos de telemetría de IoT para aplicaciones de aprendizaje automático (ML), análisis y otras aplicaciones. Amazon Kinesis le permite procesar y analizar los datos a medida que llegan y responder al instante, en lugar de tener que esperar a que se recopilen todos los datos para poder comenzar el procesamiento.
Amazon Kinesis ofrece actualmente cuatro servicios: Firehose, Managed Service for Apache Flink, Kinesis Data Streams y Kinesis Video Streams.
Amazon Data Firehose
Amazon Data Firehose es la forma más sencilla de cargar datos de streaming de forma fiable en almacenes de datos y herramientas de análisis. Puede capturar, transformar y cargar datos de streaming en Amazon S3, Amazon Redshift, Amazon OpenSearch Service y Splunk, lo que permite realizar análisis casi en tiempo real con las herramientas y paneles de inteligencia empresarial existentes que ya utiliza en la actualidad. Se trata de un servicio totalmente gestionado que se escala automáticamente para adaptarse al rendimiento de sus datos y no requiere una administración continua. También puede agrupar, comprimir, transformar y cifrar los datos antes de cargarlos, lo que minimiza la cantidad de almacenamiento utilizada en el destino y aumenta la seguridad.
Puede crear fácilmente un flujo de entrega de Firehose desde AWS Management Console, configúrelo con unos pocos clics y comience a enviar datos a la transmisión desde cientos de miles de fuentes de datos para cargarlos continuamente a AWS—todo en tan solo unos minutos. También puede configurar su transmisión de entrega para convertir automáticamente los datos entrantes a formatos de columnas, como Apache Parquet y ApacheORC, antes de que los datos se entreguen a Amazon S3, a fin de obtener un almacenamiento y un análisis rentables.
Amazon Managed Service para Apache Flink
Amazon Managed Service para Apache Flink es la forma más sencilla de analizar los datos de streaming, obtener información útil y responder a las necesidades de su empresa y sus clientes en tiempo real. Amazon Managed Service for Apache Flink reduce la complejidad de crear, administrar e integrar aplicaciones de streaming con otras AWS servicios. SQLlos usuarios pueden consultar fácilmente los datos de streaming o crear aplicaciones de streaming completas mediante plantillas y un SQL editor interactivo. Los desarrolladores de Java pueden crear rápidamente aplicaciones de streaming sofisticadas utilizando bibliotecas Java de código abierto y AWS
integraciones para transformar y analizar datos en tiempo real.
Amazon Managed Service para Apache Flink se encarga de todo lo necesario para ejecutar sus consultas de forma continua y escala automáticamente para adaptarse al volumen y la tasa de rendimiento de los datos entrantes.
Amazon Kinesis Data Streams
Amazon Kinesis Data Streams es un servicio de streaming de datos en tiempo real duradero y con gran escalabilidad. Kinesis Data Streams puede capturar de forma continua gigabytes de datos por segundo de cientos de miles de fuentes, como secuencias de clics en sitios web, secuencias de eventos de bases de datos, transacciones financieras, feeds de redes sociales, registros de TI y eventos de seguimiento de ubicación. Los datos recopilados están disponibles en milisegundos para permitir casos de uso de análisis en tiempo real, como paneles de control en tiempo real, detección de anomalías en tiempo real, precios dinámicos y más.
Amazon Kinesis Video Streams
Amazon Kinesis Video Streams facilita la transmisión segura de vídeo desde los dispositivos conectados a AWS para análisis, aprendizaje automático, reproducción y otros tipos de procesamiento. Kinesis Video Streams aprovisiona automáticamente y escala de forma elástica toda la infraestructura necesaria para ingerir datos de vídeo en streaming desde millones de dispositivos. También almacena, cifra e indexa de forma duradera los datos de vídeo de sus transmisiones y le permite acceder a sus datos a través de ellos. easy-to-use APIs Kinesis Video Streams le permite reproducir vídeos para verlos en directo y bajo demanda, y crear rápidamente aplicaciones que aprovechen la visión artificial y el análisis de vídeo mediante la integración con Amazon Rekognition Video y bibliotecas para marcos de aprendizaje automático MxNet como TensorFlow Apache y OpenCV.
OpenSearch Servicio Amazon
Amazon OpenSearch Service (OpenSearch Service) facilita la implementación, la seguridad, el funcionamiento y el escalado OpenSearch para buscar, analizar y visualizar datos en tiempo real. Con Amazon OpenSearch Service, obtiene easy-to-use APIs capacidades de análisis en tiempo real para impulsar casos de uso como el análisis de registros, la búsqueda de texto completo, la supervisión de aplicaciones y el análisis del flujo de clics, con disponibilidad, escalabilidad y seguridad de nivel empresarial. El servicio ofrece integraciones con herramientas de código abierto, como OpenSearch Dashboards y Logstash, para la ingesta y visualización de datos. También se integra a la perfección con otras AWS servicios como Amazon Virtual Private Cloud (AmazonVPC), AWS Key Management Service (AWS KMS), Amazon Data Firehose, AWS Lambda, AWS Identity and Access Management (IAM), Amazon Cognito y Amazon CloudWatch, para que pueda pasar rápidamente de datos sin procesar a información procesable.
Amazon OpenSearch Serverless
Amazon OpenSearch Serverless es una opción sin servidor de Amazon OpenSearch Service. Como desarrollador, puede usar OpenSearch Serverless para ejecutar cargas de trabajo a escala de petabytes sin necesidad de configurar, administrar ni escalar los clústeres. OpenSearch Obtendrá los mismos tiempos de respuesta interactivos en milisegundos que OpenSearch Service con la sencillez de un entorno sin servidor.
El motor vectorial de Amazon OpenSearch Serverless añade una capacidad de almacenamiento y búsqueda vectorial simple, escalable y de alto rendimiento para ayudar a los desarrolladores a crear experiencias de búsqueda aumentadas por ML y aplicaciones generativas de IA sin tener que gestionar la infraestructura de bases de datos vectoriales. Los casos de uso de las colecciones de búsquedas vectoriales incluyen la búsqueda de imágenes, la búsqueda de documentos, la recuperación de música, la recomendación de productos, la búsqueda de vídeos, la búsqueda basada en la ubicación, la detección de fraudes y la detección de anomalías.
Amazon Redshift
Amazon Redshift es el almacén de datos en la nube más utilizado. Permite analizar todos los datos de forma rápida, sencilla y rentable con las herramientas de inteligencia empresarial (BI) estándar SQL y las ya existentes. Le permite ejecutar consultas analíticas complejas contra terabytes o petabytes de datos estructurados y semiestructurados, mediante una sofisticada optimización de consultas, almacenamiento en columnas en almacenamiento de alto rendimiento y finalización masiva de consultas en paralelo. La mayoría de los resultados se obtienen en cuestión de segundos. Puede empezar con algo pequeño por tan solo 0,25$ por hora sin compromisos y ampliarlo hasta petabytes de datos por 1000$ por terabyte al año, menos de una décima parte del coste de las soluciones locales tradicionales.
Amazon Redshift sin servidor
Amazon Redshift Serverless facilita la ejecución y el escalado de los análisis sin tener que gestionar la infraestructura de almacenamiento de datos. Los desarrolladores, los científicos de datos y los analistas pueden trabajar en bases de datos, almacenes de datos y lagos de datos para crear aplicaciones de informes y paneles, realizar análisis casi en tiempo real, compartir datos y colaborar en ellos, y crear y entrenar modelos de aprendizaje automático (ML). Convierta grandes cantidades de datos en información valiosa en cuestión de segundos. Amazon Redshift Serverless aprovisiona y escala automáticamente la capacidad de almacenamiento de datos de forma inteligente para ofrecer un rendimiento rápido incluso para las cargas de trabajo más exigentes e impredecibles, y usted paga solo por lo que utilice. Simplemente cargue los datos y comience a realizar consultas de inmediato en Amazon Redshift Query Editor o en su herramienta de inteligencia empresarial (BI) favorita y siga disfrutando del mejor precio, rendimiento y funciones SQL conocidas en easy-to-use un entorno sin necesidad de administración.
Amazon QuickSight
Amazon QuickSight es un servicio de inteligencia empresarial (BI) rápido y basado en la nube que te facilita la entrega de información a todos los miembros de tu organización. QuickSight le permite crear y publicar paneles interactivos a los que se puede acceder desde navegadores o dispositivos móviles. Puede integrar paneles de control en sus aplicaciones, lo que proporciona a sus clientes potentes análisis de autoservicio. Amazon QuickSight se amplía fácilmente a decenas de miles de usuarios sin necesidad de instalar ningún software, implementar servidores o gestionar una infraestructura.
AWS Clean Rooms
AWS Clean Roomsayuda a las empresas y a sus socios a analizar y colaborar en sus conjuntos de datos colectivos de forma más fácil y segura, sin compartir ni copiar los datos subyacentes de los demás. ¿Con AWS Clean Rooms, los clientes pueden crear una sala limpia de datos segura en cuestión de minutos y colaborar con cualquier otra empresa en Nube de AWS para generar información única sobre las campañas publicitarias, las decisiones de inversión y la investigación y el desarrollo.
AWS Data Exchange
AWS Data Exchangefacilita la búsqueda, la suscripción y el uso de datos de terceros en la nube. Entre los proveedores de datos cualificados se encuentran marcas líderes en su categoría, como Reuters, que recopila datos de más de 2,2 millones de noticias únicas al año en varios idiomas; Change Healthcare, que procesa y anonimiza más de 14 000 millones de transacciones de atención médica y 1 billón de dólares en reclamaciones al año; Dun & Bradstreet, que mantiene una base de datos de más de 330 millones de registros comerciales globales; y Foursquare, cuyos datos de ubicación se derivan de 220 millones de consumidores únicos e incluye más de 60 millones de centros comerciales mundiales.
Una vez suscrito a un producto de datos, puede utilizar el AWS Data Exchange APIpara cargar datos directamente en Amazon S3 y, después, analizarlos con una amplia variedad de AWS servicios de análisis y aprendizaje automático. Por ejemplo, las aseguradoras de propiedades pueden suscribirse a los datos para analizar los patrones climáticos históricos y calibrar los requisitos de cobertura de seguro en diferentes geografías; los restaurantes pueden suscribirse a los datos de población y ubicación para identificar las regiones óptimas para la expansión; los investigadores académicos pueden realizar estudios sobre el cambio climático suscribiéndose a los datos sobre las emisiones de dióxido de carbono; y los profesionales de la salud pueden suscribirse a datos agregados de ensayos clínicos históricos para acelerar sus actividades de investigación.
En el caso de los proveedores de datos, AWS Data Exchange facilita el acceso a millones de AWS los clientes migran a la nube al eliminar la necesidad de crear y mantener una infraestructura para el almacenamiento, la entrega, la facturación y la asignación de derechos de los datos.
AWS Data Pipeline
AWS Data Pipelinees un servicio web que le ayuda a procesar y mover datos de forma fiable entre diferentes AWS servicios de cómputo y almacenamiento, así como fuentes de datos locales, a intervalos específicos. ¿Con AWS Data Pipeline, puede acceder periódicamente a los datos donde están almacenados, transformarlos y procesarlos a escala y transferir los resultados de forma eficaz a AWS servicios como Amazon S3, Amazon,Amazon RDS DynamoDB y Amazon. EMR
AWS Data Pipeline le ayuda a crear fácilmente cargas de trabajo de procesamiento de datos complejas que sean tolerantes a errores, repetibles y de alta disponibilidad. No tiene que preocuparse por garantizar la disponibilidad de los recursos, gestionar las dependencias entre tareas, reintentar errores transitorios o tiempos de espera en tareas individuales o crear un sistema de notificación de errores. AWS Data Pipeline también le permite mover y procesar datos que antes estaban guardados en silos de datos locales.
AWS Resolución de entidades
AWS Entity Resolution es un servicio que le ayuda a comparar y vincular los registros relacionados almacenados en múltiples aplicaciones, canales y almacenes de datos sin necesidad de crear una solución personalizada. Utilizando técnicas de aprendizaje automático flexibles y configurables y basadas en reglas, AWS Entity Resolution puede eliminar los registros duplicados, crear perfiles de clientes conectando diferentes interacciones con los clientes y personalizar las experiencias en las campañas de publicidad y marketing, los programas de fidelización y el comercio electrónico. Por ejemplo, puede crear una vista unificada de las interacciones con los clientes al vincular los eventos recientes, como los clics en anuncios, el abandono del carrito y las compras, en un identificador de coincidencia único.
AWS Glue
AWS Gluees un servicio de extracción, transformación y carga (ETL) totalmente gestionado que facilita a los clientes la preparación y carga de sus datos para su análisis. Puede crear y ejecutar un ETL trabajo con unos pocos clics en AWS Management Console. Simplemente señalas AWS Glue a sus datos almacenados en AWS, y AWS Glue descubre sus datos y almacena los metadatos asociados (como la definición de la tabla y el esquema) en el AWS Glue Data Catalog. Una vez catalogados, sus datos se pueden buscar, consultar y estar disponibles de forma inmediata. ETL
AWS Glue Los motores de integración de datos proporcionan acceso a los datos mediante Apache PySpark, Spark y Python. Con la adición de AWS Glue para Ray, puede escalar aún más sus cargas de trabajo con Ray, un marco de cómputo unificado de código abierto.
AWS Glue Data Quality puede medir y supervisar la calidad de los datos de los lagos de datos, almacenes de datos y otros repositorios de datos basados en Amazon S3. Calcula automáticamente las estadísticas, recomienda normas de calidad y puede supervisarlo y avisarle cuando detecte datos faltantes, obsoletos o incorrectos. Puede acceder a ellos en AWS Glue Data Catalog y en AWS Glue Data Catalog ETLpuestos de trabajo.
AWS Lake Formationes un servicio que facilita la configuración de un lago de datos seguro en cuestión de días. Un lago de datos es un repositorio centralizado, seleccionado y seguro que almacena todos los datos, tanto en su forma original como preparado para su análisis. Un lago de datos le permite desglosar los silos de datos y combinar diferentes tipos de análisis para obtener información y guiarlo a tomar mejores decisiones empresariales.
Sin embargo, hoy en día, configurar y administrar los lagos de datos implica muchas tareas manuales, complicadas y que requieren mucho tiempo. Este trabajo incluye cargar datos de diversas fuentes, monitorear esos flujos de datos, configurar particiones, activar el cifrado y administrar las claves, definir las tareas de transformación y monitorear su funcionamiento, reorganizar los datos en un formato de columnas, configurar los ajustes de control de acceso, deduplicar los datos redundantes, hacer coincidir los registros enlazados, conceder el acceso a los conjuntos de datos y auditar el acceso a lo largo del tiempo.
Crear un lago de datos con Lake Formation es tan sencillo como definir dónde residen sus datos y qué políticas de acceso y seguridad desea aplicar. Luego, Lake Formation recopila y cataloga los datos de las bases de datos y el almacenamiento de objetos, los mueve a su nuevo lago de datos de Amazon S3, limpia y clasifica los datos mediante algoritmos de aprendizaje automático y asegura el acceso a sus datos confidenciales. De este modo, sus usuarios pueden acceder a un catálogo centralizado de datos que describe los conjuntos de datos disponibles y su uso adecuado. Luego, sus usuarios aprovechan estos conjuntos de datos con los servicios de análisis y aprendizaje automático que elijan, como Amazon EMR for Apache Spark, Amazon Redshift, Amazon Athena SageMaker y Amazon. QuickSight
Amazon Managed Streaming para Apache Kafka (Amazon) MSK
Amazon Managed Streaming for Apache Kafka MSK (Amazon) es un servicio totalmente gestionado que facilita la creación y ejecución de aplicaciones que utilizan Apache Kafka para procesar datos de streaming. Apache Kafka es una plataforma de código abierto para crear aplicaciones y canalizaciones de datos de streaming en tiempo real. Con AmazonMSK, puede usar Apache Kafka APIs para poblar lagos de datos, transmitir los cambios hacia y desde las bases de datos y potenciar las aplicaciones de ML y análisis.
Los clústeres de Apache Kafka son difíciles de configurar, escalar y gestionar en producción. Cuando ejecuta Apache Kafka por su cuenta, necesita aprovisionar servidores, configurar Apache Kafka manualmente, reemplazar los servidores cuando fallan, organizar las actualizaciones y actualizaciones de los servidores, diseñar el clúster para garantizar una alta disponibilidad, garantizar que los datos se almacenen y protejan de forma duradera, configurar la supervisión y las alarmas, y planificar cuidadosamente los eventos de escalado para soportar los cambios de carga. Amazon le MSK facilita la creación y ejecución de aplicaciones de producción en Apache Kafka sin necesidad de tener experiencia en administración de infraestructuras de Apache Kafka. Esto significa que dedica menos tiempo a gestionar la infraestructura y más a crear aplicaciones.
Con unos pocos clics en la MSKconsola de Amazon, puede crear clústeres de Apache Kafka de alta disponibilidad con ajustes y configuraciones basados en las mejores prácticas de despliegue de Apache Kafka. Amazon aprovisiona y ejecuta MSK automáticamente sus clústeres de Apache Kafka. Amazon monitorea de MSK forma continua el estado del clúster y reemplaza automáticamente los nodos en mal estado sin que la aplicación pierda tiempo de inactividad. Además, Amazon MSK protege su clúster de Apache Kafka mediante el cifrado de los datos en reposo.
Regresar a. AWS servicios