Actividades - AWS Data Pipeline

AWS Data Pipeline ya no está disponible para nuevos clientes. Clientes actuales de AWS Data Pipeline pueden seguir utilizando el servicio con normalidad. Más información

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Actividades

En AWS Data Pipeline, una actividad es un componente del proceso que define el trabajo a realizar. AWS Data Pipeline proporciona varias actividades preconfiguradas que se adaptan a situaciones comunes, como mover datos de un lugar a otro, ejecutar consultas de Hive, etc. Las actividades son ampliables, por lo que puede ejecutar sus propios scripts personalizados para admitir infinitas combinaciones.

AWS Data Pipeline admite los siguientes tipos de actividades:

CopyActivity

Copia datos de una ubicación a otra.

EmrActivity

Ejecuta un clúster de Amazon EMR.

HiveActivity

Ejecuta una consulta de Hive en un clúster de Amazon EMR.

HiveCopyActivity

Ejecuta una consulta de Hive en un clúster de Amazon EMR con soporte para filtrado de datos avanzado y soporte para S3 DataNode y ynamoDBDataNodo D.

PigActivity

Ejecuta un script de Pig en un clúster de Amazon EMR.

RedshiftCopyActivity

Copia datos desde y hacia tablas Amazon Redshift.

ShellCommandActivity

Ejecuta un comando de shell de UNIX/Linux personalizado como actividad.

SqlActivity

Ejecuta una consulta SQL en una base de datos.

Algunas actividades poseen una compatibilidad especial para uso transitorio de datos y tablas de la base de datos. Para obtener más información, consulte Datos y tablas transitorios con actividades de canalización.