AWS Data Pipeline ya no está disponible para nuevos clientes. Clientes actuales de AWS Data Pipeline pueden seguir utilizando el servicio con normalidad. Más información
Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Actividades
En AWS Data Pipeline, una actividad es un componente del proceso que define el trabajo a realizar. AWS Data Pipeline proporciona varias actividades preconfiguradas que se adaptan a situaciones comunes, como mover datos de un lugar a otro, ejecutar consultas de Hive, etc. Las actividades son ampliables, por lo que puede ejecutar sus propios scripts personalizados para admitir infinitas combinaciones.
AWS Data Pipeline admite los siguientes tipos de actividades:
- CopyActivity
-
Copia datos de una ubicación a otra.
- EmrActivity
-
Ejecuta un clúster de Amazon EMR.
- HiveActivity
-
Ejecuta una consulta de Hive en un clúster de Amazon EMR.
- HiveCopyActivity
-
Ejecuta una consulta de Hive en un clúster de Amazon EMR con soporte para filtrado de datos avanzado y soporte para S3 DataNode y ynamoDBDataNodo D.
- PigActivity
-
Ejecuta un script de Pig en un clúster de Amazon EMR.
- RedshiftCopyActivity
-
Copia datos desde y hacia tablas Amazon Redshift.
- ShellCommandActivity
-
Ejecuta un comando de shell de UNIX/Linux personalizado como actividad.
- SqlActivity
-
Ejecuta una consulta SQL en una base de datos.
Algunas actividades poseen una compatibilidad especial para uso transitorio de datos y tablas de la base de datos. Para obtener más información, consulte Datos y tablas transitorios con actividades de canalización.