Lanzamiento de una aplicación de Spark mediante la integración de Amazon Redshift para Apache Spark
En el caso de las versiones 6.4 a 6.9 de Amazon EMR, debe usar la opción --jars
o --packages
para especificar cuáles de los siguientes archivos JAR desea usar. La opción --jars
especifica las dependencias almacenadas localmente, en HDFS o mediante HTTP/S. Para ver otras ubicaciones de archivos compatibles con la opción --jars
, consulte la sección Advanced Dependency Management--packages
especifica las dependencias almacenadas en el repositorio público de Maven.
-
spark-redshift.jar
-
spark-avro.jar
-
RedshiftJDBC.jar
-
minimal-json.jar
Las versiones 6.10.0 y posteriores de Amazon EMR no requieren la dependencia minimal-json.jar
e instalan automáticamente las demás dependencias en cada clúster de forma predeterminada. En los siguientes ejemplos se muestra cómo lanzar una aplicación de Spark con la integración de Amazon Redshift para Apache Spark.