Acceso a los parámetros mediante getResolvedOptions
La función de utilidad getResolvedOptions(args, options)
de AWS Glue le da acceso a los argumentos que se pasan a su script cuando ejecuta un flujo de trabajo. Para utilizar esta función, comience importándola desde el módulo utils
de AWS Glue junto con el módulo sys
:
import sys from awsglue.utils import getResolvedOptions
getResolvedOptions(args, options)
-
args
: lista de argumentos contenida ensys.argv
. -
options
: matriz de Python de los nombres de argumentos que quiere recuperar.
ejemplo Recuperación de los argumentos que se pasan a un JobRun
Imagine que ha creado un JobRun en un script, quizás dentro de una función Lambda:
response = client.start_job_run( JobName = 'my_test_Job', Arguments = { '--day_partition_key': 'partition_0', '--hour_partition_key': 'partition_1', '--day_partition_value': day_partition_value, '--hour_partition_value': hour_partition_value } )
Para recuperar los argumentos que se pasan, puede utilizar la función getResolvedOptions
de la siguiente manera:
import sys from awsglue.utils import getResolvedOptions args = getResolvedOptions(sys.argv, ['JOB_NAME', 'day_partition_key', 'hour_partition_key', 'day_partition_value', 'hour_partition_value']) print "The day-partition key is: ", args['day_partition_key'] print "and the day-partition value is: ", args['day_partition_value']
Tenga en cuenta que al definir cada uno de los argumentos comienzan con dos guiones y después se hace referencia a ellos en el script sin los guiones. Los argumentos solo usan guiones bajos, no guiones. Sus argumentos tienen que seguir esta convención para que se puedan resolver.