

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Fase 2: configurare il AWS Glue job che esporta la tabella Amazon Keyspaces
<a name="S3-tutorial-step2"></a>

Nella seconda fase del tutorial, usi lo script `setup-export.sh` disponibile su [Github](https://github.com/aws-samples/amazon-keyspaces-examples/blob/main/scala/datastax-v4/aws-glue/export-to-s3/setup-export.sh) per creare e configurare il AWS Glue job che si connette ad Amazon Keyspaces utilizzando il plug-in SigV4 e quindi esporta la tabella specificata nel bucket Amazon S3 creato nel passaggio precedente. L'utilizzo dello script consente di esportare dati da Amazon Keyspaces senza configurare un cluster Apache Spark.

**Crea un AWS Glue processo per esportare una tabella Amazon Keyspaces in un bucket Amazon S3.**
+ In questo passaggio, esegui lo script di `setup-export.sh` shell che si trova nella `export-to-s3/` directory da utilizzare CloudFormation per creare e configurare il AWS Glue processo di esportazione. Lo script accetta i seguenti parametri.

  ```
  PARENT_STACK_NAME, EXPORT_STACK_NAME, KEYSPACE_NAME, TABLE_NAME, S3_URI, FORMAT
  ```
  + `PARENT_STACK_NAME`— Il nome dello CloudFormation stack creato nel passaggio precedente.
  + `EXPORT_STACK_NAME`— Il nome dello CloudFormation stack che crea il processo di AWS Glue esportazione.
  + `KEYSPACE_NAME`e `TABLE_NAME` — Il nome completo dello spazio delle chiavi e della tabella da esportare. Per questo tutorial, lo usiamo`catalog.book_awards`, ma puoi sostituirlo con il tuo nome di tabella completo.
  + `S3URI`— L'URI opzionale del bucket Amazon S3. L'impostazione predefinita è il bucket Amazon S3 dello stack principale.
  + `FORMAT`— Il formato dati opzionale. Il valore predefinito è `parquet`. Per questo tutorial, per facilitare il caricamento e la trasformazione dei dati, utilizziamo l'impostazione predefinita.

  È possibile utilizzare il seguente comando come esempio.

  ```
  setup-export.sh {{cfn-setup}} {{cfn-glue}} {{catalog}} {{book_awards}}
  ```

  Per confermare che il lavoro è stato creato, è possibile utilizzare la seguente dichiarazione.

  ```
  aws glue list-jobs
  ```

  L'output dell'istruzione dovrebbe essere simile a questo.

  ```
  {
      "JobNames": [
          "AmazonKeyspacesExportToS3-cfn-setup-cfn-glue"
      ]
  }
  ```

  Per vedere i dettagli del lavoro, puoi usare il seguente comando.

  ```
  aws glue get-job --job-name {{AmazonKeyspacesExportToS3-cfn-setup-cfn-glue}}
  ```

  L'output del comando mostra tutti i dettagli del lavoro. Ciò include gli argomenti predefiniti che è possibile sovrascrivere durante l'esecuzione del processo.

  ```
  {
      "Job": {
          "Name": "AmazonKeyspacesExportToS3-cfn-setup-cfn-glue",
          "JobMode": "SCRIPT",
          "JobRunQueuingEnabled": false,
          "Description": "export to s3",
          "Role": "iam-export-role",
          "CreatedOn": "2025-01-30T15:53:30.765000+00:00",
          "LastModifiedOn": "2025-01-30T15:53:30.765000+00:00",
          "ExecutionProperty": {
              "MaxConcurrentRuns": 1
          },
          "Command": {
              "Name": "glueetl",
              "ScriptLocation": "s3://s3-keyspaces/scripts/cfn-setup-cfn-glue-export.scala",
              "PythonVersion": "3"
          },
          "DefaultArguments": {
              "--write-shuffle-spills-to-s3": "true",
              "--S3_URI": "s3://s3-keyspaces",
              "--TempDir": "s3://s3-keyspaces/shuffle-space/export-sample/",
              "--extra-jars": "s3://s3-keyspaces/jars/spark-cassandra-connector-assembly_2.12-3.1.0.jar,s3://s3-keyspaces/jars/aws-sigv4-auth-cassandra-java-driver-plugin-4.0.9-shaded.jar,s3://s3-keyspaces/jars/spark-extension_2.12-2.8.0-3.4.jar,s3://s3-keyspaces/jars/amazon-keyspaces-helpers-1.0-SNAPSHOT.jar",
              "--class": "GlueApp",
              "--user-jars-first": "true",
              "--enable-metrics": "true",
              "--enable-spark-ui": "true",
              "--KEYSPACE_NAME": "catalog",
              "--spark-event-logs-path": "s3://s3-keyspaces/spark-logs/",
              "--enable-continuous-cloudwatch-log": "true",
              "--write-shuffle-files-to-s3": "true",
              "--FORMAT": "parquet",
              "--TABLE_NAME": "book_awards",
              "--job-language": "scala",
              "--extra-files": "s3://s3-keyspaces/conf/keyspaces-application.conf",
              "--DRIVER_CONF": "keyspaces-application.conf"
          },
          "MaxRetries": 0,
          "AllocatedCapacity": 4,
          "Timeout": 2880,
          "MaxCapacity": 4.0,
          "WorkerType": "G.2X",
          "NumberOfWorkers": 2,
          "GlueVersion": "3.0"
      }
  }
  ```

Se il processo di CloudFormation stack fallisce, puoi esaminare gli errori relativi allo stack fallito nella console. CloudFormation Puoi rivedere i dettagli del processo di esportazione nella AWS Glue console selezionando i **lavori ETL nel menu a** sinistra.

Dopo aver confermato i dettagli del processo di AWS Glue esportazione, procedi con l'esecuzione del processo per esportare i dati dalla tabella Amazon Keyspaces. [Fase 3: Esegui il AWS Glue processo per esportare la tabella Amazon Keyspaces nel bucket Amazon S3 dal AWS CLI](S3-tutorial-step3.md)