Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
AWS Glue es un servicio de extracción, transformación y carga (ETL) totalmente gestionado que le permite crear una base de datos a partir de sus datos de Amazon S3 y consultarla mediante Athena. Esta base de datos también se denomina catálogo de AWS Glue datos. Un AWS Glue rastreador puede detectar automáticamente el esquema de sus datos de Amazon S3 y crear la base de datos y las tablas correspondientes. AppStream La versión 2.0 proporciona una AWS CloudFormation plantilla que puede utilizar para crear los AWS Glue recursos necesarios.
importante
Al completar los pasos del siguiente procedimiento, se crea un AWS Glue rastreador. Sin embargo, estos pasos no inician el rastreador. Para iniciar el rastreador, debe realizar los pasos que se indican en el siguiente procedimiento. Para obtener más información sobre AWS Glue los rastreadores, consulte Definición de rastreadores.
Para crear un rastreador AWS Glue
Abra la consola AppStream 2.0 en https://console.aws.amazon.com/appstream2.
Elija la AWS región para la que se ha suscrito a los informes de uso.
En el panel de navegación, seleccione Usage Reports (Informes de uso) y compruebe que el registro de informes de uso está habilitado.
En la pestaña Detalles del informe, en el párrafo situado junto a Analytics, selecciona el enlace de la CloudFormationplantilla.
Al seleccionar el enlace, se abre la AWS CloudFormation consola, donde puede revisar los parámetros de la AWS CloudFormation pila especificada por la plantilla antes de ejecutarla. La plantilla, cuando se ejecuta, crea un AWS Glue rastreador y varios ejemplos de consultas de Athena.
En la página Especificar detalles, junto a ScheduleExpression, mantenga el valor predeterminado o especifique un valor de expresión cron diferente para la frecuencia con la que desee ejecutar el rastreador. No cambie ningún otro valor predeterminado. Cuando haya terminado, elija Siguiente.
De forma predeterminada, el rastreador está programado para ejecutarse una vez al día, pero puede configurarlo para que se ejecute cada semana, cada mes o con otra frecuencia. Para obtener información acerca de la sintaxis cron, consulte Expresiones Cron.
En la página Options (Opciones), mantenga todos los valores predeterminados y seleccione Next(Siguiente).
En la página de revisión, seleccione la casilla de verificación situada junto a «Reconozco que AWS CloudFormation podría crear recursos de IAM con nombres personalizados» y, a continuación, seleccione Crear.
Debe tener suficientes AWS Glue permisos AWS Identity and Access Management (de IAM) para crear y ejecutar la AWS CloudFormation pila. Si no tiene los permisos necesarios, pida al administrador de su cuenta de Amazon Web Services que realice estos pasos en su cuenta o que le conceda los siguientes permisos.
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "athena:CreateNamedQuery", "athena:BatchGetNamedQuery", "athena:GetNamedQuery", "athena:StartQueryExecution", "athena:GetQueryResults", "athena:GetQueryExecution", "athena:ListNamedQueries", "cloudformation:DescribeStacks", "cloudformation:GetStackPolicy", "cloudformation:DescribeStackEvents", "cloudformation:CreateStack", "cloudformation:GetTemplate", "cloudformation:ListChangeSets", "cloudformation:ListStackResources", "iam:GetRole", "iam:CreateRole", "iam:GetRolePolicy", "s3:GetBucketLocation", "s3:ListBucketMultipartUploads", "s3:ListBucket", "s3:ListMultipartUploadParts", "s3:PutObject", "s3:GetObject", "s3:AbortMultipartUpload" ], "Resource": [ "arn:aws:iam::*:role/AppStreamUsageReports-AppStreamUsageReportGlueRole*", "arn:aws:cloudformation:*:*:stack/AppStreamUsageReports/*", "arn:aws:athena:*:*:workgroup/primary", "arn:aws:s3:::aws-athena-query-results-*" ] }, { "Effect": "Allow", "Action": [ "iam:AttachRolePolicy", "iam:PutRolePolicy", "s3:GetObject", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::appstream-logs-*", "arn:aws:iam::*:role/AppStreamUsageReports-AppStreamUsageReportGlueRole*" ] }, { "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": [ "arn:aws:iam::*:role/AppStreamUsageReports-AppStreamUsageReportGlueRole*" ], "Condition": { "StringEquals": { "iam:PassedToService": "glue.amazonaws.com" } } }, { "Effect": "Allow", "Action": [ "cloudformation:GetTemplateSummary", "glue:GetResourcePolicy", "glue:GetCrawlers", "glue:BatchGetCrawlers", "glue:GetClassifiers", "glue:CreateClassifier", "glue:ListCrawlers", "glue:GetTags", "glue:GetCrawlerMetrics", "glue:GetClassifier", "tag:GetResources" ], "Resource": "*" }, { "Effect": "Allow", "Action": "athena:RunQuery", "Resource": "arn:aws:athena:*:*:workgroup/primary" }, { "Effect": "Allow", "Action": [ "glue:GetTables", "glue:GetPartitions", "glue:GetTable" ], "Resource": [ "arn:aws:glue:*:*:table/appstream-usage/*", "arn:aws:glue:*:*:database/appstream-usage", "arn:aws:glue:*:*:catalog" ] }, { "Effect": "Allow", "Action": [ "glue:GetDatabase", "glue:CreateDatabase", "glue:GetDatabases" ], "Resource": [ "arn:aws:glue:*:*:database/appstream-usage", "arn:aws:glue:*:*:catalog" ] }, { "Effect": "Allow", "Action": [ "glue:GetCrawler", "glue:StartCrawler", "glue:CreateCrawler" ], "Resource": "arn:aws:glue:*:*:crawler/appstream-usage*" }, { "Effect": "Allow", "Action": "glue:GetCatalogImportStatus", "Resource": "arn:aws:glue:*:*:catalog" } ] }