Base de datos de muestra - Amazon Redshift

Base de datos de muestra

En la mayoría de los ejemplos de la documentación de Amazon Redshift, se usa una base de datos de muestra denominada TICKIT. Esa base de datos pequeña consta de siete tablas: dos de hechos y cinco de dimensiones. Puede cargar el conjunto de datos de TICKIT si sigue los pasos que se indican en Paso 4: Cargar datos desde Amazon S3 a Amazon Redshift en la Guía de introducción a Amazon Redshift.

Esta aplicación de base de datos de muestra ayuda a los analistas a realizar un seguimiento de la actividad de ventas del sitio web ficticio TICKIT, en el que los usuarios compran y venden en línea tickets para eventos deportivos, espectáculos y conciertos. En particular, los analistas pueden identificar los movimientos de tickets en el tiempo, las tasas de éxito de los vendedores y los eventos, lugares y temporadas más vendidos. Los analistas pueden usar esta información para ofrecer incentivos a los compradores y vendedores que frecuentan el sitio, a fin de atraer a nuevos usuarios e impulsar la publicidad y las promociones.

Por ejemplo, la siguiente consulta encuentra los cinco vendedores principales de San Diego, en función de la cantidad de tickets vendidos en 2008:

select sellerid, username, (firstname ||' '|| lastname) as name, city, sum(qtysold) from sales, date, users where sales.sellerid = users.userid and sales.dateid = date.dateid and year = 2008 and city = 'San Diego' group by sellerid, username, name, city order by 5 desc limit 5; sellerid | username | name | city | sum ----------+----------+-------------------+-----------+----- 49977 | JJK84WTE | Julie Hanson | San Diego | 22 19750 | AAS23BDR | Charity Zimmerman | San Diego | 21 29069 | SVL81MEQ | Axel Grant | San Diego | 17 43632 | VAG08HKW | Griffin Dodson | San Diego | 16 36712 | RXT40MKU | Hiram Turner | San Diego | 14 (5 rows)

La base de datos usada para los ejemplos de esta guía presenta un conjunto de datos pequeño; cada una de las dos tablas de hechos tiene menos de 200 000 filas y las dimensiones varían, de 11 filas en la tabla CATEGORY hasta, aproximadamente, 50 000 en la tabla USERS.

En particular, los ejemplos de base de datos de esta guía demuestran las características clave del diseño de tablas de Amazon Redshift:

  • Distribución de datos

  • Orden de datos

  • Compresión en columnas