Banco de dados de exemplo - Amazon Redshift

Banco de dados de exemplo

A maioria dos exemplos na documentação do Amazon Redshift usa um banco de dados de amostra chamado TICKIT. Este pequeno banco de dados consiste em sete tabelas: duas tabelas de fatos e cinco dimensões. É possível carregar o conjunto de dados TICKIT seguindo as etapas em Etapa 4: Carregar dados do Amazon S3 para o Amazon Redshift no Guia de conceitos básicos do Amazon Redshift.

Esse aplicativo de banco de dados de exemplo ajuda analistas a acompanhar a atividade de vendas do site fictício TICKIT, onde usuários compram e vendem ingressos online para eventos esportivos, shows e concertos. Especificamente, os analistas podem identificar o movimento dos ingressos ao longo do tempo, as taxas de sucesso para vendedores e os eventos, locais e estações mais bem vendidos. Os analistas podem usar essas informações para fornecer incentivos para compradores e vendedores que frequentam o site, para atrair novos usuários e para promover publicidade e promoções.

Por exemplo, a seguinte consulta localiza os cinco principais vendedores em San Diego com base no número de ingressos vendidos em 2008:

select sellerid, username, (firstname ||' '|| lastname) as name, city, sum(qtysold) from sales, date, users where sales.sellerid = users.userid and sales.dateid = date.dateid and year = 2008 and city = 'San Diego' group by sellerid, username, name, city order by 5 desc limit 5; sellerid | username | name | city | sum ----------+----------+-------------------+-----------+----- 49977 | JJK84WTE | Julie Hanson | San Diego | 22 19750 | AAS23BDR | Charity Zimmerman | San Diego | 21 29069 | SVL81MEQ | Axel Grant | San Diego | 17 43632 | VAG08HKW | Griffin Dodson | San Diego | 16 36712 | RXT40MKU | Hiram Turner | San Diego | 14 (5 rows)

O banco de dados usado para os exemplos neste guia contém um pequeno conjunto de dados; as duas tabelas de fatos contêm menos de 200.000 linhas e as dimensões variam de 11 linhas na tabela CATEGORY a, aproximadamente, 50.000 linhas na tabela USERS.

Especificamente, os exemplos do banco de dados neste guia demonstram os recursos chave do design de tabelas do Amazon Redshift:

  • Distribuição de dados

  • Classificação de dados

  • Compactação de colunas