Database sampel - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Database sampel

Bagian ini menjelaskanTICKIT, database contoh yang digunakan contoh dokumentasi Amazon Redshift.

Database kecil ini terdiri dari tujuh tabel: dua tabel fakta dan lima dimensi. Anda dapat memuat TICKIT kumpulan data dengan mengikuti langkah-langkah di Langkah 4: Muat data dari Amazon S3 ke Amazon Redshift di Panduan Memulai Pergeseran Merah Amazon.

Tujuh tabel dalam database TICKIT sampel dan hubungannya satu sama lain.

Aplikasi database sampel ini membantu analis melacak aktivitas penjualan untuk situs TICKIT web fiksi, tempat pengguna membeli dan menjual tiket secara online untuk acara olahraga, pertunjukan, dan konser. Secara khusus, analis dapat mengidentifikasi pergerakan tiket dari waktu ke waktu, tingkat keberhasilan untuk penjual, dan acara, tempat, dan musim terlaris. Analis dapat menggunakan informasi ini untuk memberikan insentif kepada pembeli dan penjual yang sering mengunjungi situs, untuk menarik pengguna baru, dan untuk mendorong iklan dan promosi.

Misalnya, kueri berikut menemukan lima penjual teratas di San Diego, berdasarkan jumlah tiket yang terjual pada tahun 2008:

select sellerid, username, (firstname ||' '|| lastname) as name, city, sum(qtysold) from sales, date, users where sales.sellerid = users.userid and sales.dateid = date.dateid and year = 2008 and city = 'San Diego' group by sellerid, username, name, city order by 5 desc limit 5; sellerid | username | name | city | sum ----------+----------+-------------------+-----------+----- 49977 | JJK84WTE | Julie Hanson | San Diego | 22 19750 | AAS23BDR | Charity Zimmerman | San Diego | 21 29069 | SVL81MEQ | Axel Grant | San Diego | 17 43632 | VAG08HKW | Griffin Dodson | San Diego | 16 36712 | RXT40MKU | Hiram Turner | San Diego | 14 (5 rows)

Database yang digunakan untuk contoh dalam panduan ini berisi kumpulan data kecil; dua tabel fakta masing-masing berisi kurang dari 200.000 baris, dan dimensi berkisar dari 11 baris dalam CATEGORY tabel hingga sekitar 50.000 baris dalam USERS tabel.

Secara khusus, contoh database dalam panduan ini menunjukkan fitur utama dari desain tabel Amazon Redshift:

  • Distribusi data

  • Penyortiran data

  • Kompresi kolumnar

Untuk informasi tentang skema tabel dalam TICKIT database, pilih tab berikut:

CATEGORY table
Nama kolom Jenis data Deskripsi
CATID SMALLINT Kunci primer, nilai ID unik untuk setiap baris. Setiap baris mewakili jenis acara tertentu di mana tiket dibeli dan dijual.
CATGROUP VARCHAR(10) Nama deskriptif untuk sekelompok acara, seperti Shows danSports.
CATNAME VARCHAR(10) Nama deskriptif singkat untuk jenis acara dalam grup, seperti Opera danMusicals.
CATDESC VARCHAR(50) Nama deskriptif yang lebih panjang untuk jenis acara, sepertiMusical theatre.
DATE table
Nama kolom Jenis data Deskripsi
DATEID SMALLINT Kunci primer, nilai ID unik untuk setiap baris. Setiap baris mewakili satu hari dalam tahun kalender.
CALDATE DATE Tanggal kalender, seperti 2008-06-24
DAY CHAR(3) Hari dalam seminggu (bentuk pendek), sepertiSA.
WEEK SMALLINT Nomor minggu, seperti26.
MONTH CHAR(5) Nama bulan (bentuk pendek), sepertiJUN.
QTR CHAR(5) Nomor seperempat (1melalui4).
YEAR SMALLINT Empat digit tahun (2008).
HOLIDAY BOOLEAN Bendera yang menunjukkan apakah hari itu adalah hari libur nasional (AS).
EVENT table
Nama kolom Jenis data Deskripsi
EVENTID INTEGER Kunci primer, nilai ID unik untuk setiap baris. Setiap baris mewakili acara terpisah yang berlangsung di tempat tertentu pada waktu tertentu.
VENUEID SMALLINT Referensi kunci asing ke tabel. VENUE
CATID SMALLINT Referensi kunci asing ke tabel. CATEGORY
DATEID SMALLINT Referensi kunci asing ke tabel. DATE
EVENTNAME VARCHAR(200) Nama acara, seperti Hamlet atauLa Traviata.
STARTTIME TIMESTAMP Tanggal penuh dan waktu mulai untuk acara tersebut, seperti2008-10-10 19:30:00.
VENUE table
Nama kolom Jenis data Deskripsi
VENUEID SMALLINT Kunci primer, nilai ID unik untuk setiap baris. Setiap baris mewakili tempat tertentu di mana acara berlangsung.
VENUENAME VARCHAR(100) Nama tempat yang tepat, sepertiCleveland Browns Stadium.
VENUECITY VARCHAR(30) Nama kota, seperti Cleveland
VENUESTATE CHAR(2) Singkatan dua huruf negara bagian atau provinsi (Amerika Serikat dan Kanada), sepertiOH.
VENUESEATS INTEGER Jumlah maksimum kursi yang tersedia di venue, jika diketahui, seperti73200. Untuk tujuan demonstrasi, kolom ini berisi beberapa nilai nol dan nol.
USERS table
Nama kolom Jenis data Deskripsi
USERID INTEGER Kunci primer, nilai ID unik untuk setiap baris. Setiap baris mewakili pengguna terdaftar (pembeli atau penjual atau keduanya) yang telah mendaftarkan atau membeli tiket untuk setidaknya satu acara.
USERNAME CHAR(8) Nama pengguna alfanumerik 8 karakter, seperti. PGL08LJI
FIRSTNAME VARCHAR(30) Nama depan pengguna, sepertiVictor.
LASTNAME VARCHAR(30) Nama belakang pengguna, sepertiHernandez.
CITY VARCHAR(30) Kota asal pengguna, sepertiNaperville.
STATE CHAR(2) Negara asal pengguna, sepertiGA.
EMAIL VARCHAR(100) Alamat email pengguna; kolom ini berisi nilai-nilai Latin acak, sepertiturpis@accumsanlaoreet.org.
PHONE CHAR(14) Nomor telepon 14 karakter pengguna, seperti(818) 765-4255.
LIKESPORTS, ... BOOLEAN Serangkaian 10 kolom berbeda yang mengidentifikasi suka dan tidak suka true dan false nilai pengguna.
LISTING table
Nama kolom Jenis data Deskripsi
LISTID INTEGER Kunci primer, nilai ID unik untuk setiap baris. Setiap baris mewakili daftar batch tiket untuk acara tertentu.
SELLERID INTEGER Referensi kunci asing ke USERS tabel, mengidentifikasi pengguna yang menjual tiket.
EVENTID INTEGER Referensi kunci asing ke tabel. EVENT
DATEID SMALLINT Referensi kunci asing ke tabel. DATE
NUMTICKETS SMALLINT Jumlah tiket yang tersedia untuk dijual, seperti 2 atau20.
PRICEPERTICKET DECIMAL(8,2) Harga tetap dari tiket individu, seperti 27.00 atau206.00.
TOTALPRICE DECIMAL(8,2) Total harga untuk daftar ini (NUMTICKETS*PRICEPERTICKET).
LISTTIME TIMESTAMP Tanggal dan waktu penuh ketika daftar diposting, seperti2008-03-18 07:19:35.
SALES table
Nama kolom Jenis data Deskripsi
SALESID INTEGER Kunci primer, nilai ID unik untuk setiap baris. Setiap baris mewakili penjualan satu atau lebih tiket untuk acara tertentu, seperti yang ditawarkan dalam daftar tertentu.
LISTID INTEGER Referensi kunci asing ke tabel. LISTING
SELLERID INTEGER Referensi kunci asing ke USERS tabel (pengguna yang menjual tiket).
BUYERID INTEGER Referensi kunci asing ke USERS tabel (pengguna yang membeli tiket).
EVENTID INTEGER Referensi kunci asing ke tabel. EVENT
DATEID SMALLINT Referensi kunci asing ke tabel. DATE
QTYSOLD SMALLINT Jumlah tiket yang terjual, dari 1 ke8. (Maksimal 8 tiket dapat dijual dalam satu transaksi.)
PRICEPAID DECIMAL(8,2) Total harga yang dibayarkan untuk tiket, seperti 75.00 atau488.00. Harga individu tiket adalahPRICEPAID/QTYSOLD.
COMMISSION DECIMAL(8,2) Komisi 15% yang dikumpulkan bisnis dari penjualan, seperti 11.25 atau73.20. Penjual menerima 85% dari PRICEPAID nilainya.
SALETIME TIMESTAMP Tanggal dan waktu penuh ketika penjualan selesai, seperti2008-05-24 06:21:47.