ARARket et di Raw - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

ARARket et di Raw

Il layer di dati grezzi contiene dati inseriti che non sono stati trasformati ed è nel formato di file originale (ad esempio, JSON o CSV). Questi dati sono in genere organizzati in base alla fonte di dati e alla data in cui sono stati inseriti nel bucket Amazon Simple Storage Service (Amazon S3) del bucket Amazon Simple Storage Service (Amazon S3) del livello di dati grezzi.

La tabella seguente fornisce la struttura dei nomi, una descrizione della struttura di denominazione e un esempio di nome per il bucket S3 nel layer di dati grezzi.

Formato di denominazione Esempio
s3://companyname-raw-awsregion-awsaccount|uniqid-env/source/source_region/table/year=yyyy/month=mm/day=dd/table_<yearmonthday>.avro|csv

  • companyname— Il nome dell'organizzazione (opzionale).

  • awsregion— IlRegione AWS (ad esempious-east-1, osa-east-1).

  • awsaccount|uniqid— L'identificatore univoco o l'IDAWS dell'account.

  • env— L'ambiente di distribuzione (ad esempiodev,test, oprod).

  • source— La fonte o il contenuto (ad esempio, database MySQL, e-commerce o SAP).

  • source_region— Ad esempio,us oasia.

  • tabletb_customertb_transactions, otb_products.

s3://anycompany-raw-useast1-12345-dev/socialmedia/us/tb_products/year=2021/month=03/day=01/products_20210301.csv