RegExFormat Data - AWS Data Pipeline

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

RegExFormat Data

Format data kustom yang didefinisikan oleh ekspresi reguler.

Contoh

Berikut adalah contoh dari jenis objek ini.

{ "id" : "MyInputDataType", "type" : "RegEx", "inputRegEx" : "([^ ]*) ([^ ]*) ([^ ]*) (-|\\[[^\\]]*\\]) ([^ \"]*|\"[^\"]*\") (-|[0-9]*) (-|[0-9]*)(?: ([^ \"]*|\"[^\"]*\") ([^ \"]*|\"[^\"]*\"))?", "outputFormat" : "%1$s %2$s %3$s %4$s %5$s %6$s %7$s %8$s %9$s", "column" : [ "host STRING", "identity STRING", "user STRING", "time STRING", "request STRING", "status STRING", "size STRING", "referer STRING", "agent STRING" ] }

Sintaksis

Bidang Opsional Deskripsi Jenis Slot
kolom Nama kolom dengan jenis data yang ditentukan oleh masing-masing bidang untuk data yang dijelaskan oleh simpul data ini. Contoh: hostname STRING Untuk beberapa nilai, menggunakan nama kolom dan tipe data yang dipisahkan oleh spasi. String
inputRegEx Ekspresi reguler untuk mengurai file input S3. inputRegExmenyediakan cara untuk mengambil kolom dari data yang relatif tidak terstruktur dalam file. String
outputFormat Kolom kolom diambil olehinputRegEx, tetapi direferensikan sebagai %1$s %2$s menggunakan sintaks format Java. String
induk Induk dari objek saat ini dari mana slot akan diwariskan. Objek Referensi, misalnya “parent”: {"ref”:”myBaseObjectId "}

Bidang Runtime Deskripsi Jenis Slot
@version Versi alur objek dibuat dengan. String

Bidang Sistem Deskripsi Jenis Slot
@error Galat mendeskripsikan obyek yang tidak terbentuk String
@pipelineId Id dari alur tempat objek ini berada String
@sphere Lingkup dari sebuah objek menunjukkan tempatnya dalam siklus hidup: Component Objects memunculkan Instance Objects yang mengeksekusi Attempt Objects String