Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Sie können dynamische Partitionierung auf aggregierte Daten anwenden (z. B. mehrere Ereignisse, Protokolle oder Datensätze, die zu einem einzigen PutRecord
PutRecordBatch
API Aufruf zusammengefasst wurden), aber diese Daten müssen zuerst deaggregiert werden. Sie können Ihre Daten deaggregieren, indem Sie die Deaggregation mehrerer Datensätze aktivieren. Dabei werden die Datensätze im Firehose-Stream analysiert und getrennt.
Die Deaggregation mehrerer Datensätze kann entweder JSON
vom Typ Typ sein, was bedeutet, dass die Trennung von Datensätzen auf aufeinanderfolgenden Objekten basiert. JSON Die Deaggregation kann auch vom Typ seinDelimited
, was bedeutet, dass die Trennung von Datensätzen auf der Grundlage eines angegebenen benutzerdefinierten Trennzeichens erfolgt. Bei diesem benutzerdefinierten Trennzeichen muss es sich um eine Base-64-kodierte Zeichenfolge handeln. Wenn Sie beispielsweise die folgende Zeichenfolge als benutzerdefiniertes Trennzeichen verwenden möchten####
, müssen Sie sie im Base-64-kodierten Format angeben, was sie übersetzt. IyMjIw==
Die Deaggregation von Datensätzen nach JSON oder nach Trennzeichen ist auf 500 pro Datensatz begrenzt.
Anmerkung
Achten Sie beim Deaggregieren von JSON Datensätzen darauf, dass Ihre Eingabe weiterhin im unterstützten Format dargestellt wird. JSON JSONObjekte dürfen sich in einer einzigen Zeile ohne Trennzeichen oder nur mit Zeilenumbruch () befinden. JSONL Ein Array von JSON Objekten ist keine gültige Eingabe.
Dies sind Beispiele für korrekte Eingaben: {"a":1}{"a":2} and {"a":1}\n{"a":2}
Dies ist ein Beispiel für die falsche Eingabe: [{"a":1}, {"a":2}]
Wenn Sie bei aggregierten Daten die dynamische Partitionierung aktivieren, analysiert Firehose die Datensätze und sucht in jedem API Aufruf entweder nach gültigen JSON Objekten oder nach getrennten Datensätzen, basierend auf dem angegebenen Deaggregationstyp für mehrere Datensätze.
Wichtig
Wenn Ihre Daten aggregiert sind, kann die dynamische Partitionierung nur angewendet werden, wenn Ihre Daten zuerst deaggregiert wurden.
Wichtig
Wenn Sie die Datentransformationsfunktion in Firehose verwenden, wird die Deaggregation vor der Datentransformation angewendet. Daten, die in Firehose eingehen, werden in der folgenden Reihenfolge verarbeitet: Deaggregation → Datentransformation via Lambda → Partitioning Keys.