Benennungsregeln und Datentypen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Benennungsregeln und Datentypen

Kontingent-Terminologien

  • Leseanfragen (RRU): Maß für den Lesedurchsatz, wobei die Anzahl der RRUs pro Leseanforderung der Obergrenze der Größe eines Lesedatensatzes entspricht, aufgeteilt in Blöcke von 4 KB. Die minimale RRU pro Anfrage ist 0.

  • Schreibanforderungseinheit (WRU): Maß für den Schreibdurchsatz, wobei die Anzahl der WRUs pro Schreibanforderung der Obergrenze der Größe des geschriebenen Datensatzes entspricht, aufgeteilt in Blöcke von 1 KB. Die Mindest-WRU pro Anfrage ist 1 (einschließlich Löschoperationen).

Limits und Kontingente

Anmerkung

Weiche Grenzwerte können je nach Bedarf erhöht werden.

  • Maximale Anzahl von Funktionsgruppen pro AWS Konto: Soft-Limit von 100.

  • Maximale Anzahl von Funktionsdefinitionen pro Funktionsgruppe: 2500.

  • Maximale Anzahl von RRU pro Datensatz-ID: 2400 RRU pro Sekunde.

  • Maximale Anzahl von WRU pro Datensatz-ID: 500 WRU pro Sekunde.

  • Max. Lesekapazitätseinheiten (RCU), die für eine einzelne Funktionsgruppe bereitgestellt werden können: 40000 RCU.

  • Max. Schreibkapazitätseinheiten (WCU), die für eine einzelne Featuregruppe bereitgestellt werden können: 40000 WCU.

  • Max. Lesekapazitätseinheiten, die für alle Funktionsgruppen in einer Region bereitgestellt werden können: 80000 RCU.

  • Max. Schreibkapazitätseinheiten, die für alle Funktionsgruppen in einer Region bereitgestellt werden können: 80000 WCU.

  • Maximale Transaktionen pro Sekunde (TPS) pro API pro AWS-Konto: Soft-Limit von 10000 TPS pro API ohne BatchGetRecord API-Aufruf, für den ein Soft-Limit von 500 TPS gilt.

  • Maximale Größe eines Datensatzes: 350 KB.

  • Maximale Größe einer Datensatz-ID: 2 KB.

  • Maximale Größe eines Feature-Werts: 350 KB.

  • Maximale Anzahl gleichzeitiger Workflows zur Erstellung von Feature-Gruppen: 4.

  • BatchGetRecord API: Kann bis zu 100 Datensätze enthalten und bis zu 100 Funktionsgruppen abfragen.

Weitere Informationen zu Service-Kontingenten und zum Anfordern einer Kontingenterhöhung finden Sie unter AWS Service-Quotas.

Benennungsregeln

  • Reservierte Wörter: Die folgenden Wörter sind reserviert und können nicht als Feature-Namen in Feature-Definitionen verwendet werden:is_deleted, write_time und api_invocation_time.

Datentypen

  • Zeichenfolge: Die Zeichenfolgen sind Unicode mit binärer UTF-8-Kodierung. Die Mindestlänge einer Zeichenfolge kann Null sein, die maximale Länge wird durch die maximale Größe eines Datensatzes eingeschränkt.

  • Feature-Typ für Bruchteile: Feature-Werte müssen einer Gleitkommazahl mit doppelter Genauigkeit entsprechen, wie sie im IEEE-754-Standard definiert ist.

  • Integraler Feature-Typ: Feature Store unterstützt Ganzzahlwerte im Bereich einer 64-Bit-Ganzzahl mit Vorzeichen. Minimalwert von -2 63 und Höchstwert: 2 63 – 1.

  • Funktionen zur Ereigniszeit: Alle Feature-Gruppen verfügen über ein Feature zur Ereigniszeit mit einer Genauigkeit im Nanosekundenbereich. Jede Ereigniszeit mit einer Genauigkeit von weniger als Nanosekunden führt zu einer Abwärtsinkompatibilität. Das Feature kann den Feature-Typ String oder Fractional haben.

    • Eine Ereigniszeit als Zeichenfolge wird im Format ISO-8601 in UTC-Zeit akzeptiert und entspricht den folgenden Mustern: [yyyyy-mm-dd't'hh:mm:ssz, yyyy-mm-dd't'hh:mm:ssz, yyyy-mm-dd't'hh:mm:ss.sssssssssz].

    • Ein Bruchteil der Ereigniszeit wird als Sekunden ab der Unix-Epoche akzeptiert. Die Eventzeiten müssen im Bereich von [0000-01-01T 00:00:00.000 000000Z, 9999-12-31T 23:59:59.999 999999Z] liegen. Für Iceberg Feature-Gruppen im Tabellenformat können Sie nur den Typ Zeichenfolge für die Ereigniszeit verwenden.