Einrichtung des Route 53-Zustandschecks für EventBridge globale Endpunkte - Amazon EventBridge

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einrichtung des Route 53-Zustandschecks für EventBridge globale Endpunkte

Wenn Sie globale Endpunkte verwenden, benötigen Sie eine Route-53-Zustandsprüfung, um den Status Ihrer Regionen zu überwachen. Die folgende Vorlage definiert einen CloudWatch Amazon-Alarm und verwendet ihn, um eine Route 53-Zustandsprüfung zu definieren.

AWS CloudFormation Vorlage für die Definition einer Route 53-Zustandsprüfung

Verwenden Sie die folgende Vorlage, um Ihre Route-53-Zustandsprüfung zu definieren.

Description: |- Global endpoints health check that will fail when the average Amazon EventBridge latency is above 30 seconds for a duration of 5 minutes. Note, missing data will cause the health check to fail, so if you only send events intermittently, consider changing the heath check to use a longer evaluation period or instead treat missing data as 'missing' instead of 'breaching'. Metadata: AWS::CloudFormation::Interface: ParameterGroups: - Label: default: "Global endpoint health check alarm configuration" Parameters: - HealthCheckName - HighLatencyAlarmPeriod - MinimumEvaluationPeriod - MinimumThreshold - TreatMissingDataAs ParameterLabels: HealthCheckName: default: Health check name HighLatencyAlarmPeriod: default: High latency alarm period MinimumEvaluationPeriod: default: Minimum evaluation period MinimumThreshold: default: Minimum threshold TreatMissingDataAs: default: Treat missing data as Parameters: HealthCheckName: Description: Name of the health check Type: String Default: LatencyFailuresHealthCheck HighLatencyAlarmPeriod: Description: The period, in seconds, over which the statistic is applied. Valid values are 10, 30, 60, and any multiple of 60. MinValue: 10 Type: Number Default: 60 MinimumEvaluationPeriod: Description: The number of periods over which data is compared to the specified threshold. You must have at least one evaluation period. MinValue: 1 Type: Number Default: 5 MinimumThreshold: Description: The value to compare with the specified statistic. Type: Number Default: 30000 TreatMissingDataAs: Description: Sets how this alarm is to handle missing data points. Type: String AllowedValues: - breaching - notBreaching - ignore - missing Default: breaching Mappings: "InsufficientDataMap": "missing": "HCConfig": "LastKnownStatus" "breaching": "HCConfig": "Unhealthy" Resources: HighLatencyAlarm: Type: AWS::CloudWatch::Alarm Properties: AlarmDescription: High Latency in Amazon EventBridge MetricName: IngestionToInvocationStartLatency Namespace: AWS/Events Statistic: Average Period: !Ref HighLatencyAlarmPeriod EvaluationPeriods: !Ref MinimumEvaluationPeriod Threshold: !Ref MinimumThreshold ComparisonOperator: GreaterThanThreshold TreatMissingData: !Ref TreatMissingDataAs LatencyHealthCheck: Type: AWS::Route53::HealthCheck Properties: HealthCheckTags: - Key: Name Value: !Ref HealthCheckName HealthCheckConfig: Type: CLOUDWATCH_METRIC AlarmIdentifier: Name: Ref: HighLatencyAlarm Region: !Ref AWS::Region InsufficientDataHealthStatus: !FindInMap [InsufficientDataMap, !Ref TreatMissingDataAs, HCConfig] Outputs: HealthCheckId: Description: The identifier that Amazon Route 53 assigned to the health check when you created it. Value: !GetAtt LatencyHealthCheck.HealthCheckId

Das Ereignis IDs kann sich von Anruf zu API Anruf ändern. Für die Korrelation von Ereignissen in verschiedenen Regionen benötigen Sie daher eine unveränderliche, eindeutige Kennung. Konsumenten sollten auch im Hinblick auf Idempotenz konzipiert werden. Wenn Sie Ereignisse replizieren oder sie aus Archiven wiederholen, gibt es auf diese Weise keine Nebeneffekte, wenn die Ereignisse in beiden Regionen verarbeitet werden.

CloudWatch Eigenschaften der Alarmvorlage

Anmerkung

Berücksichtigen Sie bei allen editable-Feldern Ihren Durchsatz pro Sekunde. Wenn Sie Ereignisse nur sporadisch versenden, sollten Sie erwägen, die Zustandsprüfung so zu ändern, dass ein längerer Auswertungszeitraum verwendet wird, oder fehlende Daten als missing und nicht breaching zu behandeln.

Die folgenden Eigenschaften werden im CloudWatch Alarm-Bereich der Vorlage verwendet:

Metrik Beschreibung

AlarmDescription

Die Beschreibung des Alarms.

Standard: High Latency in Amazon EventBridge

MetricName

Der Name der dem Alarm zugehörigen Metrik. Dies ist für einen Alarm auf der Grundlage einer Metrik erforderlich. Für einen Alarm auf der Grundlage eines mathematischen Ausdrucks verwenden Sie stattdessen Metrics und Sie können MetricName nicht angeben.

Standard: IngestionToInvocationStartLatency

Namespace

Der Namespace der Metrik, die dem Alarm zugeordnet ist. Dies ist für einen Alarm auf der Grundlage einer Metrik erforderlich. Für einen Alarm auf der Grundlage eines mathematischen Ausdrucks können Sie Namespace nicht angeben. Verwenden Sie stattdessen Metrics.

Standard: AWS/Events

Statistic

Die Statistik für die Metrik, die mit dem Alarm verbunden ist, außer Perzentil.

Standard: Average

Period

Der Zeitraum in Sekunden, in dem die Statistik angewendet wird. Dies ist für einen Alarm auf der Grundlage einer Metrik erforderlich. Gültige Werte sind 10, 30, 60 und jedes Vielfache von 60.

Standard: 60

EvaluationPeriods

Die Anzahl der Zeiträume, über die Daten mit dem angegebenen Schwellenwert verglichen werden. Wenn Sie einen Alarm einstellen, der erfordert, dass mehrere aufeinander folgende Datenpunkte verletzt werden, um den Alarm auszulösen, gibt dieser Wert diese Zahl an. Wenn Sie einen „M out of N“-Alarm einstellen, ist dieser Wert das N und DatapointsToAlarm das M.

Standard: 5

Threshold

Der Wert für den Vergleich mit der angegebenen Statistik.

Standard: 30,000

ComparisonOperator

Die arithmetische Operation, die beim Vergleichen der angegebenen Statistik und des Schwellenwerts zu verwenden ist. Der angegebene Statistikwert wird als erster Operand verwendet.

Standard: GreaterThanThreshold

TreatMissingData

Legt fest, wie dieser Alarm fehlende Datenpunkte behandeln soll.

Gültige Werte: breaching, notBreaching, ignore und missing

Standard: breaching

Eigenschaften der Vorlage für eine Route-53-Zustandsprüfung

Anmerkung

Berücksichtigen Sie bei allen editable-Feldern Ihren Durchsatz pro Sekunde. Wenn Sie Ereignisse nur sporadisch versenden, sollten Sie erwägen, die Zustandsprüfung so zu ändern, dass ein längerer Auswertungszeitraum verwendet wird, oder fehlende Daten als missing und nicht breaching zu behandeln.

Die folgenden Eigenschaften werden im Abschnitt Route-53-Zustandsprüfung der Vorlage verwendet:

Metrik Beschreibung

HealthCheckName

Die Bezeichnung der Zustandsprüfung.

Standard: LatencyFailuresHealthCheck

InsufficientDataHealthStatus

Wenn nicht CloudWatch genügend Daten zur Metrik vorliegen, um den Alarmstatus zu bestimmen, den Status, den Amazon Route 53 der Zustandsprüfung zuweisen soll

Zulässige Werte:

  • Healthy: Route 53 betrachtet die Zustandsprüfung als fehlerfrei.

  • Unhealthy: Route 53 betrachtet die Zustandsprüfung als fehlerhaft.

  • LastKnownStatus: Route 53 verwendet den Status der Zustandsprüfung von der letzten Zeit, bei der genügend CloudWatch Daten vorlagen, um den Alarmstatus zu bestimmen. Bei neuen Zustandsprüfungen, die keinen letzten bekannten Status haben, ist der Standardstatus für die Zustandsprüfung „fehlerfrei“.

Standard: Unhealthy

Anmerkung

Dieses Feld wird auf der Grundlage der Eingabe in das TreatMissingData-Feld aktualisiert. Wenn TreatingMissingData auf Missing gesetzt ist, wird es auf LastKnownStatus aktualisiert. Wenn TreatingMissingData auf Breaching gesetzt ist, wird es auf Unhealthy aktualisiert.