Lambda-Kontingente - AWS Lambda

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Lambda-Kontingente

AWS Lambda ist so konzipiert, dass es schnell skaliert werden kann, um den Bedarf zu decken, sodass Ihre Funktionen skaliert werden können, um den Datenverkehr in Ihrer Anwendung zu bedienen. Lambda wurde für kurzlebige Rechenaufgaben entwickelt, die den Status zwischen Aufrufen nicht beibehalten oder sich nicht darauf verlassen. Code kann in einem einzigen Aufruf bis zu 15 Minuten lang ausgeführt werden und eine einzelne Funktion kann bis zu 10 240 MB Speicher beanspruchen.

Es ist wichtig, die Schutzmaßnahmen zu verstehen, die zum Schutz Ihres Kontos und der Workloads anderer Kunden eingerichtet wurden. Servicekontingenten sind für alle AWS Dienste verfügbar und bestehen aus festen Grenzwerten, die Sie nicht ändern können, und weichen Grenzwerten, für die Sie Erhöhungen beantragen können. Standardmäßig wird allen neuen Konten ein Kontingentprofil zugewiesen, das die Erkundung von AWS Diensten ermöglicht.

Um die Kontingente zu sehen, die für Ihr Konto gelten, navigieren Sie zum Service-Quotas-Dashboard. Hier können Sie Ihre Dienstkontingente einsehen, eine Kontingenterhöhung beantragen und die aktuelle Auslastung einsehen. Von hier aus können Sie zu einem bestimmten AWS Dienst wie Lambda aufschlüsseln:

Anwendungsdesign, Abbildung 1
Wichtig

Neue AWS-Konten haben die Parallelität und die Speicherkontingente reduziert. AWS erhöht diese Kontingente automatisch auf der Grundlage Ihrer Nutzung.

In den folgenden Abschnitten sind Standardkontingente und Grenzwerte in Lambda nach Kategorien aufgeführt.

Datenverarbeitung und Speicherung

Lambda legt Kontingente für die Menge an Datenverarbeitung und Speicherressourcen, die Sie verwenden können, um Funktionen auszuführen und zu speichern. Kontingente für gleichzeitige Ausführungen und Speicherung gelten pro AWS-Region. Die Kontingente für Elastic Network Interface (ENI) gelten für jede virtuelle private Cloud (VPC), unabhängig von der Region. Die folgenden Kontingente können gegenüber ihren Standardwerten erhöht werden. Weitere Informationen finden Sie unter Beantragen einer Kontingenterhöhung im Service-Quotas-Benutzerhandbuch.

Ressource Standardkontingent Kann erhöht werden bis zu

Gleichzeitige Ausführungen

1.000

Zehntausende

Speicher für hochgeladene Funktionen (.zip-Datei-Archive) und Ebenen. Jede Funktionsversion und Ebenenversion verbraucht Speicher.

Bewährte Methoden für die Verwaltung Ihres Codespeichers finden Sie bei Serverless Land unter Monitoring Lambda code storage.

75 GB

Terabytes

Speicher für als Container-Images definierten Funktionen Diese Bilder werden bei Amazon gespeichertECR.

Weitere Informationen finden Sie unter Amazon ECR Service-Kontingente.

Elastische Netzwerkschnittstellen pro virtueller privater Cloud (VPC)

Anmerkung

Dieses Kontingent wird mit anderen Diensten wie Amazon Elastic File System (AmazonEFS) geteilt. Siehe VPCAmazon-Kontingente.

500

Tausende

Weitere Details zur Gleichzeitigkeit und zur datenverkehrbasierten Skalierung der Funktionsgleichzeitigkeit von Lambda finden Sie unter Verstehen der Skalierung von Lambda-Funktionen.

Funktionskonfiguration, -bereitstellung und -ausführung

Die folgenden Kontingente gelten für die Konfiguration, Bereitstellung und Ausführung von Funktionen. Sofern nicht anders angegeben, können sie nicht geändert werden.

Anmerkung

Die Lambda-Dokumentation, die Protokollmeldungen und die Konsole verwenden die Abkürzung MB (anstelle von MiB), um auf 1 024 KB zu verweisen.

Ressource Quota

Funktion Speicherzuweisung

128 MB bis 10.240 MB (in Schritten von 1 MB).

Hinweis: Lambda weist CPU Strom proportional zur konfigurierten Speichermenge zu. Mit der Einstellung Speicher (MB) können Sie den Speicher und die CPU Leistung, die Ihrer Funktion zugewiesen sind, erhöhen oder verringern. Bei 1.769 MB entspricht eine Funktion einem V. CPU

Funktion Zeitüberschreitung

900 Sekunden (15 Minuten)

Funktion Umgebungsvariablen

4 KB, für alle Umgebungsvariablen, die mit der Funktion verknüpft sind, im Aggregat

Funktion ressourcenbasierte Richtlinie

20 KB

Funktionsebenen

Fünf Ebenen

Funktion – Limit für Gleichzeitigkeitsskalierung

Für jede Funktion 1 000 Ausführungsumgebungen alle 10 Sekunden

Aufrufnutzlast (Anfrage und Antwort)

Jeweils 6 MB für Anfrage und Antwort (synchron)

20 MB für jede gestreamte Antwort (synchron). Die Payload-Größe für gestreamte Antworten kann gegenüber den Standardwerten erhöht werden. Wenden Sie sich an Support , um weitere Informationen zu erhalten.)

256 KB (asynchron)

1 MB für die kombinierte Gesamtgröße von Anforderungszeile und Kopfdaten

Bandbreite für gestreamte Antworten

Unbegrenzt für die ersten 6 MB der Antwort Ihrer Funktion

Für Antworten, die größer als 6 MB sind, 2 MBps für den Rest der Antwort

Größe des Bereitstellungspakets (ZIP-Dateiarchiv)

50 MB (gezippt, wenn über Lambda hochgeladen API oderSDKs). Laden Sie größere Dateien mit Amazon S3 hoch.

50 MB (beim Hochladen über die Lambda-Konsole)

250 MB Die maximale Größe des Inhalts eines Bereitstellungspakets, einschließlich Ebenen und benutzerdefinierter Laufzeiten. (ungezippt)

Größe der Container-Image-Einstellungen

16 KB

Codepaketgröße des Container-Images

10 GB (maximale unkomprimierte Image-Größe, einschließlich aller Ebenen)

Testereignisse (Konsoleneditor)

10

/tmp-Verzeichnisspeicher

Zwischen 512 MB und 10 240 MB, in 1-MB-Schritten.

Dateibeschreibungen

1,024

Ausführungsprozesse/-Threads

1,024

Lambda-Anfragen API

Die folgenden Kontingente sind mit API Lambda-Anfragen verknüpft.

Ressource Kontingent

Aufrufanfragen pro Funktion pro Region (synchron)

Jede Instance Ihrer Ausführungsumgebung kann bis zu 10 Anfragen pro Sekunde bearbeiten. Mit anderen Worten, das Gesamtaufruflimit beträgt das 10-fache Ihres Gleichzeitigkeitslimits. Siehe Verstehen der Skalierung von Lambda-Funktionen.

Aufrufanfragen pro Funktion pro Region (asynchron)

Jede Instance Ihrer Ausführungsumgebung kann eine unbegrenzte Anzahl an Anfragen bearbeiten. Mit anderen Worten, das Gesamtlimit für Aufrufe basiert nur auf der für Ihre Funktion verfügbaren Gleichzeitigkeit. Siehe Verstehen der Skalierung von Lambda-Funktionen.

Aufrufanforderungen pro Funktionsversion oder Alias (Anfragen pro Sekunde)

10 x zugewiesene Provisioned Concurrency

Anmerkung

Dieses Kontingent gilt nur für Funktionen, die Provisioned Concurrency verwenden.

GetFunctionAPIAnfragen

100 Anforderungen pro Sekunde. Kann nicht erhöht werden.

GetPolicyAPIAnfragen

15 Anforderungen pro Sekunde. Kann nicht erhöht werden.

Restliche API Anfragen auf der Kontrollebene (ohne Aufruf und GetFunction GetPolicy Anfragen)

Insgesamt 15 Anfragen pro Sekunde APIs (nicht 15 Anfragen pro Sekunde pro Sekunde proAPI). Kann nicht erhöht werden.

Sonstige Services

Kontingente für andere Dienste wie AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda @Edge) und Amazon Virtual Private Cloud (AmazonVPC) können sich auf Ihre Lambda-Funktionen auswirken. Weitere Informationen finden Sie unter AWS-Service -Kontingent im Allgemeine Amazon Web Services-Referenz und Lambda mit Ereignissen aus anderen Diensten aufrufen AWS.

Viele Anwendungen, die Lambda beinhalten, verwenden mehrere AWS Dienste. Da verschiedene Dienste unterschiedliche Kontingente für verschiedene Funktionen haben, kann es schwierig sein, diese Kontingente für Ihre gesamte Anwendung zu verwalten. Beispielsweise hat API Gateway ein Standard-Throttle-Limit von 10.000 Anfragen pro Sekunde, wohingegen Lambda ein Standard-Concurrency-Limit von 1.000 hat. Aufgrund dieser Diskrepanz ist es möglich, dass mehr eingehende Anfragen von API Gateway eingehen, die Lambda bearbeiten kann. Sie können dieses Problem lösen, indem Sie eine Erhöhung des Lambda-Parallelitätslimits beantragen, um dem erwarteten Verkehrsaufkommen zu entsprechen.

Durch Auslastungstests können Sie die Leistung Ihrer Anwendung überwachen, end-to-end bevor Sie sie in der Produktion einsetzen. Während eines Lasttests können Sie alle Kontingente ermitteln, die einen begrenzenden Faktor für das erwartete Verkehrsaufkommen darstellen und entsprechende Maßnahmen ergreifen.