COST09-BP02 Mettre en œuvre une mémoire tampon ou une limitation pour gérer la demande
La mise en mémoire tampon et la limitation modifient la charge de travail en atténuant les pics éventuels. Mettez en œuvre une limitation lorsque vos clients effectuent de nouveaux essais. Mettez en œuvre une mémoire tampon pour stocker la demande et reporter le traitement. Veillez à ce que vos limitations et mémoires tampon soient conçues de manière à ce que les clients reçoivent une réponse dans les délais requis.
Niveau de risque exposé si cette bonne pratique n'est pas établie: moyen
Directives d'implémentation
Dans le cloud computing, la mise en place d'une réserve ou d'une limitation est cruciale pour gérer la demande et réduire la capacité allouée requise pour votre charge de travail. Pour des performances optimales, il est essentiel d'évaluer la demande totale, y compris les pics, le taux de variation des demandes et le temps de réponse nécessaire. Lorsque les clients ont la possibilité de renvoyer leurs demandes, il devient pratique d'appliquer la limitation. À l'inverse, pour les clients qui ne disposent pas de fonctionnalités de nouvelle tentative, l'approche idéale consiste à mettre en œuvre une mémoire tampon. Ces mémoires tampons rationalisent l'afflux de demandes et optimisent l'interaction des applications avec des vitesses opérationnelles variées.

Courbe de demande avec deux pics distincts qui nécessitent un provisionnement de capacité élevé
Prenons l'exemple d'une charge de travail dont la courbe de demande est représentée dans l'image précédente. Cette charge de travail a deux pics, et pour gérer ces pics, la capacité des ressources comme indiqué par la ligne orange est provisionnée. Les ressources et l'énergie utilisées pour cette charge de travail ne sont pas indiquées par la zone sous la courbe de la demande, mais par la zone sous la ligne de la capacité provisionnée, car cette dernière est nécessaire pour gérer ces deux pics. L'aplanissement de la courbe de demande de la charge de travail peut vous aider à réduire la capacité provisionnée pour une charge de travail et à réduire son impact environnemental. Pour atténuer le pic, envisagez de mettre en œuvre une limitation ou une mise en mémoire tampon.
Pour mieux les comprendre, examinons les notions de limitation et de mise en mémoire tampon.
Limitation : si la source de la demande peut exécuter de nouvelles tentatives, vous pouvez mettre en place une limitation. La limitation indique à la source qu'elle doit réessayer ultérieurement si elle ne peut répondre à la demande actuellement. La source attend un certain temps, puis relance la demande. L'implémentation de la limitation a l'avantage de limiter la quantité maximale de ressources et les coûts maximaux de la charge de travail. Dans AWS, vous pouvez utiliser l'Amazon API Gateway
Mémoire tampon : une mémoire tampon utilise des producteurs (composants qui envoient des messages à la file d'attente), des consommateurs (composants qui reçoivent des messages de la file d'attente) et une file d'attente (qui contient des messages) pour stocker les messages. Les messages sont lus par les consommateurs et traités, ce qui permet aux messages de fonctionner au rythme qui répond aux besoins des entreprises. À l'aide d'une mémoire tampon, les messages des producteurs sont hébergés dans des files d'attente ou des flux, prêts à être consultés par les consommateurs en fonction de leurs besoins opérationnels.
Dans AWS, vous pouvez choisir parmi plusieurs services pour mettre en place une mémoire tampon. Amazon Simple Queue Service(Amazon SQS)
La mise en mémoire tampon et la limitation peuvent atténuer les pics éventuels en modifiant la sollicitation de votre charge de travail. Utilisez la limitation lorsque les clients retentent des actions, et la mise en mémoire tampon pour conserver la demande et la traiter ultérieurement. Si vous utilisez une mise en mémoire tampon, créez votre charge de travail de manière à ce qu'elle réponde à la demande dans les délais requis et assurez-vous que vous êtes en mesure de traiter les demandes de travail en double. Analysez la demande globale, le taux de variation et le temps de réponse requis pour dimensionner correctement la limitation ou le tampon nécessaire.
Étapes d'implémentation
-
Analyser les besoins du client : analysez les demandes du client pour déterminer s'il peut effectuer de nouvelles tentatives. S'il ne le peut pas, des mémoires tampon doivent être mises en œuvre. Analysez la demande globale, le taux de variation et le temps de réponse requis pour déterminer la taille de limitation ou de mémoire tampon nécessaire.
-
Mettre en place une mémoire tampon ou une limitation : mettez en place une mémoire tampon ou une limitation dans la charge de travail. Une file d'attente comme Amazon Simple Queue Service (Amazon SQS) peut fournir une mémoire tampon à vos composants de charge de travail. Amazon API Gateway peut fournir une limitation pour vos composants de charge de travail.
Ressources
Bonnes pratiques associées :
Documents connexes :
Vidéos connexes :
Exemples connexes :