Monitora e analizza CloudWatch collettivamente le applicazioni con Application Insights Esecuzione dell'analisi dei log con CloudWatch Logs Insights Esecuzione dell'analisi dei log con Amazon OpenSearch Service

Ricerca e analisi dei log in CloudWatch

Dopo aver acquisito i log e le metriche in un formato e in una posizione coerenti, puoi cercarli e analizzarli per migliorare l'efficienza operativa, oltre a identificare e risolvere i problemi. Ti consigliamo di acquisire i log in un formato ben formato (ad esempio, JSON) per semplificare la ricerca e l'analisi dei log. La maggior parte dei carichi di lavoro utilizza una raccolta di AWS risorse come rete, elaborazione, archiviazione e database. Ove possibile, dovresti analizzare collettivamente le metriche e i log di queste risorse e correlarli per monitorare e gestire efficacemente tutti i tuoi carichi di lavoro. AWS

CloudWatch offre diverse funzionalità per aiutare ad analizzare log e metriche, come CloudWatch Application Insights per definire e monitorare collettivamente metriche e log per un'applicazione su diverse AWS risorse, CloudWatch Anomaly Detection per evidenziare le anomalie delle metriche e CloudWatch Log Insights per cercare e analizzare in modo interattivo i dati di log in CloudWatch Logs.

Monitora e analizza CloudWatch collettivamente le applicazioni con Application Insights

I proprietari delle applicazioni possono utilizzare Amazon CloudWatch Application Insights per configurare il monitoraggio e l'analisi automatici dei carichi di lavoro. Questo può essere configurato in aggiunta al monitoraggio standard a livello di sistema configurato per tutti i carichi di lavoro in un account. L'impostazione del monitoraggio tramite CloudWatch Application Insights può anche aiutare i team applicativi ad allinearsi in modo proattivo alle operazioni e ridurre il tempo medio di ripristino (MTTR). CloudWatch Application Insights può aiutare a ridurre lo sforzo necessario per stabilire la registrazione e il monitoraggio a livello di applicazione. Fornisce inoltre un framework basato su componenti che aiuta i team a dividere le responsabilità di registrazione e monitoraggio.

CloudWatch Application Insights utilizza gruppi di risorse per identificare le risorse che devono essere monitorate collettivamente come applicazione. Le risorse supportate nel gruppo di risorse diventano componenti definiti individualmente dell' CloudWatch applicazione Application Insights. Ogni componente dell' CloudWatch applicazione Application Insights ha i propri registri, metriche e allarmi.

Per i log, si definisce il set di pattern di log da utilizzare per il componente e all'interno dell'applicazione Application Insights. CloudWatch Un set di pattern di log è una raccolta di pattern di log da cercare in base a espressioni regolari, insieme a una severità bassa, media o alta per il momento in cui viene rilevato il pattern. Per quanto riguarda le metriche, scegli le metriche da monitorare per ogni componente da un elenco di metriche specifiche del servizio e supportate. Per gli allarmi, CloudWatch Application Insights crea e configura automaticamente allarmi standard o di rilevamento delle anomalie per le metriche monitorate. CloudWatch Application Insights dispone di configurazioni automatiche per le metriche e l'acquisizione dei log per le tecnologie descritte nei log e nelle metriche supportate da Application Insights nella documentazione. CloudWatch CloudWatch Il diagramma seguente mostra le relazioni tra i componenti di CloudWatch Application Insights e le relative configurazioni di registrazione e monitoraggio. Ogni componente ha definito i propri log e metriche da monitorare utilizzando log e metriche. CloudWatch

Flusso di processo tra AWS Resource Group, gruppi di log, allarmi esistenti e nuovi allarmi. AutoConfigured

EC2 le istanze monitorate da CloudWatch Application Insights richiedono Systems Manager, CloudWatch agenti e autorizzazioni. Per ulteriori informazioni su questo argomento, consulta Prerequisiti per configurare un' CloudWatch applicazione con Application Insights nella documentazione. CloudWatch CloudWatch Application Insights utilizza Systems Manager per installare e aggiornare l' CloudWatch agente. Le metriche e i log configurati in CloudWatch Application Insights creano un file di configurazione CloudWatch dell'agente archiviato in un parametro Systems Manager con il AmazonCloudWatch-ApplicationInsights-SSMParameter prefisso per ogni componente di CloudWatch Application Insights. Ciò comporta l'aggiunta di un file di configurazione CloudWatch dell'agente separato alla directory di configurazione dell' CloudWatch agente sull'istanza. EC2 Viene eseguito un comando Systems Manager per aggiungere questa configurazione alla configurazione attiva sull' EC2 istanza. CloudWatch L'utilizzo di Application Insights non influisce sulle impostazioni di configurazione degli CloudWatch agenti esistenti. È possibile utilizzare CloudWatch Application Insights in aggiunta alle configurazioni degli agenti a livello di sistema e di applicazione CloudWatch . Tuttavia, è necessario assicurarsi che le configurazioni non si sovrappongano.

Esecuzione dell'analisi dei log con CloudWatch Logs Insights

CloudWatch Logs Insights semplifica la ricerca in più gruppi di log utilizzando un semplice linguaggio di query. Se i log delle applicazioni sono strutturati in formato JSON, CloudWatch Logs Insights rileva automaticamente i campi JSON nei flussi di log in più gruppi di log. È possibile utilizzare CloudWatch Logs Insights per analizzare i log dell'applicazione e del sistema, salvando le query per utilizzi futuri. La sintassi di query per CloudWatch Logs Insights supporta funzioni come l'aggregazione con funzioni, ad esempio sum (), avg (), count (), min () e max (), che possono essere utili per la risoluzione dei problemi delle applicazioni o l'analisi delle prestazioni.

Se utilizzate il formato metrico incorporato per creare CloudWatch metriche, potete interrogare i log in formato metrico incorporato per generare metriche una tantum utilizzando le funzioni di aggregazione supportate. Ciò consente di ridurre i costi di CloudWatch monitoraggio acquisendo i punti dati necessari per generare metriche specifiche in base alle esigenze, anziché acquisirli attivamente come metriche personalizzate. Ciò è particolarmente efficace per le dimensioni con cardinalità elevata che genererebbero un gran numero di metriche. CloudWatch Anche Container Insights adotta questo approccio e acquisisce dati dettagliati sulle prestazioni, ma genera CloudWatch metriche solo per un sottoinsieme di questi dati.

Ad esempio, la seguente voce di metrica incorporata genera solo un set limitato di CloudWatch metriche a partire dai dati metrici acquisiti nell'istruzione Embedded Metric Format:


{
 "AutoScalingGroupName": "eks-e0bab7f4-fa6c-64ba-dbd9-094aee6cf9ba",
 "CloudWatchMetrics": [
 {
 "Metrics": [
 {
 "Unit": "Count",
 "Name": "pod_number_of_container_restarts"
 }
 ],
 "Dimensions": [
 [
 "PodName",
 "Namespace",
 "ClusterName"
 ]
 ],
 "Namespace": "ContainerInsights"
 }
 ],
 "ClusterName": "eksdemo",
 "InstanceId": "i-03b21a16b854aa4ca",
 "InstanceType": "t3.medium",
 "Namespace": "amazon-cloudwatch",
 "NodeName": "ip-172-31-10-211.ec2.internal",
 "PodName": "cloudwatch-agent",
 "Sources": [
 "cadvisor",
 "pod",
 "calculated"
 ],
 "Timestamp": "1605111338968",
 "Type": "Pod",
 "Version": "0",
 "pod_cpu_limit": 200,
 "pod_cpu_request": 200,
 "pod_cpu_reserved_capacity": 10,
 "pod_cpu_usage_system": 3.268605094109382,
 "pod_cpu_usage_total": 8.899539221131045,
 "pod_cpu_usage_user": 4.160042847048305,
 "pod_cpu_utilization": 0.44497696105655227,
 "pod_cpu_utilization_over_pod_limit": 4.4497696105655224,
 "pod_memory_cache": 4096,
 "pod_memory_failcnt": 0,
 "pod_memory_hierarchical_pgfault": 0,
 "pod_memory_hierarchical_pgmajfault": 0,
 "pod_memory_limit": 209715200,
 "pod_memory_mapped_file": 0,
 "pod_memory_max_usage": 43024384,
 "pod_memory_pgfault": 0,
 "pod_memory_pgmajfault": 0,
 "pod_memory_request": 209715200,
 "pod_memory_reserved_capacity": 5.148439982463127,
 "pod_memory_rss": 38481920,
 "pod_memory_swap": 0,
 "pod_memory_usage": 42803200,
 "pod_memory_utilization": 0.6172094650851303,
 "pod_memory_utilization_over_pod_limit": 11.98828125,
 "pod_memory_working_set": 25141248,
 "pod_network_rx_bytes": 3566.4174629544723,
 "pod_network_rx_dropped": 0,
 "pod_network_rx_errors": 0,
 "pod_network_rx_packets": 3.3495665260575094,
 "pod_network_total_bytes": 4283.442421354973,
 "pod_network_tx_bytes": 717.0249584005006,
 "pod_network_tx_dropped": 0,
 "pod_network_tx_errors": 0,
 "pod_network_tx_packets": 2.6964010534762948,
 "pod_number_of_container_restarts": 0,
 "pod_number_of_containers": 1,
 "pod_number_of_running_containers": 1,
 "pod_status": "Running"
}

Tuttavia, puoi interrogare le metriche acquisite per ottenere ulteriori informazioni. Ad esempio, potete eseguire la seguente query per visualizzare gli ultimi 20 pod con errori nelle pagine di memoria:


fields @timestamp, @message
| filter (pod_memory_pgfault > 0)
| sort @timestamp desc
| limit 20

Esecuzione dell'analisi dei log con Amazon OpenSearch Service

CloudWatch si integra con Amazon OpenSearch Service consentendoti di trasmettere i dati di log dai gruppi di CloudWatch log a un cluster Amazon OpenSearch Service di tua scelta con un filtro di abbonamento. Puoi utilizzarlo CloudWatch per l'acquisizione e l'analisi di log e metriche principali, quindi aumentarlo con Amazon OpenSearch Service per i seguenti casi d'uso:

Controllo granulare dell'accesso ai dati: Amazon OpenSearch Service ti consente di limitare l'accesso ai dati fino al livello del campo e aiuta a rendere anonimi i dati nei campi in base alle autorizzazioni degli utenti. Ciò è utile se desideri supportare la risoluzione dei problemi senza esporre dati sensibili.
Aggrega e cerca i log su più account, regioni e infrastrutture: puoi trasmettere i log da più account e regioni in un cluster Amazon OpenSearch Service comune. I tuoi team operativi centralizzati possono analizzare tendenze e problemi ed eseguire analisi su più account e regioni. Lo streaming CloudWatch dei log su Amazon OpenSearch Service ti aiuta anche a cercare e analizzare un'applicazione multiregionale in una posizione centrale.
Spedisci e arricchisci i log direttamente ad Amazon OpenSearch Service utilizzando ElasticSearch agenti: i componenti dello stack applicativo e tecnologico OSs che possono utilizzare non sono supportati dall'agente. CloudWatch Potresti anche voler arricchire e trasformare i dati di log prima che vengano inviati alla tua soluzione di registrazione. Amazon OpenSearch Service supporta client Elasticsearch standard come i data shipper della famiglia Elastic Beats e Logstash che supportano l'arricchimento e la trasformazione dei log prima di inviare i dati di log ad Amazon Service. OpenSearch
La soluzione di gestione delle operazioni esistente utilizza uno ElasticSearch stack Logstash, Kibana (ELK) per la registrazione e il monitoraggio: potresti già avere un investimento significativo in Amazon OpenSearch Service o Elasticsearch open source con molti carichi di lavoro già configurati. Potresti anche avere dashboard operative create in Kibana che desideri continuare a utilizzare.

Se non prevedi di utilizzare CloudWatch i log, puoi utilizzare agenti, driver di log e librerie supportati da Amazon OpenSearch Service (ad esempio, Fluent Bit, Fluentd, logstash e Open Distro for ElasticSearch API) per inviare i log direttamente ad Amazon Service e bypassarli. OpenSearch CloudWatch Tuttavia, dovresti anche implementare una soluzione per acquisire i log generati dai servizi. AWS CloudWatch Logs è la soluzione di acquisizione dei log principale per molti AWS servizi e più servizi creano automaticamente nuovi gruppi di log. CloudWatch Ad esempio, Lambda crea un nuovo gruppo di log per ogni funzione Lambda. Puoi configurare un filtro di abbonamento per un gruppo di log per trasmetterne i log ad Amazon OpenSearch Service. Puoi configurare manualmente un filtro di abbonamento per ogni singolo gruppo di log che desideri trasmettere in streaming su Amazon OpenSearch Service. In alternativa, puoi implementare una soluzione che sottoscrive automaticamente nuovi gruppi di log ai ElasticSearch cluster. È possibile trasmettere i log a un ElasticSearch cluster nello stesso account o a un account centralizzato. Lo streaming dei log su un ElasticSearch cluster nello stesso account aiuta i proprietari dei carichi di lavoro ad analizzare e supportare meglio i propri carichi di lavoro.

Dovresti prendere in considerazione la possibilità di configurare un ElasticSearch cluster in un account centralizzato o condiviso per aggregare i log tra account, regioni e applicazioni. Ad esempio, AWS Control Tower configura un account Log Archive utilizzato per la registrazione centralizzata. Quando viene creato un nuovo account AWS Control Tower, i relativi AWS Config registri vengono inviati a un bucket S3 in questo account centralizzato. AWS CloudTrail La registrazione utilizzata da serve per la configurazione, le modifiche e AWS Control Tower la registrazione di controllo.

Per creare una soluzione centralizzata di analisi dei log delle applicazioni con Amazon OpenSearch Service, puoi distribuire uno o più cluster OpenSearch Amazon Service centralizzati sul tuo account di registrazione centralizzato e configurare gruppi di log negli altri account per trasmettere i log ai cluster centralizzati di Amazon Service. OpenSearch

Puoi creare cluster Amazon OpenSearch Service separati per gestire diverse applicazioni o livelli della tua architettura cloud che potrebbero essere distribuiti tra i tuoi account. L'utilizzo di cluster Amazon OpenSearch Service separati aiuta a ridurre i rischi di sicurezza e disponibilità e disporre di un cluster Amazon OpenSearch Service comune può semplificare la ricerca e la correlazione dei dati all'interno dello stesso cluster.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Registrazione e metriche per AWS Lambda

Opzioni allarmanti con CloudWatch