Per funzionalità simili a Amazon Timestream for, prendi in considerazione Amazon Timestream LiveAnalytics per InfluxDB. Offre un'acquisizione semplificata dei dati e tempi di risposta alle query di una sola cifra di millisecondi per analisi in tempo reale. Scopri di più qui.
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Amazon Timestream per InfluxDB 3
Che cos'è Timestream per InfluxDB 3?
Amazon Timestream per InfluxDB 3 è un servizio di database di serie temporali gestito che consente agli sviluppatori di applicazioni DevOps e ai team di eseguire facilmente database InfluxDB 3 per applicazioni di analisi di serie temporali su larga scala utilizzando l'open source. AWS APIs Con Amazon Timestream per InfluxDB 3, puoi configurare, gestire e scalare facilmente carichi di lavoro di serie temporali progettati per gestire dati ad alta cardinalità e query analitiche complesse.
InfluxDB 3 rappresenta una rivisitazione architettonica completa del motore di database InfluxDB. A differenza delle versioni 1 e 2, che utilizzavano un motore di archiviazione Time-Structured Merge tree (TSM), InfluxDB 3 è costruito da zero su basi tecnologiche completamente diverse. Questa nuova versione sfrutta Apache Arrow per l'elaborazione dei dati in memoria, Apache Data Fusion per l'esecuzione delle query e un formato di archiviazione colonnare (Parquet) per la persistenza dei dati nello storage di oggetti (Amazon S3). Questo cambiamento architetturale consente a InfluxDB 3 di offrire prestazioni migliorate per dati ad alta cardinalità e di scalare in modo efficiente per carichi di lavoro analitici di grandi dimensioni. L'architettura InfluxDB 3 offre prestazioni di query e utilizzo delle risorse migliorati per casi d'uso intensivo di dati.
Amazon Timestream for InfluxDB 3 ti dà accesso alle funzionalità di questo motore di database di serie temporali di nuova generazione. La trasformazione architetturale consente carichi di lavoro di analisi di serie temporali su larga scala e sfrutta le funzionalità di compressione, partizionamento e ottimizzazione delle query inerenti al formato di storage colonnare Parquet. Disaccoppiando l'elaborazione dallo storage, InfluxDB 3 può scalare per gestire volumi di dati praticamente illimitati mantenendo l'efficienza dei costi.
Amazon Timestream per InfluxDB 3 può eseguire automaticamente il backup del database e mantenere il software del database aggiornato con la versione più recente. Come sempre Servizi AWS, non sono richiesti investimenti iniziali e paghi solo per le risorse che utilizzi.
Cluster di database
Un cluster DB è l'elemento costitutivo fondamentale di Timestream per InfluxDB 3. A differenza delle istanze di database tradizionali, InfluxDB 3 utilizza un'architettura basata su cluster che separa l'elaborazione dallo storage, sfruttando Amazon S3 per uno storage di dati praticamente illimitato ed economico.
Puoi configurare le tue implementazioni InfluxDB 3 nelle versioni Core o Enterprise:
Versione principale
La versione Core di InfluxDB 3 è limitata alle implementazioni di cluster a nodo singolo e manca di funzionalità di compattazione, il che influisce sulla sua idoneità per determinati carichi di lavoro. A causa di queste limitazioni, la versione Core è progettata principalmente per carichi di lavoro quasi in tempo reale incentrati su dati recenti (in genere vecchi di pochi giorni). Non è consigliata per i casi d'uso che prevedono l'archiviazione e l'analisi a lungo termine, poiché le prestazioni peggioreranno nel tempo senza processi di compattazione volti a ottimizzare lo storage.
Versione Enterprise
La versione Enterprise di InfluxDB 3 supporta configurazioni di cluster multinodo e include funzionalità di compattazione essenziali, che consentono la scalabilità orizzontale per le operazioni di lettura e scrittura. Queste implementazioni multinodo offrono una maggiore disponibilità, prestazioni migliorate per le query simultanee e una maggiore resilienza complessiva del sistema. La funzionalità di compattazione della versione Enterprise la rende adatta a casi d'uso di dati ad alta cardinalità e analisi a lungo termine, poiché ottimizza continuamente il formato di storage sottostante. I cluster aziendali possono essere scalati aggiungendo nodi per soddisfare carichi di lavoro crescenti senza interrompere le operazioni in corso.
Ogni cluster DB ha un identificatore di cluster DB. Questo nome generato automaticamente identifica in modo univoco il cluster DB quando interagisce con l'API e i comandi di Amazon Timestream for InfluxDB. AWS CLI L'identificatore del cluster DB è unico per quel cliente in un. Regione AWS
Timestream for InfluxDB alloca un endpoint DNS per il tuo cluster. L'identificatore generato dal servizio fa parte dell'endpoint DNS del cluster. Ad esempio, se l'identificatore generato dal servizio del cluster è, l'endpoint DNS lo è. xghozx1v79 xghozx1v79-3ksj4dla5nfjhi.timestream-influxdb3.us-east-1.on.aws
Amazon Timestream per InfluxDB 3 ti consente di creare un account utente principale e una password per il tuo cluster DB come parte del processo di creazione. Questo utente master dispone delle autorizzazioni per creare database e tabelle e per eseguire operazioni di lettura, scrittura, eliminazione e modifica dei dati.
Per accedere a un'interfaccia utente visiva basata sul Web, puoi utilizzare InfluxDB Explore, che può essere scaricato ed eseguito sulle tue istanze. InfluxData
Classi DB Cluster
La classe cluster DB determina la capacità di calcolo e memoria dei nodi all'interno dei cluster Amazon Timestream for InfluxDB 3. La classe di cluster appropriata dipende dalla potenza di elaborazione e dai requisiti di memoria.
Classi di cluster InfluxDB 3
I cluster InfluxDB 3 utilizzano classi di istanze ottimizzate specificamente per l'architettura di storage basata su Amazon S3. Queste classi, designate comedb.influxIOIncluded, sono progettate per bilanciare le risorse di calcolo con i I/O requisiti di utilizzo dello storage di oggetti. Il prezzo delle istanze di db.influxIOIncluded calcolo include già tutte le I/O operazioni eseguite su Amazon S3, offrendo ai clienti costi prevedibili indipendentemente dai loro schemi di I/O specifici.
La tabella seguente mostra i dettagli hardware per le classi di nodi del cluster InfluxDB 3:
| Classe istanza | VPCU | Memoria (GiB) | Storage Type (Tipo di storage) | Larghezza di banda di rete (Gbps) |
|---|---|---|---|---|
| db.influx .medium IOIncluded | 1 | 8 | Archiviazione di oggetti S3 | 12 |
| db.influx .large IOIncluded | 2 | 16 | Archiviazione di oggetti S3 | 12 |
| db.influx .xlarge IOIncluded | 3 | 32 | Archiviazione di oggetti S3 | 15 |
| db.influx .2xlarge IOIncluded | 8 | 64 | Archiviazione di oggetti S3 | 20 |
| db.influx .4xlarge IOIncluded | 16 | 128 | Archiviazione di oggetti S3 | 25 |
| db.influx .8xlarge IOIncluded | 32 | 256 | Archiviazione di oggetti S3 | 30 |
| db.influx 1.2xlarge IOIncluded | 48 | 384 | Archiviazione di oggetti S3 | 22.5 |
| db.influx 1.6xlarge IOIncluded | 64 | 512 | Archiviazione di oggetti S3 | 30 |
| db.influx 2.4xlarge IOIncluded | 96 | 768 | Archiviazione di oggetti S3 | 40 |
Le classi di db.influxIOIncluded istanze sono progettate specificamente per:
-
Gestisci in modo efficiente le I/O operazioni tra i nodi di calcolo e lo storage di oggetti Amazon S3.
-
Fornisci memory-to-CPU rapporti ottimali per l'elaborazione di dati di serie temporali utilizzando il framework Apache Arrow.
-
Supporta i requisiti computazionali del motore di query Data Fusion.
Per le implementazioni aziendali con cluster multinodo, tutti i nodi utilizzano la stessa classe di istanze per garantire prestazioni bilanciate in tutto il cluster. Man mano che il carico di lavoro aumenta, puoi scalare verso l'alto selezionando una classe di istanza più grande per tutti i nodi del cluster o scalare orizzontalmente aggiungendo altri nodi della stessa classe al cluster.
Specifiche hardware per le classi di cluster DB
La terminologia seguente descrive le specifiche hardware per le classi di cluster DB:
-
vCPU: il numero di unità di elaborazione centrale virtuali ()CPUs. Una CPU virtuale è un'unità di capacità che è possibile utilizzare per confrontare le classi di cluster DB.
-
Memoria (GiB): la RAM, in gibibyte, allocata al nodo del cluster DB. Spesso c'è un rapporto costante tra memoria e vCPU.
-
Tipo di archiviazione: InfluxDB 3 utilizza S3 Object Storage, che è separato dai nodi di calcolo.
-
Larghezza di banda di rete: la velocità di rete rispetto ad altre classi di cluster DB.
Archiviazione in cluster DB
Amazon Timestream per InfluxDB 3 introduce un'architettura di storage diversa che separa l'elaborazione dallo storage sfruttando Amazon S3 per lo storage di oggetti. Questa architettura offre una capacità di storage praticamente illimitata, mantenendo i costi sotto controllo nelle implementazioni su larga scala.
Archiviazione di oggetti InfluxDB
I cluster InfluxDB 3 utilizzano un'unica classe di storage chiamata InfluxDB Object Storage, costruita su Amazon S3. Questa opzione di archiviazione offre:
-
Capacità di archiviazione praticamente illimitata
-
Storage conveniente per grandi volumi di dati (risparmio fino al 75% per implementazioni superiori a 16 TB rispetto a InfluxDB 2.x)
-
Durabilità del 99,99999% (11 nove)
-
Dati memorizzati nel formato colonnare Parquet per prestazioni efficienti di compressione e interrogazione
A differenza delle architetture di database tradizionali in cui lo storage è collegato direttamente ai nodi di calcolo, lo storage di oggetti di InfluxDB 3 è condiviso tra tutti i nodi del cluster. Ogni nodo mantiene cache locali in memoria per i dati a cui si accede di frequente per ottimizzare le prestazioni delle query mentre i dati sottostanti rimangono in Amazon S3.
I prezzi di InfluxDB Object Storage si basano su:
-
Volume totale di dati archiviato (GB/mese), con un costo mensile minimo equivalente a 200 GB
I/O i costi operativi sono inclusi nei prezzi di elaborazione per le classi di IOIncluded istanze db.influx, offrendo ai clienti costi più prevedibili indipendentemente dai modelli specifici. I/O
Vantaggi dell'architettura di storage
L'architettura di storage basata su Amazon S3 in InfluxDB 3 è particolarmente utile per:
-
Carichi di lavoro di analisi di serie temporali su larga scala
-
Requisiti di dati ad alta cardinalità
-
scenari di conservazione dei dati a lungo termine
-
Archiviazione conveniente di set di dati di grandi serie temporali
Questo modello di storage è paragonabile a Timestream for LiveAnalytics Magnetic Storage Tier, anch'esso basato su object store e ottimizzato per casi d'uso di storage e analisi a lungo termine. L'economia dello storage di InfluxDB 3 è progettata per essere competitiva rispetto LiveAnalytics ai prezzi di Magnetic Store, un modello che si è dimostrato adatto ai clienti che desiderano eseguire e archiviare carichi di lavoro e dati di serie temporali su larga scala per lunghi periodi di tempo.
Dimensionamento del cluster DB
La configurazione ottimale di un cluster Timestream per InfluxDB 3 dipende da vari fattori, tra cui la velocità di ingestione, le dimensioni dei batch, la cardinalità delle serie temporali, le query simultanee e i tipi di query.
Nel dimensionare i cluster InfluxDB 3, considera questi fattori aggiuntivi dovuti alla sua diversa architettura:
-
Efficienza dello storage: per le implementazioni con più di 16 TB di dati, lo storage a oggetti di InfluxDB 3 può offrire risparmi sui costi fino al 75% rispetto alle implementazioni Timestream for InfluxDB 2.
-
Caratteristiche del carico di lavoro: InfluxDB 3 è ottimizzato per dati e query analitiche ad alta cardinalità su set di dati di grandi dimensioni, offrendo al contempo prestazioni paragonabili alle versioni 1.x e 2.x per query con intervalli di tempo più brevi. Inoltre, funzionalità come le cache degli ultimi valori e dei valori distinti consentono latenze
di query sostenute inferiori a 10 ms per casi d'uso specifici, come il recupero dei punti dati più recenti o dei valori di metadati univoci. -
Schemi di interrogazione: valuta se il carico di lavoro è continuo (monitoraggio 24 ore su 24, 7 giorni su 7) o intermittente (analisi periodica)
-
Requisiti di compattazione: la versione Enterprise include funzionalità di compattazione essenziali per l'archiviazione dei dati a lungo termine e i carichi di lavoro ad alta cardinalità. Per le implementazioni con cluster a 3 nodi o più grandi, si consiglia di utilizzare un nodo compattatore dedicato per massimizzare le prestazioni di scrittura e lettura sugli altri singoli nodi, assicurando che i processi di compattazione non competano per le risorse con le operazioni di query e ingestione.
Per fornire consigli sul dimensionamento, consideriamo un carico di lavoro esemplare con le seguenti caratteristiche:
-
I dati vengono raccolti e scritti da una flotta di agenti Telegraf che raccolgono sistema, CPU, memoria, disco, IO e così via da un data center.
-
Ogni richiesta di scrittura contiene 5000 righe.
-
Le query eseguite sul sistema sono classificate come query di «complessità moderata» e presentano le seguenti caratteristiche:
-
Hanno più funzioni e una o due espressioni regolari.
-
Possono includere clausole raggruppate per clausole o campionare un intervallo di tempo di più settimane.
-
L'esecuzione richiede in genere da alcune centinaia di millisecondi a un paio di migliaia di millisecondi.
-
La CPU favorisce principalmente le prestazioni delle query.
-
Tutti i test sono stati eseguiti con un set di dati contenente una cardinalità di 30 milioni di serie temporali.
-
| Scrive (righe al secondo) | Letture (interrogazioni al secondo) | Instance class (Classe istanza) | Versione |
|---|---|---|---|
| ~150.000 | <25 | db.influx.large IOIncluded | Core |
| ~200.000 | ~25 | db.influx.xlarge IOIncluded | Core |
| ~250.000 | ~35 | db.influx .2xlarge IOIncluded | Enterprise |
| ~500.000 | ~50 | db.influx .4xlarge IOIncluded | Enterprise |
| <750.000 | <100 | db.influx .8xlarge IOIncluded | Enterprise |
| > 750.000 | >100 | Cluster aziendale multinodo | Enterprise |
Fatturazione del cluster DB per Amazon Timestream per InfluxDB 3
I cluster Amazon Timestream per InfluxDB 3 vengono fatturati in base ai seguenti componenti:
-
Ore dei nodi del cluster DB (all'ora): in base alla classe di nodi del cluster DB, ad esempio db.influx .large. IOIncluded I prezzi sono calcolati in base a una tariffa oraria, mentre le fatture sono calcolate al secondo e mostrano i valori in formato decimale. L'utilizzo viene fatturato in incrementi di 1 secondo, con un minimo di 10 minuti. Per le implementazioni Core a nodo singolo o le implementazioni Enterprise a più nodi, ogni nodo viene fatturato separatamente in base alla durata di esecuzione.
-
Object Storage (per GB al mese): volume di dati effettivo archiviato in InfluxDB Object Storage, anziché capacità fornita. Questo modello ti consente di pagare solo per lo storage che utilizzi, senza la necessità di predisporre la capacità di archiviazione. Nota: è previsto un costo minimo mensile di archiviazione equivalente a 200 GB, anche se l'utilizzo effettivo dello storage è inferiore.
-
Trasferimento dati in uscita (per GB): trasferimento di dati dal cluster DB a Internet o altro Regioni AWS. Il trasferimento o il traffico di dati all'interno dello stesso VPC o tra zone di disponibilità all'interno dello stesso Regione AWS è gratuito.
-
Licenza InfluxDB 3 Enterprise (per vCPU all'ora): per le implementazioni InfluxDB 3 Enterprise, è previsto un InfluxData costo di licenza aggiuntivo addebitato per vCPU all'ora. Questo canone di licenza viene fatturato direttamente Marketplace AWS e appare come voce separata sulla fattura. AWS La licenza abilita funzionalità Enterprise come il clustering multinodo, le funzionalità di compattazione e le funzionalità di sicurezza avanzate.
Per i cluster InfluxDB 3 Enterprise con più nodi, ogni nodo viene fatturato separatamente in base alla classe di istanza e al numero di vCPU (per i costi di licenza), mentre i costi di storage sono consolidati poiché tutti i nodi condividono lo stesso storage di oggetti sottostante.
Riepilogo dei componenti di fatturazione
| Componente di fatturazione | InfluxDB 3 Core | InfluxDB 3 Enterprise |
|---|---|---|
| Calcola la fatturazione | Per nodo ora (classi db.influxIOIncluded ) | Per ora di nodo (classi db.influx) IOIncluded |
| Fatturazione dello storage | Per GB di dati archiviati (minimo 200 GB) | Per GB di dati archiviati (minimo 200 GB) |
| I/O Operazioni | Incluso nei prezzi dei nodi di calcolo | Incluso nei prezzi dei nodi di calcolo |
| Dimensionamento dello storage | Non necessario, paghi solo per lo storage utilizzato | Non necessario, paghi solo per lo spazio di archiviazione utilizzato |
| Trasferimento dati in entrata | Gratuito | Gratuito |
| Trasferimento dati all'interno VPC/AZ | Gratuito | Gratuito |
| Trasferimento dati in uscita (Internet/tra regioni) | Addebitato per GB | Addebitato per GB |
| Fatturazione minima | 10 minuti | 10 minuti |
| Granularità della fatturazione | Incrementi di 1 secondo | Incrementi di 1 secondo |
| Supporto multi-nodo | No (solo nodo singolo) | Sì |
| Licenza aggiuntiva | Nessuno | Per vCPU all'ora tramite Marketplace AWS |
Strategie di ottimizzazione dei costi
-
Dimensionamento corretto: seleziona la classe di nodi appropriata in base ai requisiti del carico di lavoro per evitare un eccesso di provisioning. Consigliamo inoltre di scegliere un'istanza che mantenga una media di circa il 65% di utilizzo della CPU e della memoria, assicuri la resilienza ai picchi di utilizzo e lasci spazio per una sana pianificazione della capacità.
-
Efficienza dello storage: per le implementazioni con più di 16 TB di dati, lo storage a oggetti di InfluxDB 3 può offrire risparmi sui costi fino al 75% rispetto alle tradizionali soluzioni basate su EBS.
-
Ottimizzazione del traffico di rete: mantieni il trasferimento dei dati all'interno dello stesso VPC o regione, quando possibile, per evitare costi di trasferimento dati in uscita.
-
Strategia di scalabilità: per InfluxDB 3 Enterprise, valuta se la scalabilità verticale (classe di nodi più ampia) o la scalabilità orizzontale (più nodi) sia più conveniente per i tuoi modelli di carico di lavoro specifici.
-
Ottimizzazione della licenza: per InfluxDB 3 Enterprise, scegli classi di nodi che forniscano l'equilibrio ottimale tra il numero di vCPU (che influisce sui costi di licenza) e i requisiti di prestazioni.
Per informazioni sui prezzi di Amazon Timestream for InfluxDB 3, consulta la pagina dei prezzi di Amazon Timestream
Regioni AWS e zone di disponibilità
Le risorse di cloud computing Amazon sono ospitate in più ubicazioni in tutto il mondo. Queste sedi sono composte da zone di Regioni AWS disponibilità. Ciascuna Regione AWS è un'area geografica separata. Regione AWS Ciascuna ha più sedi isolate note come zone di disponibilità.
Amazon Timestream per InfluxDB 3 ti consente di collocare risorse, come cluster DB, e dati in più posizioni. Per le implementazioni aziendali con cluster multinodo, i nodi sono distribuiti su più zone di disponibilità per migliorare la disponibilità.