Séries chronologiques, stockage à long terme, multi-locataires et haute disponibilité
Cet article est une rétrospective de plusieurs mois d'amélioration continue depuis la création de notre système de surveillance actuel : quels défis avons-nous rencontrés, comment les avons-nous surmontés et comment sommes-nous finalement passés à Victoria Metrics.
Comment cela a commencé
Chez Iguane Solutions, nous avons créé un système multi-locataires basé sur Prometheus pour nos besoins en matière d'alerte et de métrologie : Sismology. Il s'agissait au départ de remplacer nos systèmes monolithiques Naemon et Graphite (avec collectd) par un système unique fusionnant la métrologie et l'alerte sur la base de la norme actuelle : Prometheus.
Bien que Prometheus nous ait fourni un bon noyau de métrologie et d'alerte, nous avons été confrontés à trois défis :
Multi-tenance : comme nous envisagions de permettre à nos clients d'accéder à leurs propres données, il fallait s'affranchir de la tenance unique de Prometheus. | |
Stockage à long terme : plusieurs années, il n'est pas rare que nos clients (ou nous-mêmes) comparent une période spécifique de l'année à l'année N-1 ou N-2. | |
Haute disponibilité : Objectif de 0 temps d'arrêt tout en ayant la possibilité de mettre certains nœuds hors ligne à des fins de maintenance. |
Dans cet article écrit par Edouard Hur, VP Engineering chez Iguane Solutions, vous trouverez tous les détails sur :
- La mise au point des technologies utilisées
- Le développement personnalisé concernant : l'utilisation du disque et le proxy de lecture à distance ; l'utilisation de la RAM, la cardinalité et la raison pour laquelle il a donné naissance à notre propre agent.
- Victoria Metrics et pourquoi il a remplacé InfluxDB