Photo by Kevin Ku on Unsplash

Why Are Monitoring and Alerting Important?

IT Teams already realize the necessity of monitoring their infrastructure. There is a long history and many products available for legacy infrastructure: tools like Nagios, Zabbix, and others are familiar players in this space.

But, with the Kubernetes ecosystem, it brings many levels of abstraction and troubleshooting if you don’t have the right tools. How many DevOps engineers are faced with the familiar error:

Failed scheduling No nodes are available that match all of the following predicates::Insufficient CPU

Cluster resource monitoring is essential to follow in real time. In comparison with traditional infrastructure, cluster resources are constantly scaling and changing…


Photo de Kevin Ku sur Unsplash

Pourquoi le monitoring et l’alerting d’un cluster K8S sont primordiaux ?

Les équipes informatiques comprennent déjà très bien la nécessité de surveiller leur infrastructure. De nombreux produits sont disponibles pour l’infrastructure historique: Nagios, Zabbix sont par exemple des acteurs bien connus dans ce domaine.

Mais, dans l’écosystème Kubernetes, il y a de nouveaux et nombreux niveaux d’abstraction. Ainsi, le troubleshooting devient beaucoup plus délicat si vous ne disposez pas des bons outils. Combien de DevOps se sont retrouvés confrontés à la fameuse erreur:

Failed scheduling No nodes are available that match all of the following predicates::Insufficient CPU

Le suivi des ressources d’un cluster doit être fait en temps réel car par…

Grégoire DAYET

Cloud Architect

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store