Superviser efficacement en environnement opérationnel
-
Upload
rodrigue-chakode -
Category
Technology
-
view
1.415 -
download
0
description
Transcript of Superviser efficacement en environnement opérationnel
Superviser efficacement en environnement opérationnel
Rodrigue Chakode
Rodrigue Chakode● PhD, Ingénieur R&D Cloud/HPC● Contributeur open source aux heures
perdues○ OpenNebula
■ Coordination User Group France● En cours de création● http://blog.opennebula.org/?p=4638
○ RealOpInsight■ Auteur, depuis 2010
Introduction● Infrastructure IT
○ Ensemble de composants matériels et logiciels■ serveurs, applications, routeurs, switchs, etc.
○ Fournit des services■ Processus métiers
● Ex. stockage, API, bases de données, interconnexions réseaux...
■ Services rendus aux utlilisateurs● Ex. site internet, intranet, applications de paie...
○ 1 service repose sur un/plusieurs composants○ Composants matériels mutualisés entre services○ 1 défaillance => indisponibilité d'un/plusieurs
services ■ Besoin de supervision
Superviser, c'est...
● Détecter/anticiper la survenue des incidents○ supervision proactive, supervision passive○ consoles de supervision, tableaux de bord
● Réagir rapidement en cas d'incidents● Prioriser la résolution des incidents en
fonction de leur impact● Eviter/limiter de fausses alertes
○ Evaluer l'impact réel des incidents sur les services● Choisir un outil de supervision adapté
○ Nagios, Zabbix, Zenoss, HP Operations Management, IBM Tivoli, Shinken, Icinga...???
Exemple : Nagios Core
Problèmes● Sévérités par défaut pas toujours adaptées
○ Cas des templates et des plugins génériques● Difficile de faire la corréleration entre un
incident et une dégradation réelle de service
Nécessité de mécanismes de gestion d'incidents adaptés
Vision ● Organisation hierarchique de services
○ Séverité d'un service père = FONCTION des sevérités des services fils
● moyenne, sévérité forte...
○ Sévérité propagée au père = FONCTION de la sévérité du fils
● Incrémentation, décrémentation, tel quel...
RealOpInsight● Outil versatile
○ Support Nagios, Zenoss, Zabbix, Shinken, GroundWork, Icinga, Centreon, op5...
● Gestion avancée d'incidents○ règles de calcul, règles de propagation
● Organisation hierarchique de service○ Notion de vue de service
■ définie dans un fichier XML■ éditeur propre natif (drag-and-drop, copy/paste,
menus contextuels...)● Interfaces graphiques Qt
○ Cross-platform (Linux, Windows, OS X)○ Vues de service orientées opérateurs
● http://realopinsight.com
Gestion de sévérités● Modèle de sévérités unifié
● Algorithmes de calcul et propagation
Faible Couplage avec l'outil sous-jacent
Distribution● Sources et paquets pour Fedora, openSUSE,
Ubuntu, Windows● Liens
○ http://realopinsight.com/en/index.php?page=download○ https://sourceforge.net/projects/ngrt4n/○ http://www.zabbix.com/third_party_tools.php○ http://exchange.nagios.org/directory/Addons/Maps-
and-Diagrams/RealOpInsight
Roadmap
● Aggrégation multi-sources (en cours)○ collecte à partir de sources homogènes
■ plusieurs sources de même type● Nagios, Zabbix, Zenoss, Shinken...
○ collecte à partir de sources hétérogènes■ plusieurs sources de différents types
● Ex. Nagios + Zenoss, Nagios + Zenoss + Zabbix
● Version web○ accessible à partir d'un navigateur○ meilleure accessibilité○ Roadmap à établir
Merci! Question?
Meet us atJuly 10, 2013
@realopinsight