владышев Zabbix Rootconf2009
-
Upload
highload-2009 -
Category
Technology
-
view
2.121 -
download
9
description
Transcript of владышев Zabbix Rootconf2009
Алексей Владышев, www.zabbix.com
Zabbix и распределенный мониторинг тысяч серверов
Zabbix празднует 8 летний юбилей!
• Выбор 1998 года — HP OpenView, IBM, BMC. Open Source: BigBrother• Проблема! Как назвать продукт?! ABCDE...Zabbix! • Апрель 2001 года — вышла первая версия Zabbix 1.0alpha1• Апрель 2004 года — первая стабильная версия Zabbix 1.0• Март 2005 года — основана компания Zabbix SIA
А что сегодня?
Zabbix 1.6.4, 500 скачиваний в день, 15.000 человек на форуме, нас 9 человек, и мы говорим по-русски :-)
История проекта
Zabbix — это система для мониторинга производительности и доступности IT инфраструктуры: приложения, сервисы, вычислительные ресурсы.
Функциональность Zabbix:• Мониторинг с помощью агентов и без• Auto-discovery• Эскалация проблем и запуск скриптов• WEB мониторинг• Графики, карты, экраны• Мониторинг SLA, отчёты• Dashboard
Что такое Zabbix
Основные компонентыСервер:• Ядро Zabbix, логика системы• Обработка данных• Оповещения• Эскалации
WEB интерфейс:• Доступ к истории• Вся конфигурация
Агент:•Сбор данных
Чем отличается Zabbix от других продуктов?• Решение всё-в-одном, но только что касается мониторинга!• Все данные и вся конфигурация находятся в базе данных• 100% наш код: не используем Nagios, RRD• Вся логика на стороне сервера, агенты лишь собирают данные
Важные технические решения:• WEB интерфейс для просмотра и конфигурации• Все написано на C, интерфейс на PHP. Никаких Java/Python/Perl/Ruby на стороне сервера и агента! Fork() - нет, syscalls() - ДА!• Удобен для мониторинга как больших, так и маленьких сред.• Поддержка практически всех платформ
Особенности архитектуры Zabbix
Способы мониторинга серверовService checks: FTP, SSH, HTTP, SMTP, DNS ...
Zabbix Agent:• Активные и пассивные проверки• Мониторинг log файлов• Легко расширяемый• Удалённый запуск команд• Очень эффективен!
SNMP агент:• Обычно NET-SNMP• Мониторинг приложений (Oracle, Weblogic, Websphere, PostgreSQL, MySQL, ...)• SNMP traps
IPMI:• Мониторинг состояния железа• Удалённое управление (reboot, reset, halt)
Используем Zabbix агентАктивные проверки:• Наиболее эффективны• Возможна буферизация данных
Пассивные проверки:• Требуют polling на стороне Zabbix сервера• Дополнительные накладные расходы
Тысячи серверов: сложностиЗадача:• Несколько тысяч серверов• Распределены по 2-100 дата-центрам или филиалам• Необходим централизованный мониторинг
Проблемы и решения:• Объём данных (история, тенденции) и производительность Zabbix • Интеграция с существующими системами (helpdesk, conf management, LDAP)• Поддержка: изменение конфигурации (шаблоны)• Upgrade (непросто для тысяч устройств)
Самое важное решение:• Выбор правильной архитектуры
Zabbix: несколько вариантов
• Один Zabbix сервер занимается всем
• Один Zabbix сервер • Один Proxy на дата-центр или филиал
РаспределенныйРаспределенный1 Сервер1 СерверМного ProxyМного Proxy1 Сервер1 Сервер
• Один Zabbix сервер на дата-центр• Требует бOльших усилий по поддержке• Можно комбинировать с Proxy
Что такое Proxy?Proxy — это демон для сбора данных с агентов
Какие плюсы:• Упрощает архитектуру• Не требует больших ресурсов• Разгружает Zabbix сервер
Как работает Proxy?Если пропала связь с Zabbix сервером:• Данные накапливаются на стороне Proxy• Отсылаются при восстановлении связи• Не получим сообщения о проблемах!
Управление:
• Только сбор данных• Полностью управляется сервером через WEB интерфейс• Конфигурация хранится на Zabbix сервере• Все соединения создает Proxy• Обработка тысяч значений в секунду
Распределенный мониторингОсновные характеристики:• Структура в виде дерева• Нода — это Zabbix сервер• Ноды платформо-независимы
Управление:• Two-way replication• Ноды более высокого уровня контролируют зависимые ноды
Обработка потери соединенияЧто перестанет работать?• Отсылка данных• Синхронизация конфигурации
Всё остальное продолжает работать!
Какую схему выбрать?
Знакомимся с ZabbixДобавляем Proxy
РаспределенныйРаспределенный1 Сервер1 Сервер
Много ProxyМного Proxy1 Сервер1 Сервер Полноценный
распределенный мониторинг
Зависит от требований:• Локальное администрирование• Полноценный мониторинг при потере соединений между филиалами
Вопросы?Сегодня и завтра я на RootConf.