Назначение
Подсистема СПАЙДЕР-IPNP (IP Network Performance) предназначена для автоматизированного контроля состояния и производительности IP-сетей. Непрерывно отслеживая статус контролируемых объектов, подсистема своевременно оповещает оператора о возникновении аварий/перегрузок и предоставляет необходимую детализацию данных.
Подсистема позволяет оператору решать следующие задачи:
- Оповещение персонала о потенциальных аварийных ситуациях и проблемах еще до того момента, когда они приведут к снижению качества предоставляемых услуг
- Снижение времени недоступности услуг
- Уменьшение времени простоя оборудования при сбоях
Архитектура
Объектами наблюдения могут быть различные сетевые элементы, каналы связи и приложения. Собранные с контролируемых объектов KPI (Key Performance Indicators – ключевые параметры производительности) обрабатываются специализированными инструментами анализа и непрерывно контролируются на предмет деградации.
Сбор необходимых KPI осуществляется различными способами:
- SNMP-опрос
- Анализ потоков NetFlow, SFlow, jFlow
- Проверка доступности хостов сетевых приложений (ICMP, DNS, SMTP, HTTP, FTP и др.)
- «Безагентовые» тесты (SSH, Telnet, WMI, IPMI и др.)
При необходимости, подсистема свободно расширяется новыми алгоритмами и методами сбора. Если значения KPI превысят заданные пороги, то подсистема оперативно генерирует тревожные уведомления.
Для более эффективной организации бизнес-процессов оператора предусмотрена интеграция подсистемы с другими компонентами OSS (системы класса Inventory, СПАЙДЕР-SQM и др.).
Возможности
Гибкое управление конфигурацией
В системе реализован удобный интерфейс управления конфигурацией, который позволяет добавлять и удалять контролируемые объекты, изменять их параметры и задавать периодичность выполнения активных тестов (SNMP-опрос, CLI и др.).
Поддерживается возможность автоматического добавления в конфигурацию контролируемых объектов (auto discovery).
Контроль порогов
Для каждого KPI можно задать многоуровневые ограничительные пороги со следующими уровнями критичности: critical, warning и normal. Многоуровневые пороги позволяют оператору выявлять аварийные ситуации превентивно, когда абонент еще не заметил ухудшения качества сервисов.
При нарушении порогов подсистема автоматически генерирует событие и отправляет соответствующее уведомление (SMS, e-mail, SNMP-trap в вышестоящую систему и др.). Пороги могут быть заданы как численно, так и в процентах (отклонение от абсолютного значения и динамически изменяющихся статистических значений – baseline).
Журналирование событий
Все зафиксированные события, связанные с изменением статуса контролируемых объектов, отображаются в отдельном интерфейсе – «Журнал событий». Каждое событие содержит ссылку на проблемные элемент, по клику на которую осуществляется переход на страницу с детализированной информацией по объекту.
Существует возможность поиска и фильтрации событий по их различным атрибутам. Реализован наглядный Dashboard по соотношению обнаруженных аварий и перегрузок различного типа.
Управление инцидентами
Данная функция позволяет сгруппировать зафиксированные события, имеющие одинаковые значения определенных полей, в отдельную сущность – инцидент.
Каждый инцидент генерируется при наступлении определённого количества заданных событий. Существует возможность закрепить каждый инцидент за любым техническим специалистом оператора, который будет заниматься данной проблемой.
Формирование отчетов
Подсистема имеет возможность сформировать различные пользовательские отчеты по зафиксированным аварийным событиям. Отчеты могут формироваться как по запросу, так и по расписанию за различные периоды времени. Сформированные отчеты выгружаются в формате xls (x), docx pdf, html и др. и могут отправляться по e-mail в заданные моменты времени.
Предоставление статистики
Предоставляется статистика о состоянии и производительности как всей контролируемой сети, так и ее различных сегментов с детализацией до отдельных сетевых элементов. Статистика обновляется в режиме реального времени и имеет как табличный, так и графический вид.
На основе сочетания исторических и текущих показателей подсистема позволяет быстро обнаружить и устранить причину деградации производительности.