Комплекс VitalSuite® Network Fault Management (NFM)
Программный комплекс VitalSuite® NFM предназначен для централизации наблюдения и контроля в современных телекоммуникационных сетях, построенных на оборудовании разных производителей и использующих разнообразные технологии. Применение различных вариантов аварийных сигналов, отображения состояния сети и удаленного доступа к сетевым элементам позволяет быстро обнаруживать, диагностировать и устранять возникающие в сети проблемы. Расширение стандартного варианта поставки предусматривает функции регистрации сбоев (trouble ticketing), анализ данных и генерацию отчетов, поддержку ОКС7.
Система VitalSuite® NFM может получать сигналы практически от всех существующих сетевых элементов. Поддерживаются как устройства, относящиеся к системам коммутации каналов, так и устройства передачи данных. Связь с канальными коммутаторами осуществляется по интерфейсам TL1, ASCII и X.25. Запросы SNMP могут приниматься от системы управления элементами (например, через HP Network Node Manager) и непосредственно от устройств. Для различных сетевых элементов имеется широкий набор готовых правил, а интерпретатор управляющей базы данных MIB Interpreter позволяет быстро организовать поддержку практически любого устройства SNMP. VitalSuite® NFM также может принимать сигналы от датчиков температуры, датчиков открывания дверей и т.п.
Все поступающие от сетевых элементов сообщения сохраняются и остаются доступны пользователям в течение заданного времени. Сопоставление журнала сообщений с конкретными сигналами дает возможность проследить всю цепочку событий от аварийного сигнала до сообщений, которые участвовали в формировании этого сигнала. Аварийный сигнал может быть передан в другую удаленную систему или использован для запуска заданного пользователем события.
Основные преимущества
Комплекс NFM обеспечивает защиту инвестиций путем блокирования распространения сетевых неисправностей и предотвращения сервисных отказов; масштабируемая архитектура поддерживает наращивание сети; гибкие интерфейсы обеспечивают взаимодействие с оборудованием и системами управления элементами различных производителей; за счет повышения производительности труда уменьшается стоимость оплаты специалистов; централизованный контроль уменьшает количество избыточных эксплуатационных процедур; интегрированное управление аварийными сигналами снижает стоимость контроля при наличии множества доменов; устраняется необходимость присутствия технического персонала на центральной станции; снижается стоимость обучения персонала.
Функции
Сбор данных и обработка аварийной сигнализации
Система VitalSuite® NFM может получать сигналы практически от всех существующих сетевых элементов. Поддерживаются как устройства, относящиеся к системам коммутации каналов, так и устройства передачи данных. Связь с канальными коммутаторами осуществляется по интерфейсам TL1, ASCII и X.25. Запросы SNMP могут приниматься как от системы управления элементами (например, через HP Network Node Manager), так и непосредственно от устройств. Для различных сетевых элементов имеется широкий набор готовых правил, а интерпретатор управляющей базы данных MIB Interpreter позволяет быстро организовать поддержку практически любого устройства SNMP. VitalSuite® NFM также может принимать сигналы от датчиков температуры, датчиков открывания дверей и т.п.
Регистрация и распределение данных
Все поступающие от сетевых элементов сообщения сохраняются и доступны пользователям в течение заданного времени. Сопоставление журнала сообщений с конкретными сигналами дает пользователю VitalSuite® NFM возможность проследить всю цепочку событий от аварийного сигнала до сообщений, которые участвовали в формировании этого сигнала. Оригинальное сообщение хранится в том формате, в котором оно было принято от сетевого элемента. После регистрации сообщения форматируются в соответствии с набором правил и рассылаются указанным пользователям с учетом параметров допуска, задаваемых администратором. Аварийный сигнал может быть передан в другую удаленную систему или использован для запуска определяемого пользователем события. В последнем случае при выполнении заданных условий на удаленном оборудовании выполняются определенные программы. Они могут быть любого типа (команды ядра или программы на языке C) и могут включать сценарии для автоматизации диалога с коммутатором. Регистрация и распределение информации происходят практически в реальном времени, поэтому интервал между получением аварийного сигнала и выводом информации на экран пользователя весьма мал.
Наборы правил
Наборы правил определяют аимодействие между сетевыми элементами и системой VitalSuite® NFM. Они представляют собой программы (аналогичные командным файлам), основное назначение которых анализ и рассылка сообщений, поступающих от сетевых элементов. Наборы правил включают правила регистрации (для сбора и хранения необработанных данных) и правила распределения данных для постоянной обработки выбранных сигналов и графического их представления. В системе имеется более 50 готовых наборов правил для различного оборудования (проводного, беспроводного, передачи данных). VitalSuite® NFM обеспечивает наилучшую среди существующих систем поддержку коммутатора Lucent 5E, а также она лидирует в области поддержки конвергентных сетей передачи голоса и данных. С помощью набора правил MIB Interpreter система VitalSuite® NFM может взаимодействовать практически с любым устройством, поддерживающим SNMP.
После минмального обучения пользователи могут разрабатывать собственные наборы правил для новых типов сетевых элементов, а также редактировать правила для существующих элементов. Редактирование и внедрение новых правил производится без прерывания работы VitalSuite® NFM.
Прямой доступ к сетевым элементам
Прямой доступ к сетевым элементам (Cut-Through) интегрирован в поставляемые вместе с системой наборы правил. Этот тип доступа дает возможность пользователю напрямую обращаться к сетевому элементу или системе управления EMS для поиска и устранения неисправностей. В наборы правил встроены индивидуальные характеристики сетевых элементов, что обеспечивает пользователю оптимальный механизм доступа.
Сбор данных SNMP
Система VitalSuite® NFM позволяет принимать запросы SNMP (trap) как от системы управления элементами (например, через HP Network Node Manager), так и непосредственно от устройств. Кроме инструментария сбора запросов в системе предусмотрен браузер MIB, с помощью которого можно передавать команды GET и SET на любое устройство SNMP. VitalSuite® NFM поддерживает устройства SNMP v1, v2 и v3. Для быстрого установления связи с практически любым устройством SNMP используется интерпретатор управляющей базы данных MIB Interpreter.
Пользовательский интерфейс
Графический Web-интерфейс обеспечивает доступ ко всем функциям VitalSuite® NFM из браузеров Netscape и IE. Пользователь может из одной точки просматривать аварийные сигналы, графические отображения сети, исторические данные файлов регистрации, напрямую обращаться к коммутаторам. Web-интерфейс функционирует на любом компьютере под управлением ОС Windows и не требует инсталляции программного обеспечения. Пользователю достаточно получить доступ к хост-компьютеру, и загрузка необходимого ПО производится автоматически. Разрешения на доступ выдаются системным администратором. Кроме Web-интерфейса имеется также интерфейс CHUI. Для создания и выполнения сценариев используется доступ из командной строки.
Отображение аварийных сигналов
Система VitalSuite® NFM отображает общий и сетевой списки аварийных сигналов, которые динамически обновляются по мере получения данных системой. Каждый пользователь видит только те сигналы, к которым он имеет доступ по разрешению администратора. Все сигналы на экране различаются по цветам и группируются по степени критичности.
Имеется возможность определения дополнительных фильтров для просмотра выбранных сигналов, при этом возможны различные конфигурации сортировки и просмотра, сохраняемые и вызываемые по мере необходимости, а также настройка отображения (что выводить и в какой последовательности). Для просмотра на одном экране выбранных аварийных сигналов определяются соответствующие фильтры, кроме того возможна сортировка сигналов (максимум по трем полям). На этом же экране пользователь может подтвердить или обнулить аварийный сигнал, а также ввести код реагирования (максимум два кода).
Коды реагирования могут использоваться, например, для оповещения других пользователей о том, что аварийный сигнал сгенерирован в результате запланированной профилактики коммутатора. С экрана отображения аварийных сигналов пользователь может перейти на просмотр более подробной информации и выйти в меню функций (доступ к устройству, создание журнала регистрации ошибок, пересылка страницы техническому специалисту и т.д.). На странице просмотра сообщений можно увидеть все сообщения сетевых элементов, связанные с аварийным сигналом. Это позволяет пользователю лучше понять состояние сетевого элемента в момент генерации аварийного сигнала.
Графическое отображение сети
Отображаемая системой VitalSuite® NFM сетевая карта состоит из узлов двух типов: сетевых элементов и групп сетевых элементов. Цвет узла отражает серьезность генерируемого аварийного сигнала. В узле, включающем группу сетевых элементов, возможен выход на нижние уровни с просмотром отдельных узлов. Правая кнопка мыши дает доступ к меню с опциями просмотра. Пользователь сам может разработать схему просмотра и добавить ее в качестве одной из опций. Также имеется возможность настройки графического отображения для показа разных уровней масштабирования и детализации. В качестве фона могут быть использованы импортируемые графические файлы форматов jpg и gif. Конструктор отображений поддерживает перетаскивание узлов и других элементов на экране.
Установка пороговых значений
В системе VitalSuite® NFM предусмотрены пороги четырех типов. Каждому сетевому элементу присваивается пороговое значение для каждого типа, которое можно изменить во время работы системы. Разрешение на изменение пороговых значений выдается системным администратором.
Рейтинговые пороги используются для выдачи сигнала по количеству сообщений, полученных от данного сетевого элемента за данный промежуток времени.
Числовые пороги при использовании совместно с рейтинговыми порогами позволяют выдавать аварийный сигнал при получении определенного значения, даже если рейтинговый порог не достигнут.
Временные пороги позволяют последовательно передавать аварийный сигнал пользователям, если он не был подтвержден или обнулен в течение определенного времени. Система поддерживает 10 уровней передачи сигнала и будет продолжать его распространение до получения подтверждения или обнудения. Эта функция предназначена для предотвращения потери важного сигнала.
Групповые пороги используются для генерации сигналов в случае, когда сетевое событие затрагивает определенный процент сгруппированных элементов. Так, можно задать генерацию критичного аварийного сигнала при занятии определенного процента соединительных линий между двумя населенными пунктами.
Корреляция событий
Эта функция включает ряд настраиваемых инструментов для соотнесения и группировки связанных между собой сообщений, поступающих от сетевых элементов. Корреляция сообщений помогает в анализе источника возникновения проблемы и в оценке ее влияния. При определении способа корреляции сообщений имеется возможность учитывать отношения элементов верхнего уровня, время поступления сообщений, тип аварийных сигналов.
Возможность установления соотношений между сетевыми сообщениями позволяет подавить поступление аварийных сигналов низкого уровня, если присутствуют соотнесенные сигналы высокого уровня. За счет этого уменьшается количество отображаемых на экране сигналов и достигается более четкая картина состояния сети, что, в свою очередь, ускоряет изоляцию и диагностику сбоев. Функция корреляции событий использует правила, аналогичные применяемым в платформах искусственного интеллекта, но пользователям при этом не требуется изучать их сложный синтаксис.
Созданный на языке C++ набор анализируемых объектов позволяет с помощью простого интерфейса вводить необходимые правила в таблицы. Интерфейс написан на языке Java и базируется на разработанном в Лабораториях Белла алгоритме, который является на данный момент одним из самых быстродействующих.
Безопасность
Разрешение на доступ к системе контролируется стандартными средствами ОС UNIX и выдается системным администратором. Разрешения на просмотр аварийных сигналов и совершение ответных действий, на просмотр файлов регистрации, модификацию параметров вывода, изменение пороговых значений, редактирование наборов правил и на доступ к сетевым элементам выдаются администратором. Разрешение на просмотр аварийных сигналов может выдаваться отдельно от разрешения на право выполнения ответных действий по аварийным сигналам. На следующем уровне доступ к аварийным сигналам ограничивается по конкретным сетевым элементам и конкретным командам доступа. Действия пользователей, включая подтверждение и обнуление аварийных сигналов, обращение к файлам регистрации и доступ к коммутаторам регистрируются в соответствующем файле для каждого пользователя.
Операционный интерфейс
Операционный интерфейс (Operating System Interface Feature, OSIF) позволяет посылать текстовые сообщения (в формате ASCII) от системы VitalSuite® NFM к другим операционным системам. Он может использоваться для посылки команд и сообщений, обрабатываемых другой операционной системой, и т.д. Основное преимущество OSIF заключается в том, что это однонаправленный интерфейс, позволяющий пользователям разрабатывать интерфейсы к собственным системам. Вместе с наборами правил и другими инструментами VitalSuite® NFM это облегчает разработку средств связи с операционными системами, делая возможным реализацию преимуществ совместного использования приложений.
Модуль взаимодействия с сетевыми элементами
Модуль взаимодействия с сетевыми элементами (Element Mediation Module, EMM) предназначается для пользователей VitalSuite® NFM, которым требуется связь с сетевыми элементами по синхронному интерфейсу. Модуль EMM обеспечивает одностороннюю или двустороннюю связь. Он может размещаться как на том же компьютере, где установлена система VitalSuite® NFM, так и на отдельном компьютере, в зависимости от объема система и предпочтений пользователя.
Масштабируемость
Система VitalSuite® NFM обеспечивает мониторинг сетей размером от нескольких элементов до нескольких тысяч элементов. Все клиенты, независимо от размера сети, получают одно и то же программное обеспечение. Разница заключается в конфигурации аппаратных средств. Для малых сетей достаточно одного процессора, для больших сетей можно использовать более мощный процессор, несколько мощных процессоров или многопроцессорные устройства.
Анализ данных и генерация отчетов
Дополнительный инструментарий анализа данных и генерации отчетов (Data Analysis and Reports, DARTS) базируется на системе Crystal Decisions Seagate Info и платформе Windows® 2000. Функция DARTS позволяет генерировать, анализировать и просматривать отчеты по аварийным сигналам и трафику в текстовой и графической форме с помощью браузера. DARTS получает данные от поддерживаемых системой VitalSuite® NFM сетевых элементов через определяемые пользователем интервалы.
После сохранения данных система генерирует и выводит на экран запрошенные пользователем отчеты. Отчеты могут создаваться по расписанию или по запросу, их можно просматривать через веб-браузер, рассылать по электронной почте и редактировать в любое время. В поставку DARTS входит более 50 стандартных видов отчетов, включая обобщенные (например, первые 10 аварийных сигналов по типам сетевых элементов), специальные (отчет по перерывам в работе базовой станции сети сотовой связи), а также отчеты по состоянию станции 5E. Пользователи могут создавать собственные варианты отчетов, для чего предусмотрены средства составления запросов, составления графиков и графический интерфейс.
Регистрация сбоев
Дополнительная функция регистрации сбоев базируется на программном обеспечении Remedy. Она позволяет автоматически и вручную создавать уведомления о сбоях и проблемах, включая как сообщения, генерируемые системой VitalSuite® NFM, так и претензии пользователей по функционированию сети. Кроме того, журнал может пополняться непосредственно во время просмотра аварийных сигналов, при этом запись в журнал вводится простым щелчком мыши. Функция регистрации сбоев имеет двунаправленный интерфейс, отражающий номер записи на экране вывода аварийных сигналов, что способствует улучшению взаимодействия технических специалистов на выезде и персонала эксплуатационного центра. Пользователи могут добавлять к записи поля, а также редактировать записи с учетом конкретной информации.
ОКС7
Функция поддержки общеканальной сигнализации N7 (ОКС7) предназначена для обслуживания сетей ОКС7. Она включает обнаружение каналов с низкой и с высокой загрузкой, также выдается сигнал при обнаружении повышенного процента одновременно нефункционирующих элементов ОКС7.