Аннотация и ключевые слова
Аннотация (русский):
Рассматривается использование нейронных сетей прямого распространения и нечетких нейронных сетей для оценки эксплуатационных состояний элементов систем передачи данных. Для выбора типа искусственной нейронной сети, наиболее полно отвечающей задаче до определения данных для прогнозирования эксплуатационного состояния элементов сетей связи, учитываются факторы, представляемые в количественной форме. Для этого в качестве наиболее значимого фактора, имеющего высокий уровень неопределенности в сетях с пакетной передачей данных, был выбран объем данных, передаваемых через активное оборудование. Прогнозируемые значения, изменения уровня трафика, получаемые в результате работы нейронной сети, позволяют проводить опережающий анализ эксплуатационного состояния оборудования сетей связи. Автоматизация процесса, анализа состояния оборудования предполагает передачу этой функции системе оценки по типовым элементам сетей передачи данных, имеющих схожие эксплуатационные состояния. Это позволяет снизить количество некачественных решений о проведении модернизации и повысить скорость реагирования на предаварийные ситуации.

Ключевые слова:
нейронная сеть прямого распространения, нечеткая нейронная сеть, прогнозирование, система передачи данных, количество слоев, пропускная способность, скорость передачи данных, сигмоидная функция
Текст
Текст произведения (PDF): Читать Скачать

Введение Как описывается в работах [1, 2], одним из важнейших этапов во время принятия решений по ранжированию элементов систем передачи данных (ЭСПД) является прогнозирование их технического состояния на основе анализа критически значимых параметров. Часто изменение подобных параметров можно описать в виде временно́го ряда. Решение задач прогнозирования значений временны́х рядов осуществляется при помощи построения различных моделей. Учитывая сложность структуры систем передачи данных и процессов, которые в них происходят, для идентификации состояния их элементов целесообразно применение теоретических положений, основанных на использовании методов искусственного интеллекта [3, 4]. Подобные методы позволяют выявлять скрытые закономерности, протекающие в объектах моделирования. С учетом анализа работ [5, 6] можно выделить три основных вида подобных методов: на основе нейронных сетей (НС), на основе систем нечеткого вывода (СНВ) и на основе нечетких НС. Ограничением НС является «закрытость» процесса получения итоговой оценки [7]. Ограничением СНВ является сложность адаптации при изменении закономерностей, влияющих на значение итоговой оценки относительно значений входных переменных [7]. В свою очередь, нечеткие НС имеют «прозрачную» структуру, поскольку состоят из фиксированного количества слоев и на первом этапе формируются экспертами, а на последующих этапах использования предусматривают возможность обучения на основе выборок значений. Однако в настоящее время недостаточно изучен вопрос оценки точности прогнозирования значений, формируемых НС и нечеткими НС для решения группы задач, связанных с оценкой трафиковой нагрузки узлов систем передачи данных: этот показатель является одним из важнейших при принятии решений о необходимости модернизации определенного сетевого элемента. Таким образом, целью работы является сравнительный анализ и выбор математического аппарата для решения задачи прогнозирования значений параметров элементов систем передачи данных, поведение которых описывается в виде временно́го ряда. Постановка задачи исследования Наиболее важным параметром при оценке состояния ЭСПД является объем сетевого трафика, передаваемого устройством. Процесс идентификации состояния ЭСПД на основе анализа объемов трафика является этапом обработки информации количественной природы, имеющей некоторую долю неопределенности. На этом основании необходимо решить ряд следующих задач для ранжирования по срокам очередности проведения модернизации (рис. 1): – определить параметры мониторинга ЭСПД, в наибольшей степени отражающие его эксплуатационное состояние по трафику; – определить объемы данных для нейросетевого прогнозирования состояния ЭСПД; – определить метод нейросетевого прогнозирования, позволяющий формализовать опыт экспертов. Рис. 1. Блок-схема оценки состояния элементов систем передачи данных с применением нечетких нейронных сетей Выходные прогнозные значения на основе входных показателей загруженности ЭСПД позволят получить оценку загруженности ЭСПД. Исходя из этого будет определена принадлежность оборудования к конкретной группе с установленной срочностью замены ЭСПД. Подготовка данных С учетом анализа работ [1, 2] и мнения экспертов в области эксплуатации сетей передачи данных в качестве наиболее значимого параметра выбрана скорость передачи данных. Данные мониторинга были получены от программ мониторинга и программных комплексов, входящих в состав OSS/BSS (англ. Operation Support System/Business Support System, система поддержки операций/система поддержки бизнеса) – систем, используемых в области электросвязи [2, 8–15]. Мониторингу подвергалась пропускная способность канала сети передачи данных на эксплуатируемых элементах, которая ограничивается максимальной эффективной пропускной способностью логического канала. Анализируемая пропускная способность включает пользовательский и служебный трафик. Ввиду того, что сеть передачи данных, используя протоколы маршрутизации, может реконфигурироваться, а нагрузка на конкретный ЭСПД может динамично изменяться за краткий отрезок времени, для сбора данных был установлен период, равный четырем суткам. Данные собираются в числовой форме и измеряются в Кбит: d_1 – скорость передачи в первый день мониторинга, Кбит; d_2 – скорость передачи во второй день мониторинга, Кбит; d_3 – скорость передачи в третий день мониторинга, Кбит; d_4 – скорость передачи в четвертый день мониторинга, Кбит; output – прогнозируемое значение скорости передачи, Кбит. На современном этапе развития сетей передачи данных точность, выражаемая в Кбит, достаточна и позволяет избежать представления данных в дробных величинах, за счет чего сокращается время подготовки обучающих и тестовых выборок для последующей загрузки в НС. Из собранных данных были сформированы обучающие и тестовая выборки для тренировки НС. Обучающая выборка включает данные 192 ежесуточных измерений, тестовая – 48. Алгоритм обратного распространения ошибки в нейронной сети прямого распространения Для обучения искусственных нейронных сетей (ИНС) с различным количеством слоев возможно использование метода обратного распространения ошибки, являющегося обобщением правила, используемого в персептроне. Используемая в алгоритме разновидность градиентного спуска позволяет настраивать весовые коэффициенты в направлении минимума. В качестве функции активации алгоритм использует сигмоидную функцию. Как альтернатива сигмоидной функции рассматривались двоичная sign(x) функция и линейная функция с положительным угловым коэффициентом. Однако ограничения в виде большого числа нейронов для вычислений в случае с двоичной функцией и нестабильной сходимости в случае с линейной функцией, по причине отсутствия возможности нормализации, позволили остановить выбор на сигмоидной функции, наиболее часто используемой в гетерогенных ИНС для решения задач прогнозирования [7]: где n – матрица входных векторов. Работа алгоритма обратного распространения ошибки включает следующие этапы: 1. Подготовка собранных данных для обучения (X, Y*), где значение X подается на вход НС, Y* – контрольное значение. 2. Определение выходных данных НС Y = F(X). 3. Расчет ошибки выхода НС. 4. Корректирование весов для минимизации уровня ошибки. 5. Проверка изменения уровня ошибки (выход из цикла при отсутствии изменений). 6. Возвращение к шагу 1 для снижения уровня ошибки до минимального уровня путем прохождения нового цикла. Шаги 1 и 2 – прямое распространение, шаги 3–6 – обратное распространение ошибки по НС. Данные, используемые при работе с ИНС, разделяют на обучающую и тестовую выборки. Тестовая выборка используется для проверки качества обучения сети. В процессе моделирования для одного набора данных были созданы НС прямого распространения с одним и двумя скрытыми слоями. Сеть с одним скрытым слоем состоит из четырех входов, одного выхода и двух слоев (рис. 2). Рис. 2. Нейронная сеть прямого распространения с одним скрытым слоем В скрытом слое содержится 20 нейронов, использующих сигмоидную функцию активации. Нейроны второго слоя настроены на линейную функцию активации, не изменяющую выходной сигнал purelin (n) = (n). Сеть с двумя скрытыми слоями состоит из четырех входов, одного выхода и трех слоев. В скрытых слоях содержатся 10 и 4 нейрона, также использующих сигмоидную функцию активации. Нейрон третьего слоя использует линейную функцию активации (рис. 3). Рис. 3. Нейронная сеть прямого распространения с двумя скрытыми слоями Точность работы, показываемая НС прямого распространения, достаточна для текущей задачи, т. к. при передаче данных допускается размер коэффициента потери пакетов 0,001, установленный на основе рекомендации Международного союза электросвязи Y.1541 в стандарте QoS. Тем не менее в процессе их подготовки к работе требуются значительные временные и вычислительные ресурсы на подбор числа скрытых слоев и количества нейронов в них, для сопоставления результатов моделирования и выявления лучшей комбинации слоев в составе ИНС прямого распространения [16–22]. Нечеткая нейронная сеть Нечеткая НС Сугено – это структура с заранее известным числом слоев, которые не имеют обратных связей. Слои используют весовые коэффициенты и функции активации (рис. 4) [7, 21]. Рис. 4. Схема нечеткой нейронной сети Первый – это параметрический слой, в нем происходит фаззификация входных переменных. При обучении ИНС настраивает параметры этого слоя, вводится нечеткость, т. е. функции принадлежности применяются к значениям входных переменных. Второй, непараметрический, слой служит для агрегирования. Третий, параметрический, слой генерирует функции ИНС μL(d) и перемножает их с весовыми коэффициентами z. Весовые коэффициенты изменяются в процессе обучения сети на основе роста объема входных и выходных данных. В четвертом слое находятся первый нейрон-сумматор f1, рассчитывающий взвешенную сумму сигналов μL(d), и второй нейрон-сумматор f2, рассчитывающий сумму весов z. В пятом, непараметрическом, слое происходит нормализация весовых коэффициентов. Фиксированные Т-нормы и S-конормы или другие непрерывные операции используются для суммирования [7]. Нечеткие НС для определения параметров функций принадлежности используют ретроспективную информацию. Для нахождения значений этих параметров используется обучение. В настоящей работе за основу был взят алгоритм Сугено, позволяющий автоматически определять форму нелинейности функций принадлежности при фаззификации, т. е. введением нечеткости. Это позволяет снизить уровень влияния человеческого фактора за счет отказа от подбора данных исследователем в начале процесса настройки НС. Модель Сугено с числом выходных переменных I и T числом переменных представляется в виде Здесь обобщается на основе функции Гаусса индивидуально для каждой входной переменной и представляет собой функцию фаззификации (1) где – алгебраическое произведение v-го правила: Агрегирование результата с учетом L правил: (2) Формула (2) получит вид где . Весовые коэффициенты zv в формуле (2) интерпретируются по отношению к как значимость компонентов, вычисляемых на основании формулы (1). С использованием классической импликации рассматриваемая модель включает 81 правило. Правила получены в результате комбинирования термов CLUSTER_1, CLUSTER_2, CLUSTER_3, использующих гауссову функцию и отражающих принадлежность анализируемого узла к группам оборудования с «небольшой», «средней» и «высокой» нагрузкой, по каждой из 4-х входных переменных, соответствующих 4-м временным отрезкам, на протяжении которых производились измерения: , где p10, p11, p12, p13, p14, …, p810, p811, p812, p813, p814 – параметры, подбираемые в процессе обучения нечетких НС. В рассматриваемом примере число нечетких продукционных правил устанавливается в процессе обучения нечетких НС. Изменения происходят во втором и третьем слоях, которые отображают нечеткую базу знаний и реализуют алгоритм нечеткого вывода. На рис. 3 приведены примеры графиков зависимостей выходной переменной от входных переменных. а б Рис. 3. График зависимости выходной переменной от входных переменных d2 и d1 (а); d4 и d1 (б) Целесообразно в рамках решаемой задачи определить нечеткие правила, учитывая формирование функций принадлежности на основе гауссовой функции. Данные, используемые при построении модели прогнозирования, представляются как n-мерные массивы , r = 1, 3, …, m, зависимых переменных и независимых переменных, содержащие одномерные наблюдения . Построение модели происходит итеративно, начало нового цикла осуществляется с выбора формата системы нечетких правил. Вычисляются значения истинности правила с условиями вида , где – нечеткие множества, которые соотносятся с термами «CLUSTER_1», «CLUSTER_2», «CLUSTER_3», описывающими принадлежность анализируемого значения b к каждому из кластеров с разной степенью точности, , – функции принадлежности нечетких множеств . Каждый виток цикла включает в себя два шага: 1 шаг. Вычисляется степень принадлежности; n-мерные наблюдения делятся на заданное число кластеров с использованием алгоритма нечеткой кластеризации c-means [7]. Это позволяет относить состояние элемента сети передачи данных к нескольким кластерам, одновременно описывающим разный уровень нагруженности с разной степенью принадлежности. Количество кластеров равно количеству нечетких правил L. 2 шаг. Вычисление коэффициентов линейных уравнений каждого нечеткого правила. Здесь параметры определяются на основе метода наименьших квадратов. Прогнозируемое значение определяется как , где – число, обозначающее уровень истинности правила; – количество нечетких правил. Расчет будет производиться с использованием независимых переменных и , где – номер этапа сравнения правил нечеткой продукции. Здесь метод наименьших квадратов используется на основе линейной модели с коэффициентами. Критериями оценки выступают среднеквадратичная ошибка прогноза ρ, а также средняя абсолютная ошибка : Обучение нечетких НС происходит с использованием разных по количеству нечетких продукционных правил и разными наборами переменных в каждом правиле до формирования минимальной абсолютной процентной ошибки, не превышающей 0,1 %, обусловленной особенностями передачи трафика. В каждой итерации используется одинаковое число нечетких правил, но состав этих правил меняется от итерации к итерации. С каждой новой итерацией система нечетких правил изменяется относительно предыдущей. При каждой новой итерации рассчитываются значения и , значение служит для определения необходимости продолжения процесса. В итоге значения скорости передачи трафика, приходящегося на анализируемый ЭСПД, спрогнозированное нечеткой НС, равное 8 289 900 Кбит, и данные из контрольной выборки 8 283 075 Кбит показали значительную близость, т. к. расхождение между прогнозным и реальным значениями составило 0,08 % (табл.). Сравнение данных для результатов моделирования сетей прямого распространения с 1 и 2-мя скрытыми слоями и нечеткой нейронной сети с фактическими данными измерений № измерения Нейронная сеть (прогноз), Кбит Тестовая выборка (реальные данные), Кбит Расхождение между прогнозным и реальным значениями, % Двухслойная НС 1 8 269 200 8 282 203 0,16 2 8 262 900 8 279 528 0,20 3 8 298 000 8 282 608 0,19 4 8 273 200 8 283 080 0,12 Трехслойная НС 1 8 273 900 8 282 203 0,10 2 8 288 900 8 279 528 0,11 3 8 271 100 8 282 608 0,14 4 8 273 800 8 283 080 0,11 Нечеткая НС 1 8 289 900 8 283 075 0,08 В процессе исследования были получены близкие по значению результаты работы сетей прямого распространения и нечеткой нейронной сети, однако наибольшую эффективность показала нечеткая НС. Заключение Использовать нейронные сети прямого распространения для анализа накопленных данных по состоянию ЭСПД возможно. Тем не менее, увеличение числа слоев может оказать негативное влияние на выбор платформы под реализацию многослойных моделей по причине пропорционально возрастающих требований к производительности аппаратной части. Число слоев и нейронов в слое в ИНС прямого распространения должно определяться высококвалифицированным специалистом по работе с данными. При использовании нечетких нейронных сетей количество слоев известно заранее, поэтому работа с этим видом ИНС упрощается и становится доступна персоналу с более низкой квалификацией. Нечеткие нейронные сети в этом случае за счет введения экспертной составляющей позволят, не используя значительные аппаратные ресурсы, получать схожие по точности прогнозы.
Список литературы

1. Вишневский В. М. Теоретические основы проектирования компьютерных сетей. М.: Техносфера, 2003. 512 с.

2. Райли Д., Кринер М. NGOSS. Построение эффективных систем поддержки и эксплуатации сетей для оператора связи. М.: Альпина Бизнес Букс, 2007. 192 с.

3. Жуков В. Г., Бухтояров В. В. О применении искусственных нейронных сетей с радиальными базисными функциями в задачах обнаружения аномалий в сетевом трафике // Решетневские чтения. 2013. Т. 2. С. 285–286.

4. Чан К. Т., Сорокин А. А. Нечеткая система управления интенсивностью передачи трафика в сетях передачи данных // Изв. Волгогр. гос. техн. ун-та. 2018. № 5 (215). С. 94–101.

5. Квятковская А. Е., Квятковская И. Ю. Агентный подход для разработки системы поддержки принятия решений по оценке стоимости бизнеса, основанной на рассуждениях по прецедентам // Наука и практика: материалы Всерос. междисциплинар. науч. конф. (Астрахань, 16–20 октября 2017 г.). Астрахань, 2017. С. 88–89.

6. Киселева О. И., Шубат О. М. Прогнозирование выручки предприятия: методические подходы и принципы // Российские регионы в фокусе перемен: материалы Междунар. конф. Екатеринбург, 2017. С. 597–604.

7. Хайкин С. Нейронные сети: полный курс. М.: Вильямс, 2008. 1103 с.

8. Морозова Л. А., Хайков К. В. Методы решения управленческих задач в отрасли телекоммуникаций // Научные труды SWORLD. Иваново: ООО «Научный мир», 2015. Т. 16. № 2 (39). С. 22–27.

9. Олейников А. А., Сорокин А. А. Методика поддержки принятия решения в процессе модернизации элементов систем передачи данных // Вестн. Тамб. гос. техн. ун-та. 2018. Т. 24. № 3. С. 446–454.

10. Паклин Н. Б., Орешков В. И. Бизнес-аналитика от данных к знаниям. СПб.: Технологии анализа данных, 2013. 704 с.

11. Проталинский О. М., Ажмухамедов И. М. Моделирование плохо формализуемых процессов в социотехнических системах // Прикладная информатика. 2013. № 4 (46). С. 106–113.

12. Barabanova E., Maltseva N., Kvyatkovskaya I., Beresnev I. Сomputer-Aided Design Software for Buffer Management in Routers // First Conference, CIT&DS 2015 (Volgograd, Russia, September 15–17, 2015). Springer International Publishing, 2015. P. 160–169.

13. Barabanova E. A., Vytovtov K. A., Maltseva N. S., Kravchenko O. V., Kravchenko V. F. Models and algorithms of optical switching systems with decentralized control // 2019 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (2019 ElConRus) (Saint-Petersburg, January 28-31, 2019). Saint-Petersburg, 2019. P. 64–68.

14. Oleynikov A. A., Pishin O. N., Sorokin A. A. Block diagrams of means of gathering information about the state of the subsystem access network of a cellular operator // 2018 International Conference on Actual Problems of Electron Devices Engineering APEDE – 2018 (Saratov, Russia 27–28 Sept. 2018). P. 199–205.

15. Sorokin A. A., Oleynikov A. A., Goryunov A. A. Using fuzzy classification to support decisionmaking during the modernization of the network infrastructure elements // 1st Moscow Workshop On Electronic And Networking Technologies, MWENT-2018 (Moscow, 14–16 марта 2018 г.). Moscow: Institute of Electrical and Electronics Engineers Inc., 2018. P. 1–5.

16. Борисов В. В., Круглов В. В., Федулов А. С. Б82 Нечеткие модели и сети. М.: Горячая линия–Телеком, 2012. 284 c.

17. Гольдштейн Б. С., Кучерявый А. Е. Сети связи пост_NGN. СПб.: БХВ-Петербург, 2014. 160 с.

18. Дмитриев В. Н., Сорокин А. А., Ахмат Ю., Алавади Г. А. Х. Алгоритм выбора места расположения узлов инфокоммуникационной сети, основанный на применении обобщенного показателя качества // Вестн. Астрахан. гос. техн. ун-та. Сер.: Управление, вычислительная техника и информатика. 2015. № 2. С. 71–78.

19. Леоненков А. В. Нечеткое моделирование в среде MATLAB и fuzzy TECH. СПб.: БХВ-Петербург, 2005. 736 с.

20. Люгер Дж. Искусственный интеллект: стратегии и методы решения сложных проблем. М.: Вильямс, 2018. 864 с.

21. Гитман М. Б., Столбов В. Ю., Гилязов Р. Л. Управление социально-техническими системами с учетом нечетких предпочтений. М.: Ленанд, 2011. 272 с.


Войти или Создать
* Забыли пароль?