Abstract and keywords
Abstract (English):
The article discusses the process of planning the repair of energy equipment. Using a decision support system is proposed because of the large number of rules of comparing flow charts of technical defects. Such a system can speed up the planning process and reduce economic costs. A conceptual model of the system has been built; further it will be presented as a multi-label classification of cross-cutting classes. The “one-vs-all” approach has been used: each flow chart can use its individual classifier. Metrics are proposed for evaluating classifiers: a portion of accurately classified objects, precision, fullness and F-measure. To summarize the evaluation results the concept of micro-average was chosen. A defect classification algorithm has been described. An experiment was conducted using different classification algorithms: decision trees, Bayes classifier and multilayer perceptron. The results of the experiment proved that 80-90% of the correctly classified objects were found (high values), but the average values of accuracy and fullness occurred low (3-7%). There were found sets of data, where different output data corresponded to similar input data. Thus, machine learning can be used to support decision-making, but in some cases information about the order is not complete. Defect classification can be combined with manual clarifying of results or with different algorithms.

Keywords:
decision support system, asset management system, flow charts, defects, equipment, repair program, classifier
Text
Publication text (PDF): Read Download

Энергетика является одной из самых важных отраслей промышленности. Отказы в работе энергетических предприятий могут привести как к серьезным экономическим потерям, так и к негативным социальным последствиям. Для того чтобы снизить количество аварийных ситуаций, необходимо постоянное обслуживание и своевременный ремонт энергетического оборудования. Внедрение систем управления производственными активами позволяет сократить риски отказов и провести оптимальное планирование ремонтных программ. Ввиду широкого распространения энергетического оборудования и высокой его стоимости даже незначительная оптимизация процесса может привести к существенному снижению затрат, а также к улучшению условий труда персонала [1]. Для того чтобы спланировать ремонт оборудования, рассматриваются нормативные документы - технологические карты, которые содержат данные о затратах, необходимых при проведении работ; данные об использовании инструментов, машин, механизмов и материалов; о квалификации и объемах трудовых ресурсов, мерах безопасности [2, 3]. Для составления ремонтной программы необходимо сопоставить дефекты оборудования технологическим картам. В некоторых системах управления производственными активами возможен только ручной ввод прямых соответствий между ними. На крупных предприятиях может учитываться большое количество типов оборудования, технологических карт и типовых дефектов; неавтоматизированная работа с такими объемами документов может быть неэффективна по времени и приводить к ошибкам, т. к. требует запоминания большого количества правил. Другая проблема - передача опыта от одного сотрудника к другому. Все это подтверждает актуальность использования системы поддержки принятия решений при составлении ремонтной программы. Вопросам разработки подобных систем посвящены работы [4-15]. Цель разработки - поиск путей снижения экономических потерь за счет повышения эффективности процесса планирования. На первом этапе достижения поставленной цели основной задачей является построение математической модели системы. Концептуальная модель сопоставления Рассмотрим основные сущности, используемые при планировании ремонтной программы. Неисправности определяются типовыми дефектами, характерными для того или иного типа оборудования. Типы оборудования - это конкретные модели, например трансформатор или опора линии электропередач. Технологическая карта - это документ, описывающий выполнение определенных работ. Тогда сопоставление технологических карт дефектам можно представить в виде концептуальной модели , (1) где - подмножество дефектов, выявленных у единицы оборудования, принадлежит множеству типовых дефектов; - подмножество технологических карт для устранения данных дефектов. Эту концептуальную модель можно представить как задачу классификации с пересекающимися классами (multi-label classification) [16], т. к. возможно соответствие набора дефектов нескольким технологическим картам (рис. 1). Рис. 1. Задача классификации с пересекающимися классами Для решения задачи используют подход «один против всех» (one-vs-rest), где для каждого класса создается свой бинарный классификатор. Далее математическая модель была проверена на наборе данных о назначении технологических карт дефектам из системы управления производственными активами. Данные состояли из информации о единице оборудования, наборе дефектов в заказе и назначенных технологических картах. Вычисление коэффициента корреляции Пирсона показало корреляционную связь появления технологической карты при наличии дефекта в заказе на ремонт. Проверка адекватности модели Дальнейший этап разработки системы поддержки принятия решений - поиск эффективного классификатора. Данные заказов на ремонт разбиты на тестовую и обучающую выборки. Модель классификации была протестирована на нескольких классификаторах: деревьях принятия решений, байесовском классификаторе и многослойном персептроне [17-20]. На основе подхода «один против всех» для каждой технологической карты создан классификатор, обученный на заказах, для определения необходимости использования технологической карты при данном наборе дефектов. Для оценки работы классификаторов были вычислены метрики: доля верно классифицированных объектов, точность, полнота и F-мера [18]. Для вычисления метрик необходимо рассчитать следующие показатели: TP - количество истинно-положительных срабатываний классификатора, TN - количество истинно-отрица-тельных, FP - количество ложно-положительных, FN - количество ложно-отрицательных. Тогда доля верно классифицированных объектов рассчитывается следующим образом: . Точность вычисляется как доля документов, действительно принадлежащих данному классу, относительно всех документов, которые система отнесла к этому классу: . Полнота рассчитывается как доля найденных классификатором документов, принадлежащих классу, относительно всех документов этого класса в тестовой выборке: . F-мера вычисляется как гармоническое среднее между точностью и полнотой: . Для обобщения результатов всех классификаторов выбрана концепция микро-усреднения (значения метрик всех классификаторов усредняются). Таким образом, алгоритм классификации дефектов состоял из нескольких этапов. Данные сгруппированы по номеру заказа ремонтной программы. Неполные данные без дефектов или технологических карт исключены из множества. Повторяющиеся заказы также исключены. Далее множества дефектов и технологических карт были упорядочены и представлены в виде логической матрицы. Каждая строка матрицы содержит информацию о заказе. Первые N столбцов матрицы соответствуют дефектам, следующие M столбцов - технологическим картам. Значение «истина» соответствует наличию данного дефекта или технологической карты в заказе, «ложь» - отсутствию (рис. 2). Рис. 2. Пример логической матрицы для классификации На следующем этапе вычислен коэффициент корреляции между дефектами и каждой технологической картой. Затем для каждого классификатора (деревья принятия решений, байесовский классификатор, многослойный персептрон) произведено обучение и сбор метрик оценки точности классификаторов (рис. 3). Рис. 3. Алгоритм классификации Результаты исследования Все классификаторы показали высокий процент правильно классифицированных объектов - около 80-90 %. Однако средние значения остальных метрик оказались низкими (3-7 %) (рис. 4-6). Рис. 4. Сравнение значений F-меры для разных классификаторов Рис 5. Доля верно классифицированных объектов и F-мера для различных технологических карт в выборке Рис. 6. Значение F-меры для разных технологических карт при классификации деревьями принятия решений Для объяснения такого разрыва значений метрик результаты классификации проанализированы более подробно. Проведено обучение на всей выборке. Средние значения метрик выросли, но не превышали 70 % для точности и 40 % для полноты и F-меры. Даже с учетом эффекта переобучения для некоторых технологических карт полнота и точность классификаторов остались нулевыми. Анализ показал, что в некоторых заказах один и тот же набор дефектов приводит к отличающимся наборам технологических карт. Эти данные могут быть уточнены, если добавить в модель информацию о типе оборудования, что повысит эффективность классификации. Но для части данных существуют заказы, в которых для одного и того же набора дефектов и типа оборудования используются разные технологические карты. Таким образом, машинное обучение может быть эффективным способом поддержки принятия решений, но невозможно автоматизировать процесс составления ремонтной программы только с его помощью. В некоторых случаях необходимо комбинирование алгоритма с другими методами либо уточнение результатов работы классификаторов пользователем системы. Заключение Машинное обучение может быть эффективным способом поддержки принятия решений, но не позволяет полностью автоматизировать процесс составления ремонтной программы. Неравномерное распределение технологических карт в заказах, недостаточный объем выборки, конфликтующие сэмплы снижают эффективность алгоритма. Для решения этой проблемы в процессе развития системы могут быть использованы эвристические алгоритмы, исключающие неэффективные бинарные классификаторы. Кроме того, при обнаружении низких значений метрик или наличии конфликтующих сэмплов решение о выборе технологических карт может производиться пользователем системы - накопление данных в процессе эксплуатации системы и последующее переобучение могут повысить эффективность классификаторов.
References

1. Protalinskiy O. M., Protalinskiy I. O., Kladov O. N. Sistema optimal'nogo upravleniya proizvodstvennymi aktivami energeticheskih predpriyatiy // Avtomatizaciya i IT v energetike. 2017. № 4 (93). S. 5-8.

2. Yaschura A. I. Sistema tehnicheskogo obsluzhivaniya i remonta energeticheskogo oborudovaniya: sprav. M.: NC ENAS, 2006. 491 s.

3. Metodicheskie ukazaniya po razrabotke tehnologicheskih kart i proektov proizvodstva rabot po tehnicheskomu obsluzhivaniyu i remontu VL // PAO «FSK EES». URL: http://www.fsk-ees.ru/upload/docs/ STO_56947007-29.240.55.168-2014.pdf (data obrascheniya: 30.04.2019).

4. Shurshev V. F., Kochkin G. A., Kochkina V. R. Model' sistemy podderzhki prinyatiya resheniy na osnove rassuzhdeniy po precedentam // Vestn. Astrahan. gos. tehn. un-ta. Ser.: Upravlenie, vychislitel'naya tehnika i informatika. 2013. № 2. S. 175-183.

5. Zvezincev A. I., Kvyatkovskaya I. Yu. Primenenie modificirovannogo algoritma geneticheskogo programmirovaniya dlya identifikacii matematicheskih modeley putem rasshireniya obuchayuschego mnozhestva iskusstvennoy neyronnoy set'yu // Vestn. Astrahan. gos. tehn. un-ta. Ser.: Upravlenie, vychislitel'naya tehnika i informatika. 2013. № 2. S. 58-65.

6. Orehova T. P., Kvyatkovskaya I. Yu. Funkcional'naya podsistema upravleniya osnovnymi sredstvami ASUP energosetevoy kompanii // Vestn. Astrahan. gos. tehn. un-ta. Ser.: Upravlenie, vychislitel'naya tehnika i informatika. 2012. № 1. S. 49-55.

7. Protalinskiy O. M., Hanova A. A., Scherbatov I. A., Protalinskiy I. O., Kladov O. N., Urazaliev N. S., Stepanov P. V. Ontologiya processa upravleniya remontami v elektrosetevoy kompanii // Vestn. Mosk. energet. in-ta. 2018. № 6. S. 110-119.

8. Byaleckaya E. M., Kvyatkovskaya I. Yu. O principah kognitivnogo modelirovaniya slozhnyh sistem // Vestn. Astrahan. gos. tehn. un-ta. 2006. № 1 (30). S. 116-119.

9. Shurshev V. F., Demich N. V. Issledovanie algoritma kompleksnogo evolyucionnogo metoda, primenyaemogo v komp'yuternoy sisteme podderzhki prinyatiya resheniya o vybore sostava holodil'nyh agentov, s pomosch'yu vychislitel'nyh eksperimentov // Vestn. Astrahan. gos. tehn. un-ta. 2006. № 1 (30). S. 141-146.

10. Protalinskiy O. M., Protalinskaya Yu. O., Protalinskiy I. O., Scherbatov I. A., Kladov O. N. Sistema upravleniya proizvodstvennymi aktivami predpriyatiy energetiki EAMOptima // Avtomatizaciya i IT v energetike. 2018. № 9 (110). S. 24-26.

11. Lisin I. Yu., Korolenok A. M., Kolotilov Yu. V., Karlina E. P., Shurshev V. F. Sistemnyy analiz informacionnyh potokov tehnicheskoy dokumentacii dlya podderzhki resheniy pri planirovanii remontnyh rabot // Territoriya Neftegaz. 2018. № 11. S. 12-17.

12. Shurshev V. F., Demich O. V. Ispol'zovanie metoda samoorganizacii poiska v zadache podderzhki prinyatiya resheniya pri opredelenii komponentov sistemy energoucheta // Vestn. Kuzbas. gos. tehn. un-ta. 2005. № 5. S. 25-27.

13. Kvyatkovskaya I. Yu. Etapy problemno-orientirovannoy metodologii podderzhki prinyatiya upravlencheskih resheniy dlya slabostrukturirovannyh problem // Vestn. Astrahan. gos. tehn. un-ta. Ser.: Upravlenie, vychislitel'naya tehnika i informatika. 2009. № 1. S. 60-65.

14. Shadlov D. V., Galimova L. V., Homenko T. V., Shurshev V. F. Formalizaciya algoritma prinyatiya resheniy pri opredelenii ocherednosti proizvodstva remontnyh rabot // Remont. Vosstanovlenie. Modernizaciya. 2018. № 4. S. 36-39.

15. Umerov A. N., Shurshev V. F. Metody i programmnye sredstva approksimacii eksperimental'nyh dannyh // Vestn. Astrahan. gos. tehn. un-ta. 2005. № 1. S. 97-104.

16. Multi Label Text Classification with Scikit-Learn // Towards Data Science. URL: https:// towardsdatascience.com/multi-label-text-classification-with-scikit-learn-30714b7819c5 (data obrascheniya: 30.04.2019).

17. Segaran T. Programmiruem kollektivnyy razum. SPb.: Simvol-Plyus, 2008. 368 s.

18. Hackeling G. Mastering Machine Learning with scikit-learn. Packt Publishing Ltd, 2014. 238 p.

19. Rassel C., Norvig P. Iskusstvennyy intellekt: sovremennyy podhod: 2 izd. M.: OOO «I. D. Vil'yams», 2016. 1408 s.

20. Kruglov V. V., Dli M. I., Golunov R. Yu. Nechetkaya logika i iskusstvennye neyronnye seti. M.: Fizmatlit, 2001. 201 s.


Login or Create
* Forgot password?