POSSIBILITIES OF APPLICATION MACHINE LEARNING METHODS IN SOLVING ANALYTICAL PROBLEMS IN METALLURGICAL INDUSTRY
Abstract and keywords
Abstract (English):
Background. Machine learning is a promising field for organization in the age of development of high-tech methods of management and organization of the company. As a rule, this term is used in relation to artificial intelligence, namely, machines that could learn independently. Thus, the main goal of this work is to assess the prospects for using these methods for solving various problems in a corporation. Methods. The article introduces the main methods of machine learning, their analysis, linear and non-linear learning methods are given, their use in practice is indicated, and the key advantages of using a trained artificial intelligence in a company are identified. Result. As a result, the author proposes ways of using machine learning methods in a firm, analyzes their advantages and disadvantages, identifies the problems of implementing artificial intelligence learning opportunities in practice.

Keywords:
Machine learning, learning with teacher, metallurgical industry
Text

В настоящее времени машинное обучение, которое основано на сборе и анализе данных, а также искусственный интеллект — это работающая технология, которая решает все больше задач в самых разных отраслях.

Машинное обучение — это особый класс методов искусственного интеллекта, характерной чертой которого является не прямое решение задач, а обучение в процессе применения решений множества сходных задач. Основная идея заключается в том, чтобы машина не просто использовала заранее известный алгоритм, а самостоятельно принимала решения для поставленной задачи. Раздел машинного обучения образовался в результате науки о нейросетях и математической статистики.[7] Типы обучения представлены на рисунке 1.

 

 

Рисунок 1 – Типы машинного обучения

Источник: составлено авторами

 

Как правило, машинное обучение — это основной метод искусственного интеллекта, предполагающий обучение на основе данных, но для этого необходимы особые требования. Полное решение должно быть автоматизировано с точки зрения идентификации данных, тестирования данных и принятия решений на основе тестирования данных. Помимо машинного обучения искусственный интеллект может включать в себя дополнительные методы, жестко запрограммированные и логические правила. С другой стороны, машинное обучение обычно включает в себя ручную идентификацию и тестирование данных специалистом по данным, а также принятие человеческими решениями о том, как применять полученную информацию.

Машинное обучение подразделяется на две большие категории: машинное обучение с учителем и без учителя.

Наиболее известные методы – обучение с учителем, где пользователь предоставляет алгоритм пары объект-ответ и уже алгоритм самостоятельно находит способ получения ответа по объекту.

Основные методы машинного обучения представлены на рисунке 2.

 

Рисунок 2 - Методы машинного обучения

Источник: составлено авторами

 

При обучении с учителем имеются входные данные, которые необходимо протестировать, чтобы определить результат. Это похоже на то, как в традиционных терминах статистики существует ряд независимых переменных, которые тестируют, чтобы определить связь с зависимой переменной.

Алгоритм обучения с учителем совершенствуются на парах объект-ответ, так как именно учитель указывает алгоритму ответ в обучающихся наблюдениях. В отличии от алгоритмов обучения с учителем, алгоритмы без учителя состоят только из объектов и, как правило, их сложнее оценить.[8]

При обучении без учителя имеются только входные данные, и вы хотите узнать больше о структуре данных. Несмотря на различия между методами машинного обучения, для всех методов важно предоставить входные данные в формате, который будет понятен компьютеру.

В таблице 1 показано различие между этими двумя категориями, а также основные методы внутри каждой категории.

 

Таблица 1 - Сравнение машинного обучения с учителем и без учителя

Тип проблемы

 

Линейные методы

Нелинейные методы

«С учителем»

Регрессионные

Гребневая регрессия

Метод наименьших квадратов

LASSO

Наказанные регрессии

LARS

Эластичные сети

Классификационные

Метод опорных векторов

Дерево решений

Дерево классификаций

Дерево регрессии

Random forests

«Без учителя»

 

Кластерные методы: К- и Х- решения, иерархия основных компонентов, глубокое обучение

 

Источник: составлено авторами

 

Регрессионное машинное обучение - группа методов, наиболее близких к тем, которые обычно применяются при традиционном определении причинно-следственной связи между переменными. Например, для предприятий, в том числе металлургических, возможно использовать описание традиционного уравнения линейной регрессии для оценки кредитных рисков как зависимой переменной, например, риском невозврата кредита, который затем пытаются объяснить с помощью ряда независимых переменных, которые должны влиять на риск невозможности обслуживания кредитных займов.[1] Эти независимые переменные могут включать финансовые показатели, такие как период оборота кредиторской задолженности, коэффициенты ликвидности, коэффициент финансового рычага.

Регрессионное машинное обучение отличается от традиционной регрессии тем, что в нем используются методы регрессии, которые позволяют использовать большое количество переменных в качестве независимых переменных, а затем автоматически отсеивать их, если они не обладают объяснительной силой. Это необходимая функция из-за большого количества данных, доступных специалисту по обработке данных. Также данная методика способствует сокращению объема теоретических построений, необходимых для определения подходящих независимых переменных. Таким образом, регрессия LASSO с нулевым весом оценивает независимые переменные с низкой объясняющей силой, в то время как регрессия Риджа дает более низкие веса переменным в модели, которые сильно коррелированы с другими переменными в модели. В обоих случаях результатом является сокращенная модель, которая позволяет специалисту по обработке данных перейти от большого количества потенциальных независимых переменных к меньшему подмножеству. Регрессия LARS работает в противоположном направлении по сравнению с LASSO и Ridge, первоначально обнуляя все переменные и добавляя только те переменные, которые, как показано, имеют объяснительную силу.[2] Ряд компаний предлагают интересное применение этого набора методов, применяя метод регрессии LASSO, среди прочего, для разработки автоматической системы советов по инвестиционной торговле, основанной на анализе тенденций движения акций и демонстрируя, что этот метод улучшил торговую производительность по сравнению с традиционные методы. Так же метод регрессии LASSO используется для обслуживания коммерческих рисков, определяя степень отклонения ценообразования предприятия от текущих цен на рынке.

Анализ главных компонентов и регрессия методом частичных наименьших квадратов очень похожи в том смысле, что оба они направлены на уменьшение количества переменных путем комбинирования переменных и извлечения общих факторов. Анализ главных компонентов является более популярным из двух, поскольку он широко используется в традиционной статистике и поэтому лучше понимается.

Другой основной категорией обучения с учителем является «классификация», причем машины опорных векторов и деревья решений являются наиболее популярными методами в этой группе. [6] Результаты и визуальные эффекты деревьев решений легко понять на практике и, следовательно, поддаются объяснению специалистам, не занимающимся данными. Известное применение техники дерева решений - перспективы выживания Титаника. Исходя из исходной статистики ствола дерева, согласно которой 62 процента пассажиров погибли и 38 процентов пережили катастрофу на Титанике, мы можем построить дерево решений для классификации групп, у которых был больший или меньший шанс на выживание. Таким образом, первая классификация того, является ли пассажир мужчиной или женщиной, показывает, что выжили только 19 процентов мужчин и 74 процента женщин. Мы можем расширить дерево еще дальше, например, посмотрев на возрастные группы ниже первого мужского и женского деления, и это показывает - несмотря на то, что выжило только 19 процентов мужчин, мальчики в возрасте до 6 лет имели шанс выживания 67 процентов. Такой классификационный подход к созданию подгрупп помогает понять, какие характеристики определяют результаты. Кроме того, дерево решений можно использовать в как метод отслеживания экологических рисков, классифицируя возможные влияния на экологию металлургических компаний, таким образом определив наиболее существенные и наиболее возможные риски, чтобы в дальнейшем проводить работы по их оптимизации.

Глубокое обучение и нейронные сети считаются передовыми технологиями машинного обучения и часто классифицируются отдельно от уже описанных методов машинного обучения. Интуиция, лежащая в основе этих методов, состоит в том, чтобы более точно моделировать сложные отношения между переменными и в итоге лучше имитировать процесс принятия решений человеком. В этом смысле эти методы наиболее близки к реальным методам искусственного интеллекта, хотя в них все еще отсутствуют некоторые функции идентификации данных и автоматизации, необходимые для настоящего искусственного интеллекта. Ключевой особенностью глубокого обучения является добавление «скрытых слоев» после этапа входных данных, которые позволяют определять множественное и комбинированное влияние между входными переменными с помощью моделирования. По мере прохождения входных данных через скрытые уровни переменные объединяются и рекомбинируются в новые факторы, взвешенные по влиянию предыдущего слоя. Добавление скрытых слоев между вводом и выводом — это то, что создает воспринимаемую проблему с глубоким обучением - процесс является «черным ящиком», поскольку не всегда ясно, как вводные данные привели к выводу.[3] Это имеет очевидные последствия для использования в управлении рисками, где само присутствие черного ящика в центре принятия решений может быть собственным источником риска в фирме.

Посредством применения методов машинного обучения в бизнес-сфере возможно достичь сокращения издержек, таких как расход денежных средств, человека-часов, времени.

Преимущества применения машинного обучения представлены на рисунке 3.

 

Рисунок 3 – Преимущества применения машинного обучения

Источник: составлено авторами

 

Рассмотренные методы машинного обучения имеют разные области применимости, разные требования к набору входных данных и типу параметров, разные вычислительные характеристики и уровень потребления памяти. Использование данных методов будет также давать различный результат, следовательно, для каждой задачи необходимо использовать свой метод машинного обучения, который может включать в себя множество методов с последующим объединением результатов при принятие итогового решения.[9]

При использовании методов машинного обучения на корпорации необходимо придерживаться установленного алгоритма (рисунок 4).

 

Рисунок 4 – Алгоритм использования методов машинного обучения

Источник: составлено авторами

 

Современное производство должно представлять собой автоматизированный технологический и бизнес-процесс, который позволит сокращать затраты на единицу продукции, брак, поломки, простои оборудования, общую производительность и эффективность. Области применения методов машинного обучения в производственных компаниях достаточно много, основные представим на рисунке 5.

 

Рисунок 5 – Области применения методов машинного обучения в металлургии

Источник: составлено авторами

 

Наиболее распространенные типы проектов на базе технологий машинного обучения применяемые в металлургической промышленности представлены далее (рисунок 6).

Машинное обучение может показывать хорошие результаты на любых задачах с большим объемом структурированных данных, для этого необходимы специалисты нового типа, способные работать с современными технологиями.

 

Рисунок 6 – Направления внедрения машинного обучения в металлургической промышленности

Источник: составлено авторами

 

Применяя машинное обучение в металлургической промышленности, можно достичь улучшения показателей качества выпускаемой продукции, так как машинное обучение позволяет определить оптимальный алгоритм формирования результатов и предоставить данные для интеллектуального анализа. [4] Также стоит отметить, что применение машинного обучения актуально и при формировании логистических цепочек поставок. Для улучшения показателей логистики в настоящее время активно применяется искусственный интеллект, например, для анализа показателей эффективности складских сотрудников, вырабатывая соответственно их эффективности требования по скорости и качеству укладки, создавая для них верхний и нижний перцентили качества работы и позволяя легко и беспристрастно контролировать качество работы сотрудника, и варьируя, соответственно этому качеству, его заработную плату, а также оценивая целесообразность продолжения с ним трудовых отношений.

Методы машинного обучения так же возможно применять для работы с персоналом. Искусственный интеллект способен заменить ряд должностей и минимизировать затраты, связанные с содержанием персонала. Применение методов машинного обучение упрощает все бизнес-процессы организации от приема на работу новых сотрудников, то перевозки выпускаемой продукции конечным потребителям. Аналогично анализ данных весьма значительно сокращает затраты в области управления персоналом, так, например, активно ведётся работа по разработке автоматизированного искусственного интеллекта, который можно будет применять для вакансий, где личные характеристики кандидата не столь важны. Согласно плану, робот-рекрутер сможет собирать резюме на необходимую вакансию, отбирать наиболее подходящие из них, производить автоматический обзвон, и набирать работников.[5] Интеллектуальная автоматизация позволяет улучшить эффективность рекрутеров, взяв на себя функции предварительного отбора кандидатов через тотальное сканирование баз данных и отбора нужных анкет по заданным критериям.

В заключение хотелось бы отметить, что несмотря на актуальность внедрения машинного обучения на металлургическом предприятии, существует ряд проблем, которые корпорациям только предстоит решить. Обучение машин, как с учителем, так и без учителя, требует определенных затрат, которые могут быть не доступны по разным причинам: начиная от качественного оборудования, места для хранения и заканчивая профессиональными специалистами в данной отрасли. Одной из ключевых проблем, которые возникают на истоках формирования стратегии оптимизации деятельности компании с помощью машинного обучения, является проблема понимания. Для внедрения искусственного интеллекта необходимо четко понимать задачи, которые стоят перед компанией, чтобы корректно построить модели. Корректно построенная модель здесь – это модель, которая отвечает поставленным задачам и соответствует требуемым характеристикам. Помимо этого, менеджерам необходимо рассчитывать ресурсы для внедрения машинного обучения, которые могут быть внушительными, что зависит от изначальной цели внедрения данной технологии на предприятии. Искусственный интеллект требует грамотных специалистов по data science, мощной инфраструктуры и достаточного количества денежных ресурсов на поддержку и развитие технологии. С помощью вышеперечисленных факторов внедрение машинного обучения на предприятии не будет являться проблемой, а поможет решить ряд проблем, связанных с обработкой информации или оптимизации технологических процессов.

References

1. Introducing to Machine Learning Algorithms: Linear Regression. [Electronic resource] // URL: https://towardsdatascience.com/introduction-to-machine-learning-algorithms-linear-regression-14c4e325882a

2. Tibshirani, R. The lasso problem and uniqueness / R. Tibshirani. - Electronic. Journal of Statistics 7, 2013

3. Deep Learning and Machine Learning in Azure [Electronic resource] // URL: https://docs.microsoft.com/ru-ru/azure/machine-learning/concept-deep-learning-vs-machine-learning

4. V. V. Vyugin "Mathematical foundations of machine learning and forecasting", 2015, p.201

5. Melnik, M. V. Modernization of accounting, analytical and control processes in the context of digitalization of the economy / M. V. Melnik, A. E. Suglobov // Problems of Economics and Legal Practice. - 2021. - T. 17. - No. 2. - S. 117-126.

6. Suglobov, A. E. Network model of the Russian national innovation system: formation and development / A. E. Suglobov, E. V. Smirnova. - 2nd edition, revised and enlarged. - Moscow: Publishing House "Infra-M", 2018. - 145 p. - (Scientific thought). - ISBN 978-5-16-013745-2.

7. Tikhonovskaya ID, Obukhov OV, Determination of methodological principles of management of the system for providing a metallurgical enterprise with ferrous metal scrap // ETAP. 2017. No. 3. URL: https://cyberleninka.ru/article/n/opredelenie-metodologicheskih-printsipov-upravleniya-sistemoy-obespecheniya-metallurgicheskogo-predpriyatiya-lomom-chernyh

8. M.H. Kutner C.J. Nachtsheim, J. N. Applied Linear Regression Models / J. N. M. H. Kutner, C.J. Nachtsheim. - McGraw-Hill Irwin, 2004.

9. B. David “Bayesian Reasoning and Machine Learning”, p. 113, 2016

10. Characteristics of the innovation development of Russia's industrial enterprises under conditions of economic sanctions / M. Y. Veselovsky, N. S. Khoroshavina, O. A. Bank [et al.] // Journal of Applied Economic Sciences. - 2017. - Vol. 12.- No 2 (48). - P. 321-331.

11. Scenarios of Future Development of the Modern Digital Economy: Technical Progress vs / S. V. Lobova, A. V. Bogoviz, A. E. Suglobov [et al.] // Modern Global Economic System: Evolutional Development vs. Revolutionary Leap: Lecture Notes in Networks and Systems (LNNS, Volume 198). - Cham: Springer Nature, 2021. - P. 1170-1178.

12. Foulds J., Eibe F. A Review of Multi-Instance Learning Assumptions. Knowledge Engineering Review, 2010, vol. 25, no. 1, pp. 1-25. DOI: 10.1017

13. Frontier Information Technology and Systems Research in Cooperative Economics. - Heidelberg: Springer International Publishing, 2021. - 1124 p. - (Studies in Systems, Decision and Control). - ISBN 978-3-030-57830-5. - DOI 10.1007 / 978-3-030-57831-2.

14. Oracle: Machine Learning Adaptive Analysis: The Future of Cybersecurity (URL: https://www.oracle.com/a/ocom/docs/ai-security_whitepaper.pdf)


Login or Create
* Forgot password?