Россия
В статье произведено исследование методов и алгоритмов компьютерного зрения на основе глубоких свёрточных и рекуррентных нейронных сетей. Обработка изображений с целью их распознавания является одной из центральных и практически важных задач при создании систем искусственного интеллекта. Распознавание лиц на изображениях является классической задачей в компьютерном зрении и самым современным трендом в интеллектуальных системах безопасности и контроля доступа, в авторизации пользователей, организации видеоконференций, робототехнике и биометрии. Рассмотрена эволюция подходов и алгоритмов к решению задач обработки, распознавания и локализации лиц на изображениях с использованием алгоритма Виола-Джонса, свёрточных и рекуррентных нейронных сетей. Рассмотрены технологии восстановления трёхмерного изображения лица по исходному 2Б-изображению нейросетевыми методами. Приведены результаты компьютерных экспериментов работы программы на основе свёрточной и рекуррентной нейронной сети для обнаружения лица, определения возраста, эмоционального состояния человека и наличия маски на лице в видеопотоке реального времени в среде Matlab R2020a. Практическое применение полученных результатов может быть использовано в дистанционном обучении при идентификации личности курсантов и студентов.
распознавание образов, компьютерное зрение, глубокое машинное обучение, алгоритм Виола-Джонса, признаки Хаара, свёрточные и рекуррентные нейросети, эмоциональный искусственный интеллект
1. Студеникин Д.Е., Бован С.Д., Хекерт Е.В., Модина М.А. Использование нейронных сетей для организации визуального наблюдения // Морские интеллектуальные технологии,- 2019 - № 4-3 (46). - С. 91-95.
2. Брилюк Д.В., Старовойтов В.В. Распознавание человека по изображению лица нейросетевыми методами. - Минск, 2002. - 54 с.
3. LeCun Y. Deep Learning Hardware: Past, Present, and Future. IEEE International Solid-State Circuits Conference-(ISSCC), 2019. - 12-19 pp.
4. Клетте P. Компьютерное зрение. Теория и алгоритмы / пер. с англ. А.А. Слинкин. - М.: ДМК Пресс, 2019. - 506 с.
5. Полковникова Н.А., Полковников А.К. Система поддержки принятия решений для выбора режима и прогнозирования отказов главного судового двигателя // Эксплуатация морского транспорта.-2019,-№3(92).-С. 170-180.
6. Полковникова Н.А. Нейросетевые системы автоматического распознавания морских объектов // Эксплуатация морского транспорта. - 2020,- №1(94). - С. 207-219.
7. Белых Е. А. Обучение каскадов Хаара // Вестник Сыктывкарского университета. Сер. 1: Математика. Механика. Информатика,- 2017-Вып. 1 (22).-С. 41-53.
8. Чанг Буй Тхи Тху, Хоанг Фан Нгок, Спицын В.Г. Распознавание лиц на основе применения метода Виолы-Джонса, вейвлет-преобразования и метода главных компонент // Известия Томского политехнического университета-2012.- т. 320,- № 5,- С. 54-59.
9. Шешкус А.В., Маталов Д.П., Арлазаров В.В., Николаев Д.П. Исследование композиции алгоритмов компьютерного зрения, базирующихся на машинном обучении, для решения задачи локализации и классификации объектов // Труды Института системного анализа Российской академии наук- 2019-Т. 69-№ 1. - С. 29-36.
10. Schroff F., Kalenichenko D., Philbin J. FaceNet: A Unified Embedding for Face Recognition and Clustering https://arxiv.org/abs/1503.03832 (Дата обращения 05.08.2020)
11. Слипченко О.О., Клименко С.В., Степанова А.Ю. Использование аппарата нейросетей при распознавании лица // Актуальнi проблеми автоматизацii та iнформацiйних технологiй.-2017.- том 21.- С. 143-151
12. Полковникова Н.А. Система поддержки принятия решений на основе свёрточных нейронных сетей по распознаванию объектов на изображениях // Материалы III международного научнотехнического форума «Современные технологии в науке и образовании» (4-6 марта 2020, Рязань). - Рязань: Рязанский государственный радиотехнический университет имени В.Ф. Уткина, т.5.-с. 108-112.
13. Recent advances on memetic algorithms and its applications in image processing. Editors: Hemanth D.J., Kumar B.V., Karpagam Manavalan G.R. -Springer, 2020. - 199 p.
14. Leskovec J., Rajaraman A., Ullman J.D. Mining of Massive Datasets. - Cambridge University Press, 3rd edition, 2019. - 583 p.
15. Redmon J., Farhadi A. YOL09000: Better, Faster, Stronger. Proceedings of the IEEE conference on computer vision and pattern recognition, 2017. -7263-7271 pp.
16. LeCun Y., Bengio Y., Hinton G. Deep learning. Nature, vol. 521 (7553), 2015.-436-444 pp.
17. Krizhevsky A., Sutskever I., Hinton G.E. Imagenet classification with deep convolutional neural networks. Advances in neural information processing systems, 2012. - 1097-1105 pp.