УДК 61 Медицина. Охрана здоровья
ГРНТИ 76.75 Социальная гигиена. Организация и управление здравоохранением
ОКСО 32.04.01 Общественное здравоохранение
ББК 51 Социальная гигиена и организация здравоохранения. Гигиена. Эпидемиология
ТБК 5706 Социальная гигиена и организация здравоохранения
BISAC HEA000000 General
Рассмотрен вклад больших данных, для анализа и прогноза вспышек эпидемий, описаны методы обработки больших данных для выполнения этих целей. Проанализирована значимость обработки больших данных поисковых запросов, для медицинской сферы. Выявлены преимущества и недостатки использования данной технологии
большие данные, обработка, прогноз, анализ, эпидемия
Актуальность обработки больших данных в медицине и здравоохранении
Технология больших данных нашла применение во многих сферах деятельности, в том числе и в медицине, это обусловлено огромным объемом накопленной информации с момента появления ЭВМ и глобальной сети интернет. Наглядным примером использования больших данных является переход медкарт с бумажного вида в цифровой, который начался с 2014 года и планирует быть завершенным к 2024 году. По данным 2016 года, затраты в России на ЭМК составляли 0,25% от мирового рынка. Так в соответствии с документом "Перечень поручений по итогам заседания президиума Государственного совета" (утв. Президентом РФ 12.12.2019 N Пр-2549ГС), необходимо обеспечить поэтапный переход на ведение медицинской документации в форме электронных документов.
Одним из важнейших проектов в области медицины является “Цифровизация здравоохранения: современный контур” в котором перспективным, в экономическом плане, направлением является возможность предотвращения заболеваний, а не финансовые выплаты по уже осуществленным медицинским вмешательствам [2].
Исследование в здравоохранении Американского колледжа кардиологии (American College of Cardiology) показали большое количество направлений в развитии цифрового здравоохранения и многочисленные взаимосвязи между данными направления и направлениями в управлении большими данными, а также направлениями персонализированной медицины (рис.1)[7].
Рис. 1 Актуальные направления в области здравоохранения.
Методы обработки больших данных используемые при прогнозировании
Особо важно при осуществлении прогноза использовать достоверные и актуальные данные. На текущий момент медицина использует чаще всего пассивный метод прогнозирования – сбор данных на местах. Поскольку данные обрабатываются на местах, то это увеличивает задержку распространения полученных результатов на длительный срок.
Для выполнения прогноза необходимо учитывать множество факторов: перечень заболеваний, симптомы заболеваний, локализация эпидемий или пандемий, число заразившихся людей, смертность, период последних пандемий, климат в местах распространения и многое другое. Для сохранения такого объема данных невозможно использовать централизованную систему, именно поэтому следует выполнять обработку больших данных с использованием распределенной системы. Зачастую для прогнозирования может быть использована реакция пользователей глобальной сети на первые случаи заболеваемости в их регионах, поскольку очень часто люди ищут ответы на интересующие их вопросы в сети с помощью поисковых систем.
Фактически вся информация используемая в медицине представляет собой большой объем текстовых данных. Для выполнения поставленной задачи необходимо сначала выполнить преобразование информации к виду пригодному для обработки, этот процесс включается в себя 4 этапа: токенизацию, стемминг, удаление стоп-слов, и создание словаря-коллекции. В случае, когда информация представлена в ином виде необходимо выполнить её преобразование в текст, либо использовать методы для обработки исходного типа данных, эти данные помогут в дальнейшем сложить более четкую картину эпидемиологической ситуации.
После первичной обработки текста происходит определение важности каждого слова, и задача ранжирования документов. Очень важно после выполнения этих действий сгруппировать объекты по определенным критериям, для этого может использоваться один или несколько методов кластеризации. Существует большое количество методов, но в медицине следует использовать метод нечеткой кластеризации «FCM», поскольку множество симптомов и характеристик могут быть присуще различным болезням [1].
Преимущества и недостатки использования технологии больших данных в сфере
медицины и здравоохранения
Рассматривая преимущества можно выделить следующее:
1. Введение больших данных в медицину позволит сократить финансовые затраты на устранение эпидемиологической ситуации, поскольку, зная прогноз, медицинские учреждения находящиеся удаленно от места распространения смогут подготовиться. Затраты на устранение последствий всегда больше, чем затраты на подготовку к “борьбе” с эпидемией.
2. Работа с данными которые систематизированы, поможет увеличить производительность персонала медицинских учреждений
3. Данные, хранящиеся в электронном виде, не подлежат износу со временем, это помогает осуществить большой временной охват, что поможет для работы системы.
Недостатки:
1. Требуется учитывать множество характеристик для выполнения прогноза, поэтому необходимо, чтобы данные были взяты из достоверных источников, что ограничено законодательным уровнем. Так если рассматривать данные из поисковых систем, то нельзя полностью полагаться на их достоверность, поскольку люди зачастую склонны к панике и часто делают неправильные выводы. Этот недостаток можно компенсировать, объединив данные и осуществив их комплексный анализ.
2. Сложность фильтрации данных.
3. Сложность перевода данных из любого вида (видео, звук и т.д) в текстовую информацию, поскольку объем такой информации достаточно велик.
4. Сложность работы с нечеткими методами кластеризации.
5. Необходимость защиты мест, где будут обрабатываться данные, сертифицированными средствами.
6. Необходимость получения разрешения пациентов на обработку их персональных данных.
Заключение. Обработка больших данных на текущий момент времени, это одно из наиболее перспективных направлений не только в области медицины, но и в других сферах. Для того чтобы выполнить эпидемиологическое прогнозирование необходимо не только собирать данные на местах, но и делиться ими с другими медицинскими организациями, при помощи единого пула информации. Для обработки этих данных необходимо получение разрешения у пациентов, эту процедуру можно совместить с переходом медицинских карт в электронный формат.
1. Благирев А. Big data простым языком. М.: Издательство АСТ, 2019.
2. Инновации в России – неисчерпаемый источник роста / Алябьев С., Голощапов Д, Клинцов В, Кузнецова Е, Рот Э, Сергиенко Я, Трощенко Ю, Чалабян А, Шуваев А. // Центр по развитию инноваций McKinsey Innovation Practice. 2018 г.
3. Ижунинов, М. А. Big Data в здравоохранении // Молодой ученый. 2019. №50 (288). С. 8-10.
4. Карнаухов Н.С, Ильюхин Р.Г. Возможности технологии “Big data” в медицине // Системы поддержки принятия решений. 2019. №1. С. 59-62.
5. Нечипорук. Д.В. Д.В. Особенности технологии Data mining // Молодой исследователь Дона. 2017. №1(4). С. 62-65.
6. Чехарин Е.Е. Большие данные – Большие проблемы // Перспективы науки и образования. 2016. №3(21). С. 7-11.
7. Bhavnani S., Hayek S.S., Druz R.S., Krumholz H. 2017 Roadmap for Innovation - ACC Health Policy Statement on Healthcare Transformation in the Era of Digital Health, Big Data, and Precision Health // Journal of the American College of Cardiology. November 2017.