VAC 14.01.1930 Геронтология и гериатрия
UDK 61 Медицина. Охрана здоровья
GRNTI 76.03 Медико-биологические дисциплины
OKSO 31.08.31 Гериатрия
BBK 57 Клиническая медицина
TBK 5106 Прикладная информатика
TBK 57 Медицина. Фармакология
BISAC MED032000 Geriatrics
A new approach to the construction of a diagram of human aging is presented, based on the shift of emphasis from the visual display of a graph to its computer analysis. The disadvantages of the old approach and the advantages of the new one are shown. On the basis of the new approach, the graphical system “AgeMap” was created and the statistical analysis of the graph of human aging, consisting of 2200 nodes, was carried out. The prospect of further application of this system is shown.
systems analysis, graphs, aging schemes, human, Python, NetworkX, Gephi
Данное сообщение является логическим продолжением предыдущих моих сообщений на эту в данном сборнике [1, 2]. В настоящее время продолжается интенсивное накопление новой информации по разным проблемам старения животных и человека. Однако, к большому сожалению, за уже более чем столетнюю историю научного изучения процессов старения это пока не нашло какого-то заметного практического выхода в плане увеличения продолжительности жизни человека. Причин этому много и одна из них, на мой взгляд, заключается в том, что за все это время не уделялось и продолжает не уделяться должного внимания исследованию системных механизмов процессов старения, которые объединяли бы эти процессы на всех уровнях организации человека - от молекулярно-генетического до собственно организменного.
Одним из возможных путей решения этой проблемы могло быть создание схемы из причинно-следственных цепочек событий в виде ориентированного графа, отражающих разнообразные процессы старения человека на всех его уровнях. Первым такой подход применил американский ученый J.D.Furber, создавший в 2000 году свою первую схему старения человека. В течение всех последующих лет он ее постоянно усовершенствовал. Последний вариант этой схемы опубликован в 2019 году [3]. В дальнейшем подобные схемы стали создавать и другие ученые (Pat Langeley, 2007; Б.А.Кауров, 2009; А.А.Москалев, 2009; Д.А.Медведев и др. 2010). Все схемы этих авторов можно посмотреть на сайте http://ageing-not.narod.ru/page17.html#ssilka2.
Практически во всех этих схемах использовался одинаковый подход с основным упором прежде всего на визуальное графическое отображение процессов старения, который позволял относительно просто их изучать. Однако по мере увеличения количества объектов(узлов) и связей между ними визуальное рассмотрение графа становилось все более неудобным и при увеличении числа объектов до нескольких тысяч стало практически “нечитабельным”. На экране компьютера все узлы и связи в таком графе сливались в одно темное пятно. Дополнительное неудобство составляло и отсутствие необходимого структурирования исходных данных по уровням рассмотрения организма и связей между ними, а также удобного интерфейса для работы с таким графом. Дальнейшее наполнение графа новыми объектами и связами в применяемой визуальной форме стало не практичным.
При увеличении числа узлов до нескольких тысяч появилась еще одна дополнительная сложность. Суть ее в том, что граф старения формируется из обычных отношений между двумя объектами типа "a-->b" и исходные данные берутся из разных информационных источников. Однако вместо "а" и "b" пишутся конкретные текстовые выражения. При этом они могут иметь разные грамматические формы, включая использование синонимов. Но это еще не все. При их вводе в компьютер неизбежно могут возникать разные описки не только в плане написания букв и знаков препинания, но даже в разной величине пробелов между словами (один или два). Компьютер все эти вводимые данные формально принимает как самостоятельные выражения (отношения). Тем самым создаются бракованные (фейковые) отношения и их число в больших графах может достигать 10 и более процентов от общего числа всех отношений. Все это делает необходимым создание специфического локального тезауруса терминов, применяемых при создании графа. Эта проблема решается созданием для каждого вводимого слова или выражения списка шаблонов, из которого выбирается подходящий или создается новый. Однако отдельные слова, исходя из контекста, могут иметь разное смысловое значение. Кроме того, список шаблонов может быть довольно большим и также не структурированным, что создает почву для появления одинаковых по смыслу, но разных по написанию отношений. Все это обусловливает появление дополнительного информационного шума, который может нарастать по мере увеличения размера графа.
Кроме того, в существующих графах не было критерия для отбора существенных узлов и связей от несущественных, что создавало дополнительную нагрузку при анализе графа. Исходя из вышеизложенного, возникала необходимость в создании унифицированного и структурированного тезауруса используемых слов и выражений. Но разные характеристики(свойства) узлов графа и связей между ними, структурирование исходных данных в виде их разделения на отдельные модули с возможностью послойной детализации по принципу матрёшки делали также неизбежным создание разнообразных специфических фильтров для поиска необходимой информации. В частности, эти фильтры нужны, например, для выделения следующих подграфов: по уровням организации человека; по типам физиологических и патологических процессов, протекающих на разных уровнях организации человека; по механизмам действия разных лекарственных препаратов; по механизмам развития разных биомаркеров старения, хронического воспаления и стресса; по механизмам развития разной возрастной патологии и т.д.
Наконец, все графы старения в существующей сейчас форме не позволяли проводить их необходимый статистический анализ, например, определять ядерные и критические узлы, выделять сообщества графа и его подграфы и т.д. Для нахождения разных путей между разными узлами необходимо отсутствие между ними циклов. Традиционная форма составления существующих графов старения ввиду относительной малочисленности вовлеченности в них узлов позволяла визуально находить эти циклы и устранять их. При наличии же в схеме нескольких тысяч узлов и больше сделать это визуально практически очень сложно и неудобно.
Все вышеперечисленные проблемы неизбежно заставляли существенно изменить подход к составлению схем старения человека. В новом подходе основной упор был сделан прежде всего на компьютерный анализ графа, в котором его визуализация переходила уже на второй план. С этой целью была создана графическая система “AgeMap” на основе соответствующего программного обеспечения с использованием современного объектно-ориентированного языка программирования Python (версия 3.85) и его приложений в виде графической платформы NetworkX (версия 2.4) для анализа графов, графических редакторов Graphviz (версия 2.38) и Gephi (версия 0.92) для их визуализации, а также пакета Tk (версия 8.6 ) для создания панели интерфейса этой графической системы (Рис. 1).
Для апробации созданной системы был использован ранее полученный мной граф старения, состоящий из 2200 узлов. Его анализ позволил найти ряд разных статистических показателей. Например, самый длинный путь между двумя узлами составлял 31 ребро, а в среднем равнялся 9.5 ребрам. Максимальное число входящих в узел ребер равнялось 23, выходящих - 32, а их общее число - 34, но в среднем последнее равно всего 1.2, что говорило о низкой плотности графа, равной всего 0.001. Последняя величина отражала уровень информационного наполнения графа. В данном случае он оказался низким, что указывало на отсутствие соответствующей информации. Это, в свою очередь, могло свидетельствовать в пользу недостаточности наших знаний о многих интегральных процессах старения человека, хотя отдельные субграфы (модули) могли иметь гораздо более высокую плотность. Статистический анализ позволял ранжировать узлы по степени связности с другими узлами и выделять ядерные узлы, которые могли быть реперными и перспективными в плане воздействия на них с целью возможной коррекции. В свою очередь, графическая система Gephi благодаря своим возможностям позволяла наглядно визуализировать такие ядерные узлы даже в составе графов, состоящих из десятков и даже сотен тысяч узлов.
Рис. 1 Панель интерфейса графической системы “AgeMap”.
На Рис. 2 ядерные узлы представлены в виде скопления связей вокруг них, в то время как существенная часть узлов, которая находится на периферии круга, имеет всего не более нескольких связей с другими узлами.
Рис. 2. Визуализация графа старения человека в графическом редакторе Gephi.
Необходимо отметить, что предлагаемый способ на основе примененного программного обеспечения по своему функционалу и возможностям хорошо соответствует идеологии объектно-ориентированного программирования с его основными атрибутами в виде наследуемости, полиморфизма и инкапсуляции. В такой схеме все узлы и связи между ними можно рассматривать как множество объектов со своими свойствами и методами, находящихся внутри своих специфических классов и/или подклассов и действующих в рамках своих начальных и граничных условий. Более того, данная графическая система “AgeMap” позволяет использовать внешние воздействия (события, сигналы) для реконструкции исходного графа(добавлять или удалять отдельные узлы и связи) и изучать свойства уже его новой конфигурации, т.е., по сути, частично моделировать процессы старения. Исходя из вышеизложенного, можно заключить, что предложенный способ создания схем старения человека с учетом его дальнейшего развития и привязки к БД MySQL, на мой взгляд, является весьма перспективным для изучения разных процессов старения и подходов для их возможной коррекции.
1. Kaurov B.A. O vozmozhnosti primeneniya sistemnogo analiza dlya opisaniya processov stareniya cheloveka // Informatika i sistemy upravleniya. 2008. N2(16). C. 26-28.
2. Kaurov B.A. O formalizovannoy sistemnoy modeli stareniya cheloveka // Informatika i sistemy upravleniya. 2009. N4(22). C. 26-28.
3. Furber J.D. Systems Biology of Human Aging. Network Model. Biochemical and Physiological Interactions, 2019. URL: https://legendarypharma.com/chartbg.html.