Russian Federation
Russian Federation
Russian Federation
Russian Federation
Abstract. The search for effective drugs for the treatment of infectious diseases of farm animals is an urgent problem. The article presents the models of antipasteurllosis activity of a vast array of chemical compounds, built using descriptors generated by the Dragon program and the computer program PROGROC developed by us. Pasteurelosis is an infectious disease of many species of animals, caused by bacteria of the genus Pasteurella, has a wide geographical distribution and causes significant economic damage to livestock. Treatment of diseased animals with antibiotics is complicated by the emergence of forms of microorganisms that are resistant to them. To solve the problem of bacterial drug resistance, it is proposed to search for and select compounds with antipasteurellosis activity using QSAR (Quantitative Structure-Activity Relationship) methods. To assess the antipasteurellosis activity, the indicator lgMIC (MIC is the minimum inhibitory concentration of the substance) was used. The prediction quality was characterized by a correlation coefficient R between the predicted and experimental values of lgMIC and the standard deviation s. In the present work, models of inhibitory activity against Pasteurella multocida 362 chemical compounds selected at the ChEMBL site were obtained. The simulation involved 445 molecular structure descriptors calculated by the Dragon 7 program. The calculations were performed using the PROGROC computer program (PROGgram RObustness Calculation). The values of the correlation coefficient reached 0.9360–0.9549 for the control sample, where 55–61 % of the total set of substances are represented. When checking the quality of modeling by means of sliding control, the following indicators were obtained: R = 0.9297 and s = 0.40. Calculations were made for compounds with only threshold estimates (
Pasteurella multocida, antimicrobial activity, drugs, minimum inhibitory concentration MIC, QSAR, organic substances, descriptors, Dragon, correlation, PROGROC.
Постановка проблемы (Introduction)
Пастереллез – инфекционная болезнь сельскохозяйственных, домашних и диких животных, вызываемая бактериями рода Pasteurella, из которых более изученным является этиологически значимый вид Pasteurella multocida. Заболевание проявляется явлениями геморрагической септицемии при остром течении и преимущественным поражением легких при подостром и хроническом течении. Пастереллез регистрируется во всех странах мира, в том числе во всех регионах России, и характеризуется высокой летальностью, причиняя значительный экономический ущерб животноводству [1, 2].
Весьма актуальной продолжает оставаться проблема заболевания в Казахстане, одной из причин падежа домашних и диких животных в республике признается пастереллез. В 2015 году более 200 000 сайгаков погибло за 3 недели в центральном Казахстане. Проведением международного мультидисциплинарного исследования массовой гибели сайгаков установлено, что непосредственной причиной смерти была геморрагическая септицемия, вызванная бактерией Pasteurella multocida [3].
Для лечения пастереллеза используются антибактериальные препараты, чаще всего пенициллины и цефалоспорины. Серьезной проблемой, значительно осложняющей лечение как животных, так и человека, является формирование резистентности к антибиотикам, что отмечено, в частности, при сравнении чувствительности к ним культур Pasteurella multocida, выделенных в разные годы [4]. Данные мониторинга за уровнем лекарственной устойчивости микроорганизмов при лечении респираторных заболеваний свиней, вызванных Pasteurella multocida, показали, что к гентамицину высокочувствительными оказались только 43 % изолятов пастерелл, а 29 % – резистентными. Более 30 % от всех исследуемых изолятов пастерелл оказалась резистентными к препаратам тетрациклиновой группы, котримоксазолу и триметоприму [5]. Для предотвращения развития бактериальной устойчивости к антибиотикам используют комбинированную химиотерапию, но кардинального решения проблемы данный подход не обеспечивает. Существует насущная потребность в поиске новых препаратов или химической модификации имеющихся с целью усиления их противомикробного действия.
Одним из путей преодоления лекарственной резистентности является поиск и разработка новых активных агентов. Для этих целей все шире привлекаются компьютерные технологии, которые позволяют минимизировать затраты на экспериментальные исследования, сделав разработку лекарств более рациональной и эффективной.
Наиболее популярны методы QSAR (Quantitative Structure-Activity Relationship), CoMFA (Comparative Molecular Field Analysis), CoMSIA (Comparative Molecular Similarity Indices Analysis). Эти методы устанавливают корреляции между параметрами биологической активности и структурными и пространственными характеристиками тренировочного набора молекул для последующего моделирования и прогнозирования свойства неисследованных соединений.
Методология и методы исследования (Methods)
Цель работы – исследовать возможность QSAR моделирования ингибирующей активности больших массивов химических соединений по отношению к Pasteurella multocida.
Актуальность исследования определяется тем, что, несмотря на большое число публикаций по вопросам компьютерного моделирования антимикробной активности химических соединений, данные по антипастереллезной активности в подобных исследованиях представлены незначительно.
Для характеристики антимикробной активности обычно применяются концентрация полумаксимального ингибирования IC50 и минимальная ингибирующая концентрация антибиотика MIC, угнетающая популяции бактерий in vitro. При моделировании используют логарифмическую шкалу ингибирующих молярных концентраций lgIC50, lgMIC или pIC50, pMIC. Качество моделирования оценивается коэффициентом корреляции R или R2 между расчетными и экспериментальными значениями и стандартным отклонением s.
Приведем несколько примеров последних лет, характеризующих состояние направления. Антимикробная активность с построением моделей QSAR изучалась в отношении лямблий, сальмонелл, золотистого стафилококка и других патогенов.
Так, анализ QSAR был применен к набору данных из 37 синтезированных производных 2-амино-4-арилтиазола, активных против лямблий Giardia intestinalis [6]. Полученная модель для pIC50 имеет R2 = 0,70, s = 0,28.
Авторами [7] осуществлен синтез 26 новых конъюгатов хинолоновых и фторхинолоновых антибиотиков и моделирование их антибактериальной активности по отношению к четырем микроорганизмам. Результаты моделирования по отношению к Salmonella typhi показали R2 = 0,854 и s = 0,0004.
В работе Катрицкого и др. [8] описаны результаты синтеза и молекулярного моделирования антимикробной активности 10 новых конъюгатов фторхинолоновых антибиотиков с пиразином. Модель антисальмонеллезной активности по отношению к Salmonella typhi характеризовалась R2 = 0,831 и s = 0,179.
При исследовании взаимосвязи «структура – активность хиназолинонового фрагмента» для антибактериальной активности против Salmonella typhimurium [9] было использовано 29 производных 4(3H) – хиназолинона. Лучшие модели для CoMFA и CoMSIA имели коэффициент корреляции 0,905 и 0,868.
Моделирование активности конъюгатов хинолоновых антибиотиков с производными с 1,2,3-триазола по отношению к Staphylococcus aureus выполнено в [10]. Набор содержал 21 соединение, R2 = 0,952, s2 = 0,18. Для Salmonella typhi набор включал 22 соединения, R2 = 0,878, s2 = 0,406.
Исследована антибактериальная активность 72 производных изотиазолохинолонов по отношению к Staphylococcus aureus [11]. Полученные модели с использованием CoMFA имели R2 = 0,988, для CoMSIA R2 = 0,975. Тестовый набор молекул дал приемлемые значения прогностической корреляции R2 до 0,57.
Среди 54 гетероциклических производных пиразолина выявлены соединения с антитуберкулезный активностью в отношении Mycobacterium tuberculosis H37Rv [12]. Разработаны статистически значимые (R2 = 0.85) модели QSAR.
Получены статистически значимые модели MIC для 63 производных бензимидазола [13] по отношению к Mycobacterium tuberculosis с R2 = 0,90. Использование моделей позволило разработать 223 новых соединения, часть из них показали некоторые многообещающие результаты.
В работе [14] была исследована серия из 109 известных ингибиторов микобактериальных мембранных белков (MmpL3) Mycobacterium tuberculosis и проведен 3D-анализ QSAR. Был использован тренировочный набор из 74 молекул для получения моделей CoMFA и CoMSIA, которые были статистически достоверными, максимальное значение R2 = 0,93.
Обзор приведенных публикаций показывает, что для построения моделей антибактериальной активности используются наборы близкородственных химических соединений, в основном, небольшие по объему. В большей части моделей достигнутый показатель R (R2) был менее 0,9.
В нашей работе данные об ингибирующей активности химических веществ и их структуры в виде смайлов (smiles) получены на сайте ChEMBL [15], где аккумулируются базы данных химических соединений с лекарственно-подобными свойствами. Сайт также содержит обширную информацию о других видах биологической активности и различных способах описания структуры молекул.
Были отобраны 362 индивидуальных соединения с установленными значениями MIC и лежащие в широком диапазоне молекулярных масс 172–1033. Солевые формы соединений и дублирующие записи были удалены.
Все нестандартные способы выражения концентраций приведены в наиболее часто используемую на сайте наномолярную (nM) концентрацию и прологарифмированы. Диапазон значений lgMIC – от 0,71 до 6,23.
Структура соединений была представлена в виде числовых описателей – дескрипторов молекулярной структуры, вычисляемых по смайлам с помощью компьютерной программы Dragon 7. При моделировании были задействованы 445 дескрипторов, имеющих значения отличные от нуля для всех соединений и коэффициент взаимной корреляции не более 0,99.
Для выравнивания весов различных дескрипторов осуществлялась предварительная обработка по формуле
где – значение дескриптора с номером j для вещества i, m – количество веществ.
Расчеты выполнены с помощью разработанной нами компьютерной программы PROGROC (PROGgram RObustness Calculation), которая была успешно применена для прогнозирования некоторых параметров биологической активности, в частности токсичности органических соединений для Toxoplasma gondii [16]. Программа использует алгоритмы, позволяющие привлекать число дескрипторов, превышающее количество веществ без предварительного отбора. Качество прогнозирования характеризовалось коэффициентом корреляции R между прогнозируемыми и экспериментальными значениями lg MIC и стандартным отклонением s.
Результаты (Results)
Для отобранных соединений были получены модели при использовании трех вариантов разделения набора из 362 соединений на контрольную и тренировочную выборки, для каждого варианта определены статистические параметры, приведенные в таблице 1.
Таблица 1
Показатели корреляции между экспериментальными и вычисленными значениями lgMIC при различных соотношениях числа веществ в тренировочной и контрольной выборках
Число веществ трен./контр. |
R, трен. |
s, трен. |
R, контр. |
s, контр. |
142/220 |
0,9684 |
0,28 |
0,9360 |
0,42 |
152/210 |
0,9716 |
0,27 |
0,9493 |
0,34 |
162/200 |
0,9650 |
0,29 |
0,9549 |
0,34 |
Table 1
The correlation between the experimental and calculated values of lgMIC at different ratios of the number of substances in the training and control sets
Number of compounds train./ control |
R, train |
s, train |
R, control |
s, control |
142/220 |
0,9684 |
0,28 |
0,9360 |
0,42 |
152/210 |
0,9716 |
0,27 |
0,9493 |
0,34 |
162/200 |
0,9650 |
0,29 |
0,9549 |
0,34 |
Значения статистических показателей R и s указывают на высокое качество моделей, особенно с учетом того, что в контрольной выборке представлено от 55 до 61 % от всего набора веществ, тогда как при моделировании биологического отклика долю контрольной выборки определяют примерно в 20–25 %.
Для модели с соотношением объемов тренировочной и контрольной выборок 152/210 результаты прогнозирования приведены на рис. 1.
● – тренировочная выборка; × – контрольная выборка
Рис. 1 Корреляция между экспериментальными и вычисленными
значениями lgMIC по молекулярным дескрипторам
● – training set; × – control set
Fig. 1 Correlation between the experimental and calculated
values of lgMIC by molecular descriptors
На рис. 2 представлена гистограмма распределения частот ошибок прогнозирования lgMIC. Симметричный вид гистограммы, приближающийся к нормальному закону распределения, может свидетельствовать о том, что исходные экспериментальные данные биологической активности отобранных веществ не содержат грубых ошибок и полученная модель адекватна.
Рис. 2. Гистограмма распределения частот ошибок прогнозирования lgMIC
Fig. 2. Histogram of the frequency distribution of prediction errors lgMIC
Одним из эффективных способов проверки валидности корреляционных моделей в QSАR-исследованиях является перекрестная проверка leave-one-out – «удаление одного из» или, «скользящий контроль». Из исследуемого набора последовательно извлекается по одному каждое вещество. Оставшиеся вещества используются для построения модели, с помощью которой проводится расчет (прогнозирование) свойства удаленного вещества. Проведенное в таком режиме прогнозирование является также и способом оценки качества и практической значимости полученных значений для свойства веществ, не имеющих экспериментально установленных данных. Хотя при этом статистические параметры моделей имеют более низкие значения R и большие стандартные отклонения s, таким образом максимально выявляются возможности метода для оценки неизвестных значений новых веществ.
Качество выполненного нами моделирования также проверялась с помощью скользящего контроля (рис. 3), в результате которого получены показатели: R = 0,9297 и s = 0,40.
Учитывая, что разброс экспериментальных данных MIC, полученных в различных лабораториях, может достигать нескольких порядков, достигнутое нами значение стандартного отклонения s = 0,40 можно считать вполне приемлемым для компьютерного скрининга неизученных веществ, а также для уточнения экспериментальных данных.
Рис. 3. Корреляция между экспериментальными и вычисленными значениями lgMIC, скользящий контроль
Fig. 3. Histogram of the frequency distribution of prediction errors lgMIC
Нами также выполнены расчеты для соединений, имеющих только пороговые оценки (<lgMIC>) в исходной базе. Сравнительные результаты расчета и экспериментальных пороговых оценок приведены в таблице 2.
Таблица 2
Сравнительные результаты расчета и экспериментальных пороговых оценок lgMIC
№ |
ChEMBLID |
МW |
Оценка lgMIC |
№ |
ChEMBLID |
МW |
Оценка lgMIC |
||
< [15] |
Расч. |
> [15] |
Расч. |
||||||
1 |
355841 |
685 |
1,07 |
0,52 |
6 |
327366 |
214 |
5,67 |
6,29 |
2 |
298584 |
392 |
2,11 |
1,63 |
7 |
433129 |
796 |
1,10 |
1,68 |
3 |
292597 |
375 |
2,12 |
1,73 |
8 |
33 |
361 |
1,62 |
1,93 |
4 |
96164 |
749 |
2,13 |
2,20 |
9 |
329094 |
209 |
5,68 |
5,81 |
5 |
431618 |
775 |
2,11 |
2,52 |
10 |
316697 |
379 |
5,72 |
5,70 |
Примечание: ChEMBLID – уникальный идентификатор, который назначается соединениям, мишеням, пробам, документам, тканям и типам клеток в базе [15], МW – молекулярная масса соединения.
Table 2
Comparative results of the calculation and experimental threshold estimates lgMIC
No. |
ChEMBLID |
МW |
Estimate lgMIC |
No. |
ChEMBLID |
МW |
Estimate lgMIC |
||
< [15] |
Calculation |
> [15] |
Calculation |
||||||
1 |
355841 |
685 |
1,07 |
0,52 |
6 |
327366 |
214 |
5,67 |
6,29 |
2 |
298584 |
392 |
2,11 |
1,63 |
7 |
433129 |
796 |
1,10 |
1,68 |
3 |
292597 |
375 |
2,12 |
1,73 |
8 |
33 |
361 |
1,62 |
1,93 |
4 |
96164 |
749 |
2,13 |
2,20 |
9 |
329094 |
209 |
5,68 |
5,81 |
5 |
431618 |
775 |
2,11 |
2,52 |
10 |
316697 |
379 |
5,72 |
5,70 |
Note: ChEMBLID is a unique identifier assigned to compounds, targets, samples, documents, tissues and cell types in the database [15], MW is the molecular weight of the compound.
Среди соединений в таблице присутствуют антибиотики (1, 8), аналоги макролидных антибиотиков (4, 5), производные различных классов.
Можно видеть, что расчетные оценки lgMIC хорошо согласуются с экспериментальными, это означает, что эксперимент мог быть в таких случаях заменен несопоставимо менее затратными расчетами.
Оценивая результаты нашего исследования в сравнении с данными других авторов, следует иметь в виду, что в публикациях [6–14] приведены результаты моделирования антимикробной активности небольших (до нескольких десятков) по объему наборов производных одного какого-либо класса химических соединений, имеющих близкие молекулярные структуры. В среднем модели обладали R (R2) менее 0,9 и s достигающим 0,55, а применимость моделей на гомогенных наборах веществ для прогнозирования ограничена кругом соединений, подобных использованным.
Данное исследование отличается от приведенных выше значительно большим числом веществ и гетерогенностью набора, что позволяет расширить круг соединений – претендентов на роль лекарств. Полученные при этом высокие значения коэффициента корреляции и приемлемые значения стандартного отклонения свидетельствуют об удачном выборе дескрипторов и алгоритма вычислений для моделирования антипастереллезной активности органических соединений.
Обсуждение и выводы (Discussion and Conclusion)
1. Подобраны 362 органических соединения, обладающие установленной противомикробной активностью по отношению к Pasteurella multocida. Набор может быть использован в дальнейших исследованиях по QSAR моделированию и прогнозированию новых лекарственных препаратов.
2. Использование большого набора дескрипторов, генерируемых программой Dragon, и расчетов антипастереллезной активности с помощью программы PROGROC, позволяет прогнозировать и моделировать MIC с высокими и статистическим значимыми параметрами. Таким образом, созданы предпосылки для виртуального скрининга новых антимикробных препаратов.
3. Показано хорошее согласие выполненных расчетных оценок и приблизительных (пороговых) экспериментальных значений MIC.
1. Laishevcev A. I. Pasterellez sel'skohozyaystvennyh zhivotnyh: sovremennaya epizooticheskaya situacii na territorii Rossiyskoy Federacii // Biotika. 2016. № 2 (9). S. 41–46.
2. Polkovnichenko A. P., Polkovnichenko P. A., Vorob'ev D. V., Vorob'ev V. I. Osobennosti biologicheskih svoystv kul'tur R. multocida, vydelennyh ot zhivotnyh v usloviyah Astrahanskoy oblasti // Uchenye zapiski Kazanskoy gosudarstvennoy akademii veterinarnoy mediciny im. N. E. Baumana. 2017. T. 3. S. 112–115.
3. Kock R. A., Orynbayev M., Robinson S., Zuther S. [et al.] Saigas on the brink: Multidisciplinary analysis of the factors influencing mass mortality events [Elektronnyy resurs] // Science Advances. 2018. Vol. 4. No. 1. URL: https://advances.sciencemag.org/content /4/1/eaao2314.
4. Laishevcev A. I., Kapustin A. V., Gulyukin A. M. Sravnitel'nyy analiz antibiotikochuvstvitel'nosti kollekcionnyh shtammov Pasteurella multocida, vydelennyh v period do 1990 g., s polevymi izolyatami, vydelennymi v techenie 2014–2016 gg. ot krupnogo i melkogo rogatogo skota na territorii Rossiyskoy Federacii // Trudy Kubanskogo gosudarstvennogo agrarnogo universiteta. 2016. № 63. S. 132–138.
5. O rezul'tatah monitoringa FGBU «VNIIZZh» antibiotikorezistentnosti vozbuditeley respiratornyh bolezney sviney [Elektronnyy resurs] // Novosti Rossel'hoznadzora. 2015. 4 sentyabrya. URL: http://www.fsvps.ru/fsvps/print/news/14947.html.
6. Mocelo-Castell R., Villanueva-Novelo C., Cáceres-Castillo D., Carballo R. M. [et al.] 2-Amino-4-arylthiazole Derivatives as Anti-giardial Agents: Synthesis, Biological Evaluation and QSAR Studies Quantitative Structure – Activity Relationship // Open Chem. 2015. No. 13. Pp. 1127–1136.
7. Panda S. S., Liaqat S., Girgis A. S., Samir A., Hall C. D., Katritzky A. R. Novel antibacterial active quinolone-fluoroquinolone conjugates and 2D-QSAR studies // Bioorganic & Medicinal Chemistry Letters 2015. No. 25. Pp. 3816–3821.
8. Panda S. S., Detistov O. S., Girgis A. S., Mohapatra P. P., Samir A., Katritzky A. R. Synthesis and molecular modeling of antimicrobial active fluoroquinolone-pyrazine conjugates with amino acid linkers // Bioorganic & Medicinal Chemistry Letters 2016. No. 26. Pp. 2198–2205.
9. Dixit R., Soni L. K., Sharma R. CoMFA and CoMSIA Studies on 6, 8-Dibromo-4(3H)-Quinazolinone Derivatives for Anti-Bacterial Activity against Salmonella typhimurium // Journal of Drug Discovery and Therapeutics. 2017. No. (7). Pp. 93–96.
10. Faidallah H., Girgis A., Tiwari A., Honkanadavar H. [et al.] Synthesis, antibacterial properties and 2D-QSAR studies of quinolone-triazole conjugates // European Journal of Medicinal Chemistry 2018. No. 143. Pp. 1524–1534.
11. Ballu S., Itteboina R., Sivan S. K., Manga V. Rational design of methicillin resistance Staphylococcus aureus inhibitors through 3D-QSAR, molecular docking and molecular dynamics simulations // Computational Biology and Chemistry. 2018. No. 73. Pp. 95–104.
12. Hemal M. S., Popatbhai K. P., Mahesh T. C. [et al.] 2D-QSAR Study of a Series of Pyrazoline-Based Anti-Tubercular Agents Using Genetic Function Approximation // Journal of Computational Chemistry. 2015. Vol. 3. No. 4. Pp. 45–53.
13. Ahamad S., Islam A., Ahmad F., Dwivedi N., Hassan M. I. 2/3D-QSAR, molecular docking and MD simulation studies of FtsZ protein targeting benzimidazoles derivatives // Computational Biology and Chemistry. 2019. Vol. 78. Pp. 398–413.
14. Munnaluri R., Reddy Peddi S., Kanth Sivan S., Manga V. Computational studies on N-phenyl pyrrole derivatives as MmpL3 inhibitors in Mycobacterium tuberculosis // Computational Biology and Chemistry. 2019. No. 78. Pp. 81–94.
15. ChEMBL. European Molecular Biology Laboratory [Electronic resource]. URL: https://www.ebi.ac.uk/chembl.
16. Vazhev V. V., Munarbaeva B. G., Vazheva N. V., Gubenko M. A., Ergalieva E. M. Modelirovanie antitoksoplazmoidnoy aktivnosti organicheskih soedineniy metodom QSAR // Agrarnyy vestnik Urala. 2018. № 07 174). S. 4–10.