QSAR-МОДЕЛИРОВАНИЕ ИНГИБИТОРОВ РОСТА PASTEURELLA MULTOCIDA
Аннотация и ключевые слова
Аннотация (русский):
Поиск эффективных препаратов для лечения инфекционных заболеваний сельскохозяйственных животных является актуальной проблемой. В статье представлены модели антипастереллезной активности обширного массива химических соединений, построенные с использованием дескрипторов, генерируемых программой Dragon и разработанной нами компьютерной программы PROGROC. Пастереллез – инфекционная болезнь многих видов животных, вызываемая бактериями рода Pasteurella, имеет широкое географическое распространение и наносит существенный экономический ущерб животноводству. Лечение заболевших животных антибиотиками осложняется появлением форм микроорганизмов, устойчивых к ним. Для решения проблемы бактериальной резистентности к лекарственным препаратам предлагается вести поиск и отбор соединений с антипастереллезной активностью при использовании методов QSAR (Quantitative Structure-Activity Relationship). Для оценки антипастереллезной активности использован показатель lgMIC (MIC – минимальная ингибирующая концентрация вещества). Качество прогнозирования характеризовалось коэффициентом корреляции R между прогнозируемыми и экспериментальными значениями lgMIC и стандартным отклонением s. В настоящей работе получены модели ингибирующей активности по отношению к Pasteurella multocida 362 химических соединений, отобранных на сайте ChEMBL. При моделировании были задействованы 445 дескрипторов молекулярной структуры, вычисляемых программой Dragon 7. Расчеты выполнены с помощью компьютерной программы PROGROC (PROGgram RObustness Calculation). Достигнутые значения коэффициента корреляции 0,9360–0,9549 для контрольной выборки, где представлено 55–61 % от всего набора веществ, весьма высокие. При проверке качества моделирования посредством скользящего контроля получены показатели: R = 0,9297 и s = 0,40. Сделаны расчеты для соединений, имеющих только пороговые оценки () в исходной базе. Полученные расчетные оценки lgMIC хорошо согласуются с экспериментальными, что указывает на возможность замены эксперимента менее затратными расчетами.

Ключевые слова:
Pasteurella multocida, антимикробная активность, лекарственные препараты, минимальная ингибирующая концентрация MIC, QSAR, органические вещества, дескрипторы, Dragon, корреляция, PROGROC.
Текст
Текст произведения (PDF): Читать Скачать

Постановка проблемы (Introduction)

Пастереллез – инфекционная болезнь сельскохозяйственных, домашних и диких животных, вызываемая бактериями рода Pasteurella, из которых более изученным является этиологически значимый вид Pasteurella multocida. Заболевание проявляется явлениями геморрагической септицемии при остром течении и преимущественным поражением легких при подостром и хроническом течении. Пастереллез регистрируется во всех странах мира, в том числе во всех регионах России, и характеризуется высокой летальностью, причиняя значительный экономический ущерб животноводству [1, 2].

Весьма актуальной продолжает оставаться проблема заболевания в Казахстане, одной из причин падежа домашних и диких животных в республике признается пастереллез. В 2015 году более 200 000 сайгаков погибло за 3 недели в центральном Казахстане. Проведением международного мультидисциплинарного исследования массовой гибели сайгаков установлено, что непосредственной причиной смерти была геморрагическая септицемия, вызванная бактерией Pasteurella multocida [3].

Для лечения пастереллеза используются антибактериальные препараты, чаще всего пенициллины и цефалоспорины. Серьезной проблемой, значительно осложняющей лечение как животных, так и человека, является формирование резистентности к антибиотикам, что отмечено, в частности, при сравнении чувствительности к ним культур Pasteurella multocida, выделенных в разные годы [4]. Данные мониторинга за уровнем лекарственной устойчивости микроорганизмов при лечении респираторных заболеваний свиней, вызванных Pasteurella multocida, показали, что к гентамицину высокочувствительными оказались только 43 % изолятов пастерелл, а 29 % – резистентными. Более 30 % от всех исследуемых изолятов пастерелл оказалась резистентными к препаратам тетрациклиновой группы, котримоксазолу и триметоприму [5]. Для предотвращения развития бактериальной устойчивости к антибиотикам используют комбинированную химиотерапию, но кардинального решения проблемы данный подход не обеспечивает. Существует насущная потребность в поиске новых препаратов или химической модификации имеющихся с целью усиления их противомикробного действия.

Одним из путей преодоления лекарственной резистентности является поиск и разработка новых активных агентов. Для этих целей все шире привлекаются компьютерные технологии, которые позволяют минимизировать затраты на экспериментальные исследования, сделав разработку лекарств более рациональной и эффективной.

Наиболее популярны методы QSAR (Quantitative Structure-Activity Relationship), CoMFA (Comparative Molecular Field Analysis), CoMSIA (Comparative Molecular Similarity Indices Analysis). Эти методы устанавливают корреляции между параметрами биологической активности и структурными и пространственными характеристиками тренировочного набора молекул для последующего моделирования и прогнозирования свойства неисследованных соединений.

Методология и методы исследования (Methods)

Цель работы – исследовать возможность QSAR моделирования ингибирующей активности больших массивов химических соединений по отношению к Pasteurella multocida.

Актуальность исследования определяется тем, что, несмотря на большое число публикаций по вопросам компьютерного моделирования антимикробной активности химических соединений, данные по антипастереллезной активности в подобных исследованиях представлены незначительно.

Для характеристики антимикробной активности обычно применяются концентрация полумаксимального ингибирования IC50 и минимальная ингибирующая концентрация антибиотика MIC, угнетающая популяции бактерий in vitro. При моделировании используют логарифмическую шкалу ингибирующих молярных концентраций lgIC50, lgMIC или pIC50,  pMIC. Качество моделирования оценивается коэффициентом корреляции R или R2 между расчетными и экспериментальными значениями и стандартным отклонением s.

Приведем несколько примеров последних лет, характеризующих состояние направления. Антимикробная активность с построением моделей QSAR изучалась в отношении лямблий, сальмонелл, золотистого стафилококка и других патогенов.

Так, анализ QSAR был применен к набору данных из 37 синтезированных производных 2-амино-4-арилтиазола, активных против лямблий Giardia intestinalis [6]. Полученная модель для pIC50 имеет R2 = 0,70, s = 0,28.

Авторами [7] осуществлен синтез 26 новых конъюгатов хинолоновых и фторхинолоновых антибиотиков и моделирование их антибактериальной активности по отношению к четырем микроорганизмам. Результаты моделирования по отношению к Salmonella typhi показали R2 = 0,854 и s = 0,0004.

В работе Катрицкого и др. [8] описаны результаты синтеза и молекулярного моделирования антимикробной активности 10 новых конъюгатов фторхинолоновых антибиотиков с пиразином. Модель антисальмонеллезной активности по отношению к Salmonella typhi характеризовалась R2 = 0,831 и s = 0,179.

При исследовании взаимосвязи «структура – активность хиназолинонового фрагмента» для антибактериальной активности против Salmonella typhimurium [9] было использовано 29 производных 4(3H) – хиназолинона. Лучшие модели для CoMFA и CoMSIA имели коэффициент корреляции 0,905 и 0,868.

Моделирование активности конъюгатов хинолоновых антибиотиков с производными с 1,2,3-триазола по отношению к Staphylococcus aureus выполнено в [10]. Набор содержал 21 соединение, R2 = 0,952, s2 = 0,18. Для Salmonella typhi набор включал 22 соединения, R2 = 0,878, s2 = 0,406.

Исследована антибактериальная активность 72 производных изотиазолохинолонов по отношению к Staphylococcus aureus [11]. Полученные модели с использованием CoMFA имели R2 = 0,988, для CoMSIA R2 = 0,975. Тестовый набор молекул дал приемлемые значения прогностической корреляции R2 до 0,57.

Среди 54 гетероциклических производных пиразолина выявлены соединения с антитуберкулезный активностью в отношении Mycobacterium tuberculosis H37Rv [12]. Разработаны статистически значимые (R2 = 0.85) модели QSAR.

Получены статистически значимые модели MIC для 63 производных бензимидазола [13] по отношению к Mycobacterium tuberculosis с R2 = 0,90. Использование моделей позволило разработать 223 новых соединения, часть из них показали некоторые многообещающие результаты.

В работе [14] была исследована серия из 109 известных ингибиторов микобактериальных мембранных белков (MmpL3) Mycobacterium tuberculosis и проведен 3D-анализ QSAR. Был использован тренировочный набор из 74 молекул для получения моделей CoMFA и CoMSIA, которые были статистически достоверными, максимальное значение R2 = 0,93.

Обзор приведенных публикаций показывает, что для построения моделей антибактериальной активности используются наборы близкородственных химических соединений, в основном, небольшие по объему. В большей части моделей достигнутый показатель R (R2) был менее 0,9.

В нашей работе данные об ингибирующей активности химических веществ и их структуры в виде смайлов (smiles) получены на сайте ChEMBL [15], где аккумулируются базы данных химических соединений с лекарственно-подобными свойствами. Сайт также содержит обширную информацию о других видах биологической активности и различных способах описания структуры молекул.

Были отобраны 362 индивидуальных соединения с установленными значениями MIC и лежащие в широком диапазоне молекулярных масс 1721033. Солевые формы соединений и дублирующие записи были удалены.

Все нестандартные способы выражения концентраций приведены в наиболее часто используемую на сайте наномолярную (nM) концентрацию и прологарифмированы. Диапазон значений lgMIC – от 0,71 до 6,23.

Структура соединений была представлена в виде числовых описателей – дескрипторов молекулярной структуры, вычисляемых по смайлам с помощью компьютерной программы Dragon 7. При моделировании были задействованы 445 дескрипторов, имеющих значения отличные от нуля для всех соединений и коэффициент взаимной корреляции не более 0,99.

Для выравнивания весов различных дескрипторов осуществлялась предварительная обработка по формуле

где   – значение дескриптора с номером j для вещества i, m – количество веществ.

Расчеты выполнены с помощью разработанной нами компьютерной программы PROGROC (PROGgram RObustness Calculation), которая была успешно применена для прогнозирования некоторых параметров биологической активности, в частности токсичности органических соединений для Toxoplasma gondii [16]. Программа использует алгоритмы, позволяющие привлекать число дескрипторов, превышающее количество веществ без предварительного отбора. Качество прогнозирования характеризовалось коэффициентом корреляции R между прогнозируемыми и экспериментальными значениями lg MIC и стандартным отклонением s.

Результаты (Results)

Для отобранных соединений были получены модели при использовании трех вариантов разделения набора из 362 соединений на контрольную и тренировочную выборки, для каждого варианта определены статистические параметры, приведенные в таблице 1.

Таблица 1

Показатели корреляции между экспериментальными и вычисленными значениями lgMIC при различных соотношениях числа веществ в тренировочной и контрольной выборках

Число веществ

трен./контр.

R, трен.

s, трен.

R, контр.

s, контр.

142/220

0,9684

0,28

0,9360

0,42

152/210

0,9716

0,27

0,9493

0,34

162/200

0,9650

0,29

0,9549

0,34

 

Table 1

The correlation between the experimental and calculated values of lgMIC at different ratios of the number of substances in the training and control sets

Number of compounds

train./ control

R, train

s, train

R, control

s, control

142/220

0,9684

0,28

0,9360

0,42

152/210

0,9716

0,27

0,9493

0,34

162/200

0,9650

0,29

0,9549

0,34

 

Значения статистических показателей R и s указывают на высокое качество моделей, особенно с учетом того, что в контрольной выборке представлено от 55 до 61 % от всего набора веществ, тогда как при моделировании биологического отклика долю контрольной выборки определяют примерно в 20–25 %.

Для модели с соотношением объемов тренировочной и контрольной выборок 152/210 результаты прогнозирования приведены на рис. 1.

 

 

● – тренировочная выборка; × – контрольная выборка

Рис. 1 Корреляция между экспериментальными и вычисленными

значениями lgMIC по молекулярным дескрипторам

 

● – training set; × control set

Fig. 1 Correlation between the experimental and calculated

values of lgMIC by molecular descriptors

 

На рис. 2 представлена гистограмма распределения частот ошибок прогнозирования lgMIC. Симметричный вид гистограммы, приближающийся к нормальному закону распределения, может свидетельствовать о том, что исходные экспериментальные данные биологической активности отобранных веществ не содержат грубых ошибок и полученная модель адекватна.

 

Рис. 2. Гистограмма распределения частот ошибок прогнозирования lgMIC

 

 

 

 

Fig. 2. Histogram of the frequency distribution of prediction errors lgMIC

 

Одним из эффективных способов проверки валидности корреляционных моделей в QSАR-исследованиях является перекрестная проверка leave-one-out – «удаление одного из» или, «скользящий контроль». Из исследуемого набора последовательно извлекается по одному каждое вещество. Оставшиеся вещества используются для построения модели, с помощью которой проводится расчет (прогнозирование) свойства удаленного вещества. Проведенное в таком режиме прогнозирование является также и способом оценки качества и практической значимости полученных значений для свойства веществ, не имеющих экспериментально установленных данных. Хотя при этом статистические параметры моделей имеют более низкие значения R и большие стандартные отклонения s, таким образом максимально выявляются возможности метода для оценки неизвестных значений новых веществ.

Качество выполненного нами моделирования также проверялась с помощью скользящего контроля (рис. 3), в результате которого получены показатели: R = 0,9297 и s = 0,40.

Учитывая, что разброс экспериментальных данных MIC, полученных в различных лабораториях, может достигать нескольких порядков, достигнутое нами значение стандартного отклонения s = 0,40 можно считать вполне приемлемым для компьютерного скрининга неизученных веществ, а также для уточнения экспериментальных данных.

 

 

 

 

Рис. 3. Корреляция между экспериментальными и вычисленными значениями lgMIC, скользящий контроль

 

Fig. 3. Histogram of the frequency distribution of prediction errors lgMIC

 

Нами также выполнены расчеты для соединений, имеющих только пороговые оценки (<lgMIC>) в исходной базе. Сравнительные результаты расчета и экспериментальных пороговых оценок приведены в таблице 2.

 

Таблица 2

Сравнительные результаты расчета и экспериментальных пороговых оценок lgMIC

ChEMBLID

МW

Оценка lgMIC

ChEMBLID

МW

Оценка lgMIC

< [15]

Расч.

> [15]

Расч.

1

355841

685

1,07

0,52

6

327366

214

5,67

6,29

2

298584

392

2,11

1,63

7

433129

796

1,10

1,68

3

292597

375

2,12

1,73

8

33

361

1,62

1,93

4

96164

749

2,13

2,20

9

329094

209

5,68

5,81

5

431618

775

2,11

2,52

10

316697

379

5,72

5,70

Примечание: ChEMBLID – уникальный идентификатор, который назначается соединениям, мишеням, пробам, документам, тканям и типам клеток в базе [15], МW – молекулярная масса соединения.

 

Table 2

Comparative results of the calculation and experimental threshold estimates lgMIC

No.

ChEMBLID

МW

Estimate lgMIC

No.

ChEMBLID

МW

Estimate lgMIC

< [15]

Calculation

> [15]

Calculation

1

355841

685

1,07

0,52

6

327366

214

5,67

6,29

2

298584

392

2,11

1,63

7

433129

796

1,10

1,68

3

292597

375

2,12

1,73

8

33

361

1,62

1,93

4

96164

749

2,13

2,20

9

329094

209

5,68

5,81

5

431618

775

2,11

2,52

10

316697

379

5,72

5,70

Note: ChEMBLID is a unique identifier assigned to compounds, targets, samples, documents, tissues and cell types in the database [15], MW is the molecular weight of the compound.

 

Среди соединений в таблице присутствуют антибиотики (1, 8), аналоги макролидных антибиотиков (4, 5), производные различных классов.

Можно видеть, что расчетные оценки lgMIC хорошо согласуются с экспериментальными, это означает, что эксперимент мог быть в таких случаях заменен несопоставимо менее затратными расчетами.

Оценивая результаты нашего исследования в сравнении с данными других авторов, следует иметь в виду, что в публикациях [6–14] приведены результаты моделирования антимикробной активности небольших (до нескольких десятков) по объему наборов производных одного какого-либо класса химических соединений, имеющих близкие молекулярные структуры. В среднем модели обладали R (R2) менее 0,9 и s достигающим 0,55, а применимость моделей на гомогенных наборах веществ для прогнозирования ограничена кругом соединений, подобных использованным.

Данное исследование отличается от приведенных выше значительно большим числом веществ и гетерогенностью набора, что позволяет расширить круг соединений – претендентов на роль лекарств. Полученные при этом высокие значения коэффициента корреляции и приемлемые значения стандартного отклонения свидетельствуют об удачном выборе дескрипторов и алгоритма вычислений для моделирования антипастереллезной активности органических соединений.

Обсуждение и выводы (Discussion and Conclusion)

1. Подобраны 362 органических соединения, обладающие установленной противомикробной активностью по отношению к Pasteurella multocida. Набор может быть использован в дальнейших исследованиях по QSAR моделированию и прогнозированию новых лекарственных препаратов.

2. Использование большого набора дескрипторов, генерируемых программой Dragon, и расчетов антипастереллезной активности с помощью программы PROGROC, позволяет прогнозировать и моделировать MIC с высокими и статистическим значимыми параметрами. Таким образом, созданы предпосылки для виртуального скрининга новых антимикробных препаратов.

3. Показано хорошее согласие выполненных расчетных оценок и приблизительных (пороговых) экспериментальных значений MIC.

Список литературы

1. Лаишевцев А. И. Пастереллез сельскохозяйственных животных: современная эпизоотическая ситуации на территории Российской Федерации // Биотика. 2016. № 2 (9). С. 41–46.

2. Полковниченко А. П., Полковниченко П. А., Воробьев Д. В., Воробьев В. И. Особенности биологических свойств культур Р. multocida, выделенных от животных в условиях Астраханской области // Ученые записки Казанской государственной академии ветеринарной медицины им. Н. Э. Баумана. 2017. Т. 3. С. 112–115.

3. Kock R. A., Orynbayev M., Robinson S., Zuther S. [et al.] Saigas on the brink: Multidisciplinary analysis of the factors influencing mass mortality events [Электронный ресурс] // Science Advances. 2018. Vol. 4. No. 1. URL: https://advances.sciencemag.org/content /4/1/eaao2314.

4. Лаишевцев А. И., Капустин А. В., Гулюкин А. М. Сравнительный анализ антибиотикочувствительности коллекционных штаммов Pasteurella multocida, выделенных в период до 1990 г., с полевыми изолятами, выделенными в течение 2014–2016 гг. от крупного и мелкого рогатого скота на территории Российской Федерации // Труды Кубанского государственного аграрного университета. 2016. № 63. С. 132–138.

5. О результатах мониторинга ФГБУ «ВНИИЗЖ» антибиотикорезистентности возбудителей респираторных болезней свиней [Электронный ресурс] // Новости Россельхознадзора. 2015. 4 сентября. URL: http://www.fsvps.ru/fsvps/print/news/14947.html.

6. Mocelo-Castell R., Villanueva-Novelo C., Cáceres-Castillo D., Carballo R. M. [et al.] 2-Amino-4-arylthiazole Derivatives as Anti-giardial Agents: Synthesis, Biological Evaluation and QSAR Studies Quantitative Structure – Activity Relationship // Open Chem. 2015. No. 13. Pp. 1127–1136.

7. Panda S. S., Liaqat S., Girgis A. S., Samir A., Hall C. D., Katritzky A. R. Novel antibacterial active quinolone-fluoroquinolone conjugates and 2D-QSAR studies // Bioorganic & Medicinal Chemistry Letters 2015. No. 25. Pp. 3816–3821.

8. Panda S. S., Detistov O. S., Girgis A. S., Mohapatra P. P., Samir A., Katritzky A. R. Synthesis and molecular modeling of antimicrobial active fluoroquinolone-pyrazine conjugates with amino acid linkers // Bioorganic & Medicinal Chemistry Letters 2016. No. 26. Pp. 2198–2205.

9. Dixit R., Soni L. K., Sharma R. CoMFA and CoMSIA Studies on 6, 8-Dibromo-4(3H)-Quinazolinone Derivatives for Anti-Bacterial Activity against Salmonella typhimurium // Journal of Drug Discovery and Therapeutics. 2017. No. (7). Pp. 93–96.

10. Faidallah H., Girgis A., Tiwari A., Honkanadavar H. [et al.] Synthesis, antibacterial properties and 2D-QSAR studies of quinolone-triazole conjugates // European Journal of Medicinal Chemistry 2018. No. 143. Pp. 1524–1534.

11. Ballu S., Itteboina R., Sivan S. K., Manga V. Rational design of methicillin resistance Staphylococcus aureus inhibitors through 3D-QSAR, molecular docking and molecular dynamics simulations // Computational Biology and Chemistry. 2018. No. 73. Pp. 95–104.

12. Hemal M. S., Popatbhai K. P., Mahesh T. C. [et al.] 2D-QSAR Study of a Series of Pyrazoline-Based Anti-Tubercular Agents Using Genetic Function Approximation // Journal of Computational Chemistry. 2015. Vol. 3. No. 4. Pp. 45–53.

13. Ahamad S., Islam A., Ahmad F., Dwivedi N., Hassan M. I. 2/3D-QSAR, molecular docking and MD simulation studies of FtsZ protein targeting benzimidazoles derivatives // Computational Biology and Chemistry. 2019. Vol. 78. Pp. 398–413.

14. Munnaluri R., Reddy Peddi S., Kanth Sivan S., Manga V. Computational studies on N-phenyl pyrrole derivatives as MmpL3 inhibitors in Mycobacterium tuberculosis // Computational Biology and Chemistry. 2019. No. 78. Pp. 81–94.

15. ChEMBL. European Molecular Biology Laboratory [Electronic resource]. URL: https://www.ebi.ac.uk/chembl.

16. Важев В. В., Мунарбаева Б. Г., Важева Н. В., Губенко М. А., Ергалиева Э. М. Моделирование антитоксоплазмоидной активности органических соединений методом QSAR // Аграрный вестник Урала. 2018. № 07 174). С. 4–10.

Войти или Создать
* Забыли пароль?