Спектр энергий множественного докинга как многомерная метрика аффинности химических соединений к фармакологически релевантным биомишеням
Автор: Васильев П.М., Кочетков А.Н., Спасов А.А., Перфильев М.А.
Журнал: Волгоградский научно-медицинский журнал @bulletin-volgmed
Статья в выпуске: 3 (71), 2021 года.
Бесплатный доступ
Изложена основная гипотеза множественного докинга и описан алгоритм формирования совокупности пространств для его проведения. Выполнен простой и множественный докинг известных ингибиторов RAGE (рецептор конечных продуктов гликирования). Рассчитаны энергии простого докинга и спектры энергий множественного докинга этих соединений. Методом однофакторного дисперсионного анализа и дискриминантного анализа показано, что матрица энергий множественного докинга является статистически намного более значимой метрикой аффинности лигандов к фармакологически релевантным биомишеням, чем вектор энергий простого докинга.
Множественный докинг, спектр энергий, аффинность лигандов, биомишень, многомерная метрика, дискриминантный анализ
Короткий адрес: https://sciup.org/142230911
IDR: 142230911
Текст научной статьи Спектр энергий множественного докинга как многомерная метрика аффинности химических соединений к фармакологически релевантным биомишеням
В настоящее время наиболее популярным методом поиска in silico новых лекарственных веществ является молекулярный докинг. Общепринятая схема его проведения включает определение в 3D-модели белка-мишени пространства, охватывающего специфический сайт связывания, с последующим расчетом минимальной энергии взаимодействия с этим сайтом 3D-структур докируемых соединений [11]. При этом предполагается, что именно взаимодействие одной молекулы лиганда с локально определенным специфическим сайтом обусловливает конформационные изменения всей биомишени в целом и порождает ее биологический отклик, а единичное значение энергии этого взаимодействия является универсальной метрикой аффинности конкретного химического соединения к данному белку [6]. Часто в рамках этой стандартной схемы рассматриваются дополнительно еще несколько аллостерических сайтов. Но и в этом случае считается, что релевантные биологическому эффекту общие конформационные изменения белка-мишени детерминированы единичным значением энергии связывания молекулы лиганда с заданным сайтом.
Между тем, очевидно, что в биологически активных концентрациях с биомишенью связывается не одна молекула лиганда, а очень большое их число, причем взаимодействуют они не с изолированным от всей структуры белка сайтом связывания, а со всей поверхностью белка-мишени. Указанное несоответствие является одной из причин весьма низкой прогностической способности простого докинга, что породило множество замечаний, касающихся эффективности его использования [5]. Применение для учета мультиконформационных изменений молекулярной динамики не устраняет вышеописанных противоречий, поскольку и в этом случае рассчитывается энергия взаимодействия одной молекулы с ограниченным пространством заданного сайта [7].
Таким образом, разработка новой методологии оценки in silico аффинности химических соединений к фармакологически релевантным белкам-мишеням, основанная на учете взаимодействия лиганда со всей поверхностью белка, является научно востребованной и весьма актуальной задачей.
ЦЕЛЬ РАБОТЫ
Доказательство методами многомерной статистики валидности использования спектра энергий множественного докинга как статистически высоко достоверной метрики аффинности химических соединений к фармакологически релевантным биомишеням.
МЕТОДИКА ИССЛЕДОВАНИЯ
Основная гипотеза. Совокупность значений энергии докинга, рассчитанная для множества пространств, формируемых по всему объему белка-мишени, позволяет адекватно моделировать воздействие множества молекул лиганда на весь белок в целом и статистически более достоверно отражает аффинность доки-руемых структур к рассматриваемой биомишени, что позволяет с бóльшей точностью прогнозировать уровень фармакологической активности химических соединений.
Адекватность принимаемой к разработке гипотезы иллюстрируют следующие комплементарные ей факты.
-
1. Белок-мишень окружен огромным числом взаимодействующих с ним молекул лиганда. Количество молекул высоко активных веществ, действующих на целевую биомишень в наномо-лярной концентрации, составляет, с учетом числа Авогадро, 6.022·1023 x 10-9 ≈ 6·1014.
-
2. Структуры низкомолекулярных лигандов кратно помещаются в пространство целевого белка. С помощью программы HyperChem 8.0 [8] был рассчитан Ван-дер-Ваальсов объем 3D-модели соединения RAGE-0023 с высокой ингибирующей активностью из верифицированной базы данных [3], получено значение V = 1578 Ǻ3. Для субъединицы экспериментальной 3D-модели RAGE-рецептора 4LP4 [15] аналогичный расчетный показатель составил V = 34902 Ǻ3. По соотношению объемов молекула RAGE-0023 помещается в пространстве RAGE-рецептора не менее 22 раз.
Задачи исследования. Для достижения поставленной цели необходимо было решить следующие задачи.
-
1. Разработать алгоритм построения по всему объему белка-мишени пространств для множественного докинга и создать компьютер-
- ную программу для расчета координат указанных пространств.
-
2. С использованием белка-мишени, для которого имеются верифицированные данные по структуре и уровню активности известных соединений, испытанных на активность в отношении выбранного белка, выполнить простой докинг в его специфический сайт связывания и множественный докинг во все сформированные для этого пространства данного белка.
-
3. Рассчитать энергии простого докинга и спектры энергий множественного докинга указанных известных соединений.
-
4. Провести однофакторный дисперсионный анализ, устанавливающий статистическую значимость зависимости уровня активности известных соединений: а) от энергии, полученной в простом докинге; б) от спектра энергий, полученного в множественном докинге.
-
5. Выполнить с помощью дискриминатного анализа оценку точности прогноза уровня активности известных соединений с использованием в качестве метрик аффинности: а) вектора значений энергий, вычисленного в простом докинге; б) матрицы значений энергии, вычисленной в множественном докинге.
Алгоритм построения пространств для множественного докинга
Для выбранной 3D-модели белка определяют минимальные и максимальные значения координат образующих белок N атомов:
NN
U min = Min (U i ), U max = Max (U i ), i = 1 i = 1 (1)
здесь и далее U = X, Y, Z .
Размеры параллелепипеда для множественного докинга:
_ U max U min
DU = n , k 1 (2)
где k – кратность построения пространств для множественного докинга; минимально k = 3, что соответствует 27 пространствам.
Координаты начала и конца пространств для множественного докинга:
U Init,1 U min , U End,1 U min + D U ,
U Init i = U lnit, i- 1 + 2 D U , U Endi i = U lniti i + D U ■> i = 2,..., k .
Описанный алгоритм был реализован на языке Borland Delphi в виде программы MSite v21.04.22.
Выполнение простого и множественного докинга. В качестве пробной биомишени для проверки сформулированной выше гипотезы был выбран рецептор конечных продуктов гликирования RAGE. В расчетах использовалась его экспериментальная 3D-модель 4LP4 [15] – наиболее точная из трех валидных моделей, ранее найденных при выполнении работы [14], в которой также были определены координаты специфического сайта этого рецептора. Кроме того, на указанной модели 4LP4 с помощью программы MSite v21.04.22, в соответствии с выше описанным алгоритмом, были построены 27 пространств для множественного докинга.
Верифицированные данные по химической структуре и уровню RAGE-ингибирующей активности 183 известных веществ были взяты из оригинальной базы данных [3]. Градированный уровень активности Ind задавали следующими метками: H – высокая (38 соединений); M – умеренная (61 соединение); L – низкая (39 соединений); I – неактивно (45 соединений). Дополнительно формировали объединенные классы, в которых активность соединения Ind_H , Ind_HM , Ind_A обозначалась следующими метками: H / nH – “высокая” / “не высокая”; HM / nHM – “высокая или умеренная” / “не высокая или умеренная”; A / I – “активно” / “не активно”.
Оптимизированные 3D-модели указанных соединений были построены последовательно методами молекулярной механики с помощью программы MarvinSketch 17.1.23 [9] и полуэмпи-рическим квантово-химическим методом PM7 с помощью программы MOPAC2016 [10], с использованием описанной в работе [14] методики.
Ансамблевый докинг проводили с помощью программы AutoDock Vina 1.1.2 [13], каждое соединение в 10 конформерах по 5 раз в каждое пространство докинга, с вычислением по 50 полученным значениям минимальных энергий связывания ΔE , как это описано в [14]. Докинг выполняли отдельно в специфический сайт RAGE и отдельно в каждое из 27 пространств, сформированных для множественного докинга.
Полученная в результате расчетов сводная таблица для последующего статистического анализа включала в себя 32 колонки: шифры соединений; метки уровней RAGE-ингибирующей активности Ind , Ind_H , Ind_HM , Ind_A ; энергия докинга в специфический сайт ΔE 0 и энергии множественного докинга в 27 пространств ΔE 1 …ΔE 27 RAGE-рецептора.
Однофакторный дисперсионный анализ. Для показателей уровня активности Ind, Ind_H, Ind_HM и Ind_A, каждый из которых выполнял роль группировочной переменной, с помощью программы Statistica 8 [12] был выпол- нен однофакторный дисперсионный анализ (ANOVA) [1] зависимостей указанных факторов от вектора единичных значений энергии докинга в специфический сайт ΔE0 и от многомерной матрицы значений энергий множественного докинга ΔE1…ΔE27. Для каждого из восьми сравнений рассчитаны величины критерия лямбда Уилкса Λ, соответствующего ему критерия Фишера F и определена статистическая достоверность p используемых метрик аффиности.
Дискриминантный анализ. С целью оценки точности прогноза уровня RAGE-ингибирующей активности по показателям Ind , Ind_H , Ind_HM и Ind_A с помощью программы Statistica 8 [12] был выполнен дискриминантный анализ [4], в котором независимыми переменными служили энергия докинга ΔE 0 и энергии множественного докинга ΔE 1 …ΔE 27 . Для каждой из восьми классификаций рассчитаны общая точность прогноза F 0 , точность прогноза активных соединений F a (чувствительность) и точность прогноза неактивных соединений F n (специфичность). С помощью биномиального критерия z [2] оценена статистическая достоверность p общей точности прогноза.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ИХ ОБСУЖДЕНИЕ
В табл. 1 приведены результаты дисперсионного анализа, которые доказывают преимущество использования матрицы энергий множественного докинга для оценки аффинности лигандов к релевантной биомишени, в сравнении с вектором энергий простого докинга.
Энергия докинга в специфический сайт ΔE 0 для всех четырех показателей уровня RAGE-ингибирующей активности не является статистически значимой переменной, отражающей аффинность лигандов к данному рецептору – все вычисленные значения p намного превышают общепринятый порог значимости p = 0,05.
Напротив, спектр энергий множественного докинга ΔE 1 …ΔE 27 является статистически высоко достоверной метрикой аффинности RAGE-лигандов – все вычисленные значения p < 0,05. Очень высоко достоверная зависимость с p = 0,0007 выявлена для показателя высокого уровня активности Ind_H . На этом основании можно утверждать, что указанный многомерный параметр ΔE 1 …ΔE 27 можно весьма эффективно применять в поиске in silico соединений с высокой RAGE-ингибирующей активностью.
Приведенные в табл. 2 результаты дис-криминатного анализа полностью согласуются с результатами дисперсионного анализа и подтверждают вывод о том, что матрица энергий множественного докинга является статистиче- ности лигандов к релевантной биомишени, в ски намного более значимой метрикой аффин- сравнении вектором энергий простого докинга.
Результаты однофакторного дисперсионного анализа зависимостей уровня RAGE-ингибирующей активности от энергий докинга
Таблица 1
Показатель достоверности |
Значение для показателя уровня активности |
|||
Ind \ |
Ind_H \ |
Ind_HM \ |
Ind_A |
|
Энергия докинга в специфический сайт ΔE 0 |
||||
Λ Уилкса |
0.983 |
0.992 |
0.985 |
0.997 |
F Фишера |
1.013 |
1.487 |
2.735 |
0.640 |
p |
0.3883 |
0.2243 |
0.0999 |
0.4248 |
Энергии множественного докинга ΔE 1 …ΔE 27 |
||||
Λ Уилкса |
0.480 |
0.711 |
0.767 |
0.784 |
F Фишера |
1.576 |
2.333 |
1.745 |
1.583 |
p |
0.0022 |
0.0007 |
0.0191 |
0.0442 |
Таблица 2
Результаты прогноза методом дискриминантного анализа уровня RAGE-ингибирующей активности на основе энергий докинга
Показатель точности прогноза |
Значение для показате ля уровня активности |
|||
Ind \ |
Ind_H \ |
Ind_HM \ |
Ind_A |
|
Энергия докинга в специфический сайт ΔE 0 |
||||
F 0 , % |
24.6 |
54.1 |
50.3 |
51.4 |
F a , % |
6.7 |
60.5 |
50.5 |
55.8 |
F n , % |
29.0 |
52.4 |
50.0 |
37.8 |
z |
0.00 |
0.76 |
0.03 |
0.24 |
p |
0.500 |
0.224 |
0.488 |
0.405 |
Энергии множественного докинга ΔE |
…ΔE 27 |
|||
F 0 |
59.6 |
78.7 |
70.5 |
73.2 |
F a |
54.5 |
78.9 |
69.7 |
70.3 |
F n |
66.7 |
78.6 |
71.4 |
82.2 |
z |
1.81 |
5.46 |
3.90 |
4.41 |
p |
3.51·10-2 |
2.32·10-8 |
4.89·10-5 |
5.11·10-6 |
Точность прогноза F 0 RAGE-ингибирующей активности с использованием в качестве независимой переменной энергии докинга в специфический сайт ΔE 0 является статистически незначимой для всех четырех показателей ее уровня. В ряде случаев вычисленные оценки даже меньше точности случайного угадывания, составляющей 50 %.
В то же время при использовании энергий множественного докинга ΔE 1 …ΔE 27 все оценки точности прогноза F 0 являются статистически достоверными – все расчетные величины p < 0,05. При этом значения всех показателей F 0 , F a , F n превышают точность случайного угадывания.
В дискриминатном анализе подтверждено наличие высоко достоверной зависимости от (ΔE1…ΔE27) показателя высокого уровня активности Ind_H – в этом случае точность про- гноза составляет F0 = 78,7 %, что соответствует значимости по биномиальному критерию p = 2,32·10-8.
Таким образом, на примере RAGE-ингибирующей активности, с использованием двух методов многомерной статистики – однофакторного дисперсионного анализа и дискриминантного анализа, доказано, что спектр энергий докинга химических соединений в множество пространств релевантного белка является намного более достоверной метрикой аффинности лигандов к биомишеням, в сравнении с единичной энергией их докинга в специфический сайт.
Следует особо подчеркнуть, что применение множественного докинга для расчета аффинности соединений не требует определения в белке-мишени местоположения специфического сайта связывания.
ЗАКЛЮЧЕНИЕ
-
1. Методами многомерной статистики доказана валидность использования спектра энергий множественного докинга как статистически высоко достоверной метрики аффинности химических соединений к фармакологически релевантным биомишеням.
-
2. Статистическая достоверность и точность прогноза уровня фармакологической активности химических соединений с использованием спектра значений энергий множественного докинга существенно превышает аналогичные показатели, полученные с применением единичного значения энергии докинга в специфический сайт белка-мишени.
-
3. Для расчета аффинности соединений методом множественного докинга не требуется выявлять в белке специфический сайт связывания.
Работа выполнена в рамках государственного задания Министерства здравоохранения Российской Федерации № 121060700050-2 «Разработка методологии компьютерного поиска фармакологически активных соединений на основе множественного докинга и технологии искусственных нейронных сетей».