Спектр энергий множественного докинга как многомерная метрика аффинности химических соединений к фармакологически релевантным биомишеням

Автор: Васильев П.М., Кочетков А.Н., Спасов А.А., Перфильев М.А.

Журнал: Волгоградский научно-медицинский журнал @bulletin-volgmed

Статья в выпуске: 3 (71), 2021 года.

Бесплатный доступ

Изложена основная гипотеза множественного докинга и описан алгоритм формирования совокупности пространств для его проведения. Выполнен простой и множественный докинг известных ингибиторов RAGE (рецептор конечных продуктов гликирования). Рассчитаны энергии простого докинга и спектры энергий множественного докинга этих соединений. Методом однофакторного дисперсионного анализа и дискриминантного анализа показано, что матрица энергий множественного докинга является статистически намного более значимой метрикой аффинности лигандов к фармакологически релевантным биомишеням, чем вектор энергий простого докинга.

Множественный докинг, спектр энергий, аффинность лигандов, биомишень, многомерная метрика, дискриминантный анализ

Короткий адрес: https://sciup.org/142230911

IDR: 142230911

Текст научной статьи Спектр энергий множественного докинга как многомерная метрика аффинности химических соединений к фармакологически релевантным биомишеням

В настоящее время наиболее популярным методом поиска in silico новых лекарственных веществ является молекулярный докинг. Общепринятая схема его проведения включает определение в 3D-модели белка-мишени пространства, охватывающего специфический сайт связывания, с последующим расчетом минимальной энергии взаимодействия с этим сайтом 3D-структур докируемых соединений [11]. При этом предполагается, что именно взаимодействие одной молекулы лиганда с локально определенным специфическим сайтом обусловливает конформационные изменения всей биомишени в целом и порождает ее биологический отклик, а единичное значение энергии этого взаимодействия является универсальной метрикой аффинности конкретного химического соединения к данному белку [6]. Часто в рамках этой стандартной схемы рассматриваются дополнительно еще несколько аллостерических сайтов. Но и в этом случае считается, что релевантные биологическому эффекту общие конформационные изменения белка-мишени детерминированы единичным значением энергии связывания молекулы лиганда с заданным сайтом.

Между тем, очевидно, что в биологически активных концентрациях с биомишенью связывается не одна молекула лиганда, а очень большое их число, причем взаимодействуют они не с изолированным от всей структуры белка сайтом связывания, а со всей поверхностью белка-мишени. Указанное несоответствие является одной из причин весьма низкой прогностической способности простого докинга, что породило множество замечаний, касающихся эффективности его использования [5]. Применение для учета мультиконформационных изменений молекулярной динамики не устраняет вышеописанных противоречий, поскольку и в этом случае рассчитывается энергия взаимодействия одной молекулы с ограниченным пространством заданного сайта [7].

Таким образом, разработка новой методологии оценки in silico аффинности химических соединений к фармакологически релевантным белкам-мишеням, основанная на учете взаимодействия лиганда со всей поверхностью белка, является научно востребованной и весьма актуальной задачей.

ЦЕЛЬ РАБОТЫ

Доказательство методами многомерной статистики валидности использования спектра энергий множественного докинга как статистически высоко достоверной метрики аффинности химических соединений к фармакологически релевантным биомишеням.

МЕТОДИКА ИССЛЕДОВАНИЯ

Основная гипотеза. Совокупность значений энергии докинга, рассчитанная для множества пространств, формируемых по всему объему белка-мишени, позволяет адекватно моделировать воздействие множества молекул лиганда на весь белок в целом и статистически более достоверно отражает аффинность доки-руемых структур к рассматриваемой биомишени, что позволяет с бóльшей точностью прогнозировать уровень фармакологической активности химических соединений.

Адекватность принимаемой к разработке гипотезы иллюстрируют следующие комплементарные ей факты.

1. Белок-мишень окружен огромным числом взаимодействующих с ним молекул лиганда. Количество молекул высоко активных веществ, действующих на целевую биомишень в наномо-лярной концентрации, составляет, с учетом числа Авогадро, 6.022·10²³ x 10^-9 ≈ 6·10¹⁴.
2. Структуры низкомолекулярных лигандов кратно помещаются в пространство целевого белка. С помощью программы HyperChem 8.0 [8] был рассчитан Ван-дер-Ваальсов объем 3D-модели соединения RAGE-0023 с высокой ингибирующей активностью из верифицированной базы данных [3], получено значение V = 1578 Ǻ³. Для субъединицы экспериментальной 3D-модели RAGE-рецептора 4LP4 [15] аналогичный расчетный показатель составил V = 34902 Ǻ³. По соотношению объемов молекула RAGE-0023 помещается в пространстве RAGE-рецептора не менее 22 раз.

Задачи исследования. Для достижения поставленной цели необходимо было решить следующие задачи.

1. Разработать алгоритм построения по всему объему белка-мишени пространств для множественного докинга и создать компьютер-
ную программу для расчета координат указанных пространств.
2. С использованием белка-мишени, для которого имеются верифицированные данные по структуре и уровню активности известных соединений, испытанных на активность в отношении выбранного белка, выполнить простой докинг в его специфический сайт связывания и множественный докинг во все сформированные для этого пространства данного белка.
3. Рассчитать энергии простого докинга и спектры энергий множественного докинга указанных известных соединений.
4. Провести однофакторный дисперсионный анализ, устанавливающий статистическую значимость зависимости уровня активности известных соединений: а) от энергии, полученной в простом докинге; б) от спектра энергий, полученного в множественном докинге.
5. Выполнить с помощью дискриминатного анализа оценку точности прогноза уровня активности известных соединений с использованием в качестве метрик аффинности: а) вектора значений энергий, вычисленного в простом докинге; б) матрицы значений энергии, вычисленной в множественном докинге.

Алгоритм построения пространств для множественного докинга

Для выбранной 3D-модели белка определяют минимальные и максимальные значения координат образующих белок N атомов:

U min = Min (U i ), U _max = Max (U i ), i = 1 i = 1 (1)

здесь и далее U = X, Y, Z .

Размеры параллелепипеда для множественного докинга:

_ ^U max ^U min

DU = n , k 1 (2)

где k – кратность построения пространств для множественного докинга; минимально k = 3, что соответствует 27 пространствам.

Координаты начала и конца пространств для множественного докинга:

^U Init,1 ^U min , ^U End,1 ^U min + D U ,

^U Init i = U lnit, i- 1 + 2 D U , U Endi i = U lniti i + D U ■> i = 2,..., k .

Описанный алгоритм был реализован на языке Borland Delphi в виде программы MSite v21.04.22.

Выполнение простого и множественного докинга. В качестве пробной биомишени для проверки сформулированной выше гипотезы был выбран рецептор конечных продуктов гликирования RAGE. В расчетах использовалась его экспериментальная 3D-модель 4LP4 [15] – наиболее точная из трех валидных моделей, ранее найденных при выполнении работы [14], в которой также были определены координаты специфического сайта этого рецептора. Кроме того, на указанной модели 4LP4 с помощью программы MSite v21.04.22, в соответствии с выше описанным алгоритмом, были построены 27 пространств для множественного докинга.

Верифицированные данные по химической структуре и уровню RAGE-ингибирующей активности 183 известных веществ были взяты из оригинальной базы данных [3]. Градированный уровень активности Ind задавали следующими метками: H – высокая (38 соединений); M – умеренная (61 соединение); L – низкая (39 соединений); I – неактивно (45 соединений). Дополнительно формировали объединенные классы, в которых активность соединения Ind_H , Ind_HM , Ind_A обозначалась следующими метками: H / nH – “высокая” / “не высокая”; HM / nHM – “высокая или умеренная” / “не высокая или умеренная”; A / I – “активно” / “не активно”.

Оптимизированные 3D-модели указанных соединений были построены последовательно методами молекулярной механики с помощью программы MarvinSketch 17.1.23 [9] и полуэмпи-рическим квантово-химическим методом PM7 с помощью программы MOPAC2016 [10], с использованием описанной в работе [14] методики.

Ансамблевый докинг проводили с помощью программы AutoDock Vina 1.1.2 [13], каждое соединение в 10 конформерах по 5 раз в каждое пространство докинга, с вычислением по 50 полученным значениям минимальных энергий связывания ΔE , как это описано в [14]. Докинг выполняли отдельно в специфический сайт RAGE и отдельно в каждое из 27 пространств, сформированных для множественного докинга.

Полученная в результате расчетов сводная таблица для последующего статистического анализа включала в себя 32 колонки: шифры соединений; метки уровней RAGE-ингибирующей активности Ind , Ind_H , Ind_HM , Ind_A ; энергия докинга в специфический сайт ΔE 0 и энергии множественного докинга в 27 пространств ΔE 1 …ΔE 27 RAGE-рецептора.

Однофакторный дисперсионный анализ. Для показателей уровня активности Ind, Ind_H, Ind_HM и Ind_A, каждый из которых выполнял роль группировочной переменной, с помощью программы Statistica 8 [12] был выпол- нен однофакторный дисперсионный анализ (ANOVA) [1] зависимостей указанных факторов от вектора единичных значений энергии докинга в специфический сайт ΔE0 и от многомерной матрицы значений энергий множественного докинга ΔE1…ΔE27. Для каждого из восьми сравнений рассчитаны величины критерия лямбда Уилкса Λ, соответствующего ему критерия Фишера F и определена статистическая достоверность p используемых метрик аффиности.

Дискриминантный анализ. С целью оценки точности прогноза уровня RAGE-ингибирующей активности по показателям Ind , Ind_H , Ind_HM и Ind_A с помощью программы Statistica 8 [12] был выполнен дискриминантный анализ [4], в котором независимыми переменными служили энергия докинга ΔE 0 и энергии множественного докинга ΔE 1 …ΔE 27 . Для каждой из восьми классификаций рассчитаны общая точность прогноза F 0 , точность прогноза активных соединений F a (чувствительность) и точность прогноза неактивных соединений F n (специфичность). С помощью биномиального критерия z [2] оценена статистическая достоверность p общей точности прогноза.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ИХ ОБСУЖДЕНИЕ

В табл. 1 приведены результаты дисперсионного анализа, которые доказывают преимущество использования матрицы энергий множественного докинга для оценки аффинности лигандов к релевантной биомишени, в сравнении с вектором энергий простого докинга.

Энергия докинга в специфический сайт ΔE 0 для всех четырех показателей уровня RAGE-ингибирующей активности не является статистически значимой переменной, отражающей аффинность лигандов к данному рецептору – все вычисленные значения p намного превышают общепринятый порог значимости p = 0,05.

Напротив, спектр энергий множественного докинга ΔE 1 …ΔE 27 является статистически высоко достоверной метрикой аффинности RAGE-лигандов – все вычисленные значения p < 0,05. Очень высоко достоверная зависимость с p = 0,0007 выявлена для показателя высокого уровня активности Ind_H . На этом основании можно утверждать, что указанный многомерный параметр ΔE 1 …ΔE 27 можно весьма эффективно применять в поиске in silico соединений с высокой RAGE-ингибирующей активностью.

Приведенные в табл. 2 результаты дис-криминатного анализа полностью согласуются с результатами дисперсионного анализа и подтверждают вывод о том, что матрица энергий множественного докинга является статистиче- ности лигандов к релевантной биомишени, в ски намного более значимой метрикой аффин- сравнении вектором энергий простого докинга.

Результаты однофакторного дисперсионного анализа зависимостей уровня RAGE-ингибирующей активности от энергий докинга

Таблица 1

Показатель достоверности	Значение для показателя уровня активности
Показатель достоверности	Ind \	Ind_H \	Ind_HM \	Ind_A
Энергия докинга в специфический сайт ΔE 0
Λ Уилкса	0.983	0.992	0.985	0.997
F Фишера	1.013	1.487	2.735	0.640
p	0.3883	0.2243	0.0999	0.4248
Энергии множественного докинга ΔE 1 …ΔE 27
Λ Уилкса	0.480	0.711	0.767	0.784
F Фишера	1.576	2.333	1.745	1.583
p	0.0022	0.0007	0.0191	0.0442

Таблица 2

Результаты прогноза методом дискриминантного анализа уровня RAGE-ингибирующей активности на основе энергий докинга

Показатель точности прогноза	Значение для показате ля уровня активности
Показатель точности прогноза	Ind \	Ind_H \	Ind_HM \	Ind_A
Энергия докинга в специфический сайт ΔE 0
F 0 , %	24.6	54.1	50.3	51.4
F a , %	6.7	60.5	50.5	55.8
F n , %	29.0	52.4	50.0	37.8
z	0.00	0.76	0.03	0.24
p	0.500	0.224	0.488	0.405
	Энергии множественного докинга ΔE		…ΔE 27
F 0	59.6	78.7	70.5	73.2
F a	54.5	78.9	69.7	70.3
F n	66.7	78.6	71.4	82.2
z	1.81	5.46	3.90	4.41
p	3.51·10^-2	2.32·10^-8	4.89·10^-5	5.11·10^-6

Точность прогноза F 0 RAGE-ингибирующей активности с использованием в качестве независимой переменной энергии докинга в специфический сайт ΔE 0 является статистически незначимой для всех четырех показателей ее уровня. В ряде случаев вычисленные оценки даже меньше точности случайного угадывания, составляющей 50 %.

В то же время при использовании энергий множественного докинга ΔE 1 …ΔE 27 все оценки точности прогноза F 0 являются статистически достоверными – все расчетные величины p < 0,05. При этом значения всех показателей F 0 , F a , F n превышают точность случайного угадывания.

В дискриминатном анализе подтверждено наличие высоко достоверной зависимости от (ΔE1…ΔE27) показателя высокого уровня активности Ind_H – в этом случае точность про- гноза составляет F0 = 78,7 %, что соответствует значимости по биномиальному критерию p = 2,32·10-8.

Таким образом, на примере RAGE-ингибирующей активности, с использованием двух методов многомерной статистики – однофакторного дисперсионного анализа и дискриминантного анализа, доказано, что спектр энергий докинга химических соединений в множество пространств релевантного белка является намного более достоверной метрикой аффинности лигандов к биомишеням, в сравнении с единичной энергией их докинга в специфический сайт.

Следует особо подчеркнуть, что применение множественного докинга для расчета аффинности соединений не требует определения в белке-мишени местоположения специфического сайта связывания.

ЗАКЛЮЧЕНИЕ

1. Методами многомерной статистики доказана валидность использования спектра энергий множественного докинга как статистически высоко достоверной метрики аффинности химических соединений к фармакологически релевантным биомишеням.
2. Статистическая достоверность и точность прогноза уровня фармакологической активности химических соединений с использованием спектра значений энергий множественного докинга существенно превышает аналогичные показатели, полученные с применением единичного значения энергии докинга в специфический сайт белка-мишени.
3. Для расчета аффинности соединений методом множественного докинга не требуется выявлять в белке специфический сайт связывания.

Работа выполнена в рамках государственного задания Министерства здравоохранения Российской Федерации № 121060700050-2 «Разработка методологии компьютерного поиска фармакологически активных соединений на основе множественного докинга и технологии искусственных нейронных сетей».

Статья научная