Молекулярное моделирование распознавания стоп-кодона фактором терминации трансляции 1-го типа ERF1

Автор: Мазур Ю.А., Опарина Н.Ю.

Журнал: Труды Московского физико-технического института @trudy-mipt

Рубрика: Оригинальные статьи

Статья в выпуске: 1 т.1, 2009 года.

Бесплатный доступ

Короткий адрес: https://sciup.org/142185570

IDR: 142185570

Текст статьи Молекулярное моделирование распознавания стоп-кодона фактором терминации трансляции 1-го типа ERF1

Терминация трансляции — важнейший завершающий этап синтеза белка, при котором обеспечивается высокая точность распознавания «бессмысленных» стоп-кодонов и новосинтезирован-ные полипептиды диссоциируют от рибосом. В отличие от прокариот, у которых декодирование трёх стоп-кодонов UAA, UAG и UGA осуществляется с помощью двух паралогичных факторов терминации RF1 и RF2, отличающихся специфичностью по отношению к стоп-кодонам, у эукариот и архебактерий все три стоп-кодона с одинаковой эффективностью декодируются одним белковым фактором — eRF1/aRF1 [1– 4]. Собственно распознавание стоп-кодонов происходит после связывания фактора eRF1/aRF1 с A-сайтом рибосомы, однако есть ряд свидетельств, что основную роль в специфическом декодировании играет не рибосома, а eRF1/aRF1, точнее его N-концевой домен [5–10]. Применение методов случайного [11] и направленного мутагенеза [8, 9] позволили выявить в N-концевом домене eRF1 ряд аминокислотных остатков, замены в которых меняют специфичность декодирования стоп-кодонов. Однако несмотря на расположение в одном домене и сближенность некоторых из выявленных участков, в целом они расположены в различных областях декодирующего домена eRF1 и не образуют четких пространственных кластеров. Одним из многообещающих подходов для выявления механизма распознавания стоп-кодона служит исследование филогенетических групп, в которых наблюдают отклонения от стандартного генетического кода. В частности, для инфузорий Stylonychia, Tetrahymena и Paramecium стоп-кодоном служит только UGA, а триплеты UAA и UAG кодируют глутамин, а для Euplotes показано использование в качестве стоп-кодонов только UAA и UAG, но не UGA, который кодирует цистеин [7, 12–15]. В перечисленных работах были предприняты попытки выявления области eRF1, отвечающей за специфическое декодирование стоп-кодонов, с помощью сравнительного анализа выравненных аминокислотных последовательностей eRF1, различающихся набором распознаваемых стоп-кодонов. Однако и в этом случае не выявили четкого кластера аминокислотных замен, который можно было бы считать потенциальным сайтом декодирования. На основании сравнения eRF1 из групп с одинаковым изменением специфичности распознавания стоп-кодонов экспериментально показано, что, по-видимо-му, один и тот же тип изменения специфичности связывания N-концевого домена eRF1 со стоп-кодонами можно создать рядом независимых способов с использованием пространственно разнесенных аминокислотных замен [10, 14].

Следует отметить, что во всех перечисленных случаях имеющиеся экспериментальные данные позволяют сопоставлять способность eRF1 распознавать только 2-й и 3-й пуриновые нуклеотиды стоп-кодона (AA, AG или GA) и отличать их от 2-го и 3-го гуаниновых нуклеотидов триптофанового кодона UGG, сведения же о распознавании первого инвариантного урацила стоп-кодонов незначительны.

В нашей работе проведено молекулярное моделирование образования комплексов N-концевого домена eRF1 человека (PDB 1dt9) и «специфических» рибодинуклеотидов AA, AG и GA в сравнении с «неспецифическим» рибодинуклеотидом GG.

  • II.    Материалы и методы

    • II.1.    Исходные данные

Для анализа взаимодействия N-концевого домена белка eRF1 человека с пуриновыми динуклеотидами стоп-кодонов и родственным «неспецифическим» динуклеотидом GG использована структура 1DT9 из банка данных RCSB (. Из структуры полноразмерного белка eRF1 была вырезана с использованием пакета программ Sybyl ( структура N-концевого домена, состоящая из аминокислотных остатков 5-140. С помощью программы Biopolymer из пакета программ Sybyl были получены модели рибодинуклеотидов PO4-5’-AA-3’-OH, PO4-5’-AG-3’-OH, PO4-5’-GA-3’-OH и PO4-5’-GG-3’-OH в виде одноцепочечных фрагментов A-формы

РНК. Необходимые точечные мутации в комплексы N-домен+dNTP вносились с помощью программ SwissPDBViever и пакета программ Sybyl.

  • II.2.    Молекулярный докинг

    Молекулярный докинг пуриновых рибонуклеотидов на N-концевой домен eRF1 человека выполнен с помощью программы Autodock 3.0 в отсутствие начальных ограничений. Для оптимизации скоринг-функции применяли параметры для докинга РНК (Moitessier et. al., 2006) [16]. Использован генетический алгоритм для автоматического докинга. Для каждого рибодинуклеотида проводили 100 независимых раундов молекулярного докинга.

  • II.3.    Анализ результатов молекулярного докинга и кластеризация потенциальных моделей комплексов N-концевого домена eRF1 с рибодинуклеотидами

Среди вариантов расположения лигандов на первом этапе были выбраны только те, для которых энергия взаимодействия согласно скоринг-функции программы Autodock была минимальна.

Далее с помощью in-house программы фильтрации результатов молекулярного докинга были рассчитаны межмолекулярные взаимодействия для РНК-белковых комплексов (включая водородные связи и ван-дер-ваальсовы взаимодействия) и применены следующие фильтры: отсутствие плотного (ближе 4Е) контакта с белком для 5’/3’ концов рибодинуклеотида (данный параметр определяется тем, что изучаемые рибодинуклеотиды на деле представляют собой фрагменты мРНК); основная часть (более 80% ) межмолекулярных взаимодействий для рибодинуклеотида должна приходиться на азотистые основания, а не на сахарофосфатный остов; наличие среди контактов не менее 3 связей с длиной до 3,5Е; соотношение контактов между первым и вторым пуринами не должно превышать 3:1 (этот параметр введён, чтобы избежать отбора стабильных комплексов, для которых большая часть РНК-белковых взаимодействий приходится только на один из нуклеотидов, что не позволяет считать такие взаимодействия специфичными).

На втором этапе все модели комплексов, прошедшие фильтр, были классифицированы согласно их пространственному расположению на N-концевом домене eRF1 (согласно совпадению аминокислотных остатков, взаимодействующих с 1-м и 2-м пуринами рибодинуклеотида соответственно). По результатам работы программы были построены кластеры возможных специфичных РНК-белковых взаимодействий с использованием пакета программ CLUTO (glaros.dtc.umn.edu/gkhome/views/cluto) и in-house разработанного программного продукта. Для каждого из кластеров были посчитаны средние энергии, и если эти средние энергии оказывались отрицательными, то из таких кластеров отбиралась лучшая модель и далее использовалась для молекулярной динамики.

  • II.4.    Молекулярная динамика

Молекулярная динамика отобранных в докинге моделей была выполнена с помощью пакета программ Amber. Были использованы условия непрямого указания растворителя. Последовательность действий при молекулярной динамике была следующей: этап минимизации структуры, медленный нагрев от 0 до 300 Ки проведения динамики при 300 К до достижения равновесного состояния. Поскольку параметры диэлектрической проницаемости рибосомы в области A -сайта неизвестны, была выбрана условная единица 20, основанная на большей гидрофильности РНК, нежели внутренняя часть белковой глобулы (где диэлектрическая проницаемость равна 4). Аналогичная процедура проводилась для свободного N-домена eRF1 и для свободных динуклеотидов AA, AG, GA и GG. Это позволило определить потенциальную энергию в равновесном состоянии и разницу этой энергии для комплекса и для пары «свободный белок + свободный лиганд».

Кроме того, для комплексов AG/eRF1 и GA/eRF1 получены «мутантные» структуры, в которых искусственно аденин был заменен на гуанин (программа SwissPDBViewer), при этом расположение нуклеотидов не меняли. Молекулярная динамика этих комплексов была проведена при тех же условиях.

  • III.    Результаты

При проведении «слепого» молекулярного докинга подавляющее большинство моделей соответствовало расположению лиганда в области, близкой к функционально важному Y-C-F району [1, 8–9]для каждого из динуклеотидов AA, AG, GA и GG. Однако отобранные модели не позволяли с помощью фильтрации по энергии взаимодействия, определённой с помощью скоринг-функции Autodock 3.0, выявить более локальный участок взаимодействия. Поэтому нами была применена система фильтрации моделей комплексов, необходимая для отбора потенциально специфических комплексов динуклеотид — eRF1 (см. материалы и методы). При этом были отобраны кластеры моделей расположения пуринового динуклеотида в комплексе с eRF1 (рис. 1). Однако на основании одного только сравнения энергий взаимодействия также не удаётся определить сайт декодирования стоп-кодона в eRF1. Нами было замечено, что среди выявленных ориентаций динуклеотидов AA, AG и GA присутствует чрезвычайно близкое направление (отмеченное черной стрелкой), в то же время комплексов с аналогичным расположением динуклеотидного лиганда для моделей связывания GG и eRF1 не обнаружено (существует лишь близкое направление). Это позволило нам предположить, что в отличие от РНК-белковых комплексов, образующихся в растворе, специфический комплекс eRF1–стоп-кодон не способен образовываться в отсутствие рибосомы, которая обеспечивает правильное взаимное расположение домена 1 eRF1 и стоп-кодона в мРНК. Таким образом, модели комплексов динуклеотидов AA, AG и GA, соответствующие общему кластеру расположения лиганда, отсутствующему среди комплексов eRF1 с GG, были отобраны для дальнейшего исследования с помощью молекулярной динамики. Как указывалось выше (см. материалы и методы), для дальнейшего анализа также были использованы представители других кластеров.

Для более точного анализа взаимодействий в комплексе РНК–белок, а также для оценки его стабильности была проведена молекулярная динамика отобранных моделей. На основании анализа энер- гий взаимодействия домена 1 eRF1 со специфическими динуклеотидами AA, AG и GA и с неспецифическим GG были отобраны три модели (модели AA_82, AG_66, GA_96), по 1 модели для каждого специфического динулеотида, отвечающие следующим требованиям: энергии взаимодействия eRF1 со специфическими лигандами должны быть близки, но в то же время быть значительно ниже, чем энергии связывания eRF1 с неспецифическим лигандом GG (табл. 1).

Проведённый анализ контактных аминокислотных остатков показал, что аминокислоты T122, S123, L124 и Y125 близко контактируют со всеми специфическими динуклеотидами (табл. 2). Значительная часть контактных аминокислотных остатков консервативна или инвариантна для eRF1 с неизмененной специфичностью распознавания стоп-кодона.

Мы провели анализ расположения вероятных водородных связей и ван-дер-ваальсовых взаимодействий для отобранных моделей комплексов. Как видно из таблицы 3, часть определённых контактных остатков участвует во взаимодействии одновременно и с первым, и со вторым нуклеотидами лиганда (соответствуют второму и третьему нуклеотидам стоп-кодона). Однако в целом можно говорить о предпочтительном участии аминокислотных остатков 122, 123в распознавании первого, а 125 — второго нуклеотидов лиганда.

Рис. 1. Расположение кластеров динуклеотид-ных лигандов в комплексе с доменом 1 eRF1. Стрелками схематически показаны направления, характерные для кластеров. Направление стрелок указывает направление от 5’ конца мРНК к 3’ концу

Таблица 1

Энергии взаимодействия специфических и неспецифического динуклеотидов с доменом 1 eRF1

Потенциальная энергия

Разница в энергии комплекса и пары (свободный белок+свободный лиганд)

AA

AA_26

-3048,1199

-13,397

AA_82

-3066,478

-31,7551

AA_69

-3028,9956

5,7273

AG

Сравнение с «мутантом» AG-GG

AG_41

-3085,8551

-16,5292

14,7129

AG_66

-3094,7455

-25,4196

-2,1839

GA

Сравнение с «мутантом» GA-GG

GA_29

-3049,7892

21,4498

-26,8293

GA_34

-3099,3908

-28,1518

-28,8103

GA_96

-3103,9689

-32,7299

-6,3395

Таблица 2

Контактирующие с динуклеотидным лигандом аминокислотные остатки в домене 1 eRF1

Intersections

Variation among eRF1s

AA

AG

GA

I38

Variable

P40

P40

Conserved

R47

R47

Conserved

V48

Variable

M51

Variable

D43

Conserved

P119

Invariant

N121

N121

Invariant

T122

T122

T122

Conserved

S123

S123

S123

Conserved

L124

L124

L124

Conserved

Y125

Y125

Y125

Invariant

L126

Conserved

H132

Conserved

E134

Conserved

A135

A135

Conserved

L136

Invariant

A138

Variable

L139

Invariant

Показаны близкие ( < 3 A ) контакты для моделей комплексов с AA, AG и GA. Аминокислоты и их нумерация соответствуют eRF1 человека. Отмечена консервативность соответствующих остатков для eRF1, распознающих все три стоп-кодона. Выделены аминокислоты, контактирующие со всеми вариантами динуклеотидных лигандов.

Рахица а энергии коажэпекса и пары свободный бепокесвободныи лиганд при Е=?0

Gln122-Phe123)

В конце мы провели виртуальный мутагенез, при котором заменили две аминокислоты Thr122-Ser123 на Gln122-Phe123. После проведённой 15 пс молекулярной динамики были определены энергии взаимодействия (рис. 2). Как легко заметить, наиболее стабильным среди проанализированных вариантов оказался комплекс с GA, соответствующий стоп-кодону UGA, но не комплексы с AA и AG, представляющими фрагменты стоп-кодонов UAA и UAG. Таким образом, полученные данные полностью соответствуют известным результатам эксперимента, что подтверждает высокую специфичность взаимодействия полученных нами молекулярных моделей [10]. Необходимо отметить, что наилучшее соответствие с экспериментом показала тройка моделей AA_mod82, AG_mod66, GA_mod96, которые соответствуют немутированным моделям AA_82, AG_66, GA_96. Поскольку отбор этих моделей был независимым в двух виртуальных экспериментах, можно говорить о данных моделях как о потенциальных кандидатах в качестве специфических комплек- сов посадки мРНК на N-концевой домен eRF1 человека.

Таблица 3

Аминокислотные остатки домена 1 eRF1, образующие вероятные водородные связи и/или ван-дер-ваальсовы взаимодействия с первым и вторым нуклеотидами специфического динуклеотидного лиганда

Amino acid

AA

AG

GA

ILE38

A2

ARG47

A1

G1

VAL48

G1

MET51

G1

ASN121

A1

A2

THR122

A1, A2

A1

G1

SER123

A1

A1

G1

LEU124

A2

G2

A2

TYR125

A1, A2

G2

A2, G1

HIS132

G2

GLU134

G2

ALA135

A2

  • IV.    Выводы

Впервые применены методы молекулярного моделирования для определения декодирующего участка на N-концевом домене eRF1 человека. Показано, что как для специфических пуринов стоп-кодонов (AA, AG и GA), так и для неспецифического динуклеотида GG удаётся выявить сайты связывания, близкие по пространственному расположению и энергии. Тем не менее, благодаря использованным в настоящей работе параметрам фильтрации моделей РНК-белковых комплексов удаётся выявить такое расположение пуриновых динуклеотидов на N-концевом домене eRF1, которое отвечает требованиям высокоспецифического связывания. Дополнительно проведённый виртуальный мутагенез части контактных аминокислот показал совпадение результатов молекулярного моделирования с известными ранее экспериментальными данными.

Статья