Пространственная модель генетического кода в виде полуправильного многогранника "усеченный октаэдр"

Автор: Корчмарюк Ян Илларионович, Коваленко Александр Владимирович

Журнал: Природные системы и ресурсы @ns-jvolsu

Рубрика: Биология и биотехнология

Статья в выпуске: 4 (18), 2016 года.

Бесплатный доступ

В настоящей работе, относящейся к области биоинформатики, математико-статистическим методом факторного анализа анализируются все 4! = 24 перестановки чисел «1, 2, 3, 4» как 4 фактора. В результате численного анализа получены 4 факторные координаты (x, y, z). Минимальные евклидовы расстояния между всеми 24 вершинами образуют ребра фигуры «усеченный октаэдр». Каждой вершине усеченного октаэдра сопоставлен триплет - кодон генетического кода и соответствующая ему аминокислота. Построены графики проекций фигуры «усеченный октаэдр» и изометрическое (трехмерное) ее изображение. Проанализированы обнаруженные закономерности в физических и химических свойствах аминокислот, распределенных по вершинам построенной фигуры. Произведена интерпретация трех факторных осей координат.

Еще

Усеченный октаэдр, факторный анализ, генетический код, перестановки, биоинформатика

Короткий адрес: https://sciup.org/149131404

IDR: 149131404   |   DOI: 10.15688/jvolsu11.2016.4.3

Текст научной статьи Пространственная модель генетического кода в виде полуправильного многогранника "усеченный октаэдр"

DOI:

Методы математического анализа давно и широко используются для изучения генетического кода [4; 12; 20]. Наиболее популярен кластерный анализ [13; 18], а также методы комбинаторики [7] с широкими возможностями перестановок [6; 8; 10; 11]. Но с исходным представлением генетического кода на уровне кибернетики до сих пор существуют различные вариации. Мы обратили внимание, что пространственные модели лучше опи-

сывают взаимосвязь элементов в системе, а усеченный октаэдр встречается только в поле изучения скаффолдов [17]. Хотя он может быть основой для связи нескольких десятков элементов друг с другом, его до настоящего момента не рассматривали как каркас для генетического кода. В связи с вышесказанным цель нашей работы – построить пространственную модель генетического кода на основе усеченного октаэдра.

Материалы и методы

Исходными данными были взяты 4! = 24 всевозможные перестановки натуральных целых положительных чисел {1, 2, 3, 4}[5; 9]. В качестве математико-статистического метода обработки данных был взят классический метод факторного анализа в программном комплексе «SPSS» с использованием методов главных компонент, Варимакс и нормализации Кайзера [1; 3; 16].

С целью построения трехмерной фигуры по данным трех факторных координат были построены евклидовы расстояния ( Rij = Ö(( xi xj )2 + ( yi yj )2 + ( zi zj )2) между всеми { i , j } 24 вершинами усеченного октаэдра. Все расстояния были нормированы на наименьшее из расстояний. Из всех нормированных расстояний была вычтена 1 (единица), для того, чтобы расстояние у вершин было равно 0 (нулю). Затем были выбраны все пары вершин, между которыми было нормированное 1 (единичное) расстояние, которое было взято за ребро усеченного октаэдра.

Для графического представления итоговых данных по усеченному октаэдру использовались графики трех проекций факторных осей.

Для корректности построенной аналогии 4 нуклеотида ДНК/РНК (CUAG) были упорядочены по возрастанию их молекулярной массы [2; 14; 15; 19] и поставлены в соответствие меткам вершин усеченного октаэдра (1234), следующим образом: 1 = С, 2 = U или Т, 3 = А, 4 = G.

Результаты

Построенная модель «усеченного октаэдра» обладает достаточной мерой общности, чтобы интерпретировать ее в различных теоретических приложениях. В настоящей статье авторами данная модель интерпретирована как трехмерный аналог известной кодовой таблицы 4 нуклеотидов и кодируемых ими 20 аминокислот. Из кодовой таблицы ДНК были выбраны все аминокислоты, которые соответствовали кодонам с неповторяющимися тройками нуклеотидов. Эти аминокислоты были приписаны соответствующим вершинам усеченного октаэдра по первым трем меткам четырехзначного кода их вершин. Старт-коды и стоп-коды были обозначены везде как «STOP» (рис. 1–4). Данные приведены в таблице.

Рис. 1. Генетический код в виде усеченного октаэдра, проекция XY

Рис. 2. Генетический код в виде усеченного октаэдра, проекция YZ

Рис. 3. Генетический код в виде усеченного октаэдра, проекция XZ

Рис. 4. Генетический код в виде усеченного октаэдра, проекция 3D

Обсуждение

Поскольку все вершины усеченного октаэдра лежат на поверхности описанной около него сферы, а все комбинации перестановок, начинающихся на 1, 2, 3 или 4, – лежат в одной плоскости сечения, то эти перестановки можно интерпретировать как «параллели глобуса», а связывающие их ребра – как «меридианы глобуса». При этом полученная трехмерная модель генетического кода обладает высокой симметрией, почти сферической, и выделяет подгруппу высокоэнтропийных (невырожденных) кодонов и их аминокислот из общей группы генетического кода, а также подгруппу «близколежащие и даль-нележащие коды и аминокислоты». Те, что в вершинах 6-угольников и 4-угольников.

Так как все расстояния в этой модели укладываются на логарифм (значения F1–F3 таблицы), то появляется возможность анализировать корреляции этих 10 типовых расстояний с параметрами кодонов и аминокислот.

Заключение

В силу большой общности построенной модели ее можно использовать в любых кодовых системах, которые имеют базовый алфавит в 24 (или менее) знаков. Например, в математической лингвистике, для букв и звуков алфавитов различных языков мира. Также построенную модель можно использовать в области искусственного интеллекта, если каждую вершину считать «формальным нейроном» в рамках персептронной парадигмы Розенблатта – Мак-Каллоха – Питса, а весовые коэффициенты межнейронных связей приписывать ребрам усеченного октаэдра.

Соотнесение генетического кода с усеченным октаэдром

Генетический код CUAG

Метка перестановок

Факторные оси

F1 = X

F2 = Y

F3 = Z

C

U

A

L Leu

1234

-0,69324

-0,53619

-1,45152

C

U

G

R Arg

1243

-1,45152

-0,53619

-0,69324

C

A

G

Q Gln

1342

-1,29448

-1,07238

0,22210

C

G

A

L Leu

1432

-0,37914

-1,60857

0,37914

C

G

U

R Arg

1423

0,37914

-1,60857

-0,37914

C

A

U

H His

1324

0,22210

-1,07238

-1,29448

U

C

A

C Cys

2134

-0,69324

0,53619

-1,45152

U

C

G

S Ser

2143

-1,45152

0,53619

-0,69324

U

A

G

STOP

2341

-1,13743

-0,53619

1,13743

U

G

A

STOP

2431

-0,22210

-1,07238

1,29448

U

G

C

S Ser

2413

1,29448

-1,07238

-0,22210

U

A

C

Y Tyr

2314

1,13743

-0,53619

-1,13743

A

C

U

T Thr

3124

0,22210

1,07238

-1,29448

A

C

G

T Thr

3142

-1,29448

1,07238

0,22210

A

U

G

S Ser

3241

-1,13743

0,53619

1,13743

A

G

U

S Ser

3421

0,69324

-0,53619

1,45152

A

G

C

M Met

3412

1,45152

-0,53619

0,69324

A

U

C

I Ile

3214

1,13743

0,53619

-1,13743

G

C

U

A Ala

4123

0,37914

1,60857

-0,37914

G

C

A

V Val

4132

-0,37914

1,60857

0,37914

G

U

A

V Val

4231

-0,22210

1,07238

1,29448

G

A

U

D Asp

4321

0,69324

0,53619

1,45152

G

A

C

D Asp

4312

1,45152

0,53619

0,69324

G

U

C

A Ala

4213

1,29448

1,07238

-0,22210

Список литературы Пространственная модель генетического кода в виде полуправильного многогранника "усеченный октаэдр"

  • Козлов, Н. Математический анализ генетических кодов/Н. Козлов//Математическая биология и биоинформатика. -2006. -Т. 1, № 1. -С. 70-96.
  • Козлов, Н. Один способ хранения генетической информации/Н. Козлов//Математическое моделирование. -2002. -Т. 14, № 8. -С. 72-78.
  • Козлов, Н. О расчете генетического кода/Н. Козлов//Математическое моделирование. -2011. -Т. 23, № 6. -С. 3-17.
  • Козлов, Н. Тайны генетического кода: взгляд математика/Н. Козлов//Математическое моделирование. -2015. -Т. 27, № 4. -С. 64-80.
  • Корчмарюк, Я. Усеченный октаэдр как результат факторного анализа полной группы перестановок из чисел {1, 2, 3, 4}/Я. Корчмарюк//Сборник ВорГТУ «Современные проблемы информатизации в технике и технологиях». -2002. -№ 7. -С. 58-60.
Статья научная