Пространственная модель генетического кода в виде полуправильного многогранника "усеченный октаэдр"
Автор: Корчмарюк Ян Илларионович, Коваленко Александр Владимирович
Журнал: Природные системы и ресурсы @ns-jvolsu
Рубрика: Биология и биотехнология
Статья в выпуске: 4 (18), 2016 года.
Бесплатный доступ
В настоящей работе, относящейся к области биоинформатики, математико-статистическим методом факторного анализа анализируются все 4! = 24 перестановки чисел «1, 2, 3, 4» как 4 фактора. В результате численного анализа получены 4 факторные координаты (x, y, z). Минимальные евклидовы расстояния между всеми 24 вершинами образуют ребра фигуры «усеченный октаэдр». Каждой вершине усеченного октаэдра сопоставлен триплет - кодон генетического кода и соответствующая ему аминокислота. Построены графики проекций фигуры «усеченный октаэдр» и изометрическое (трехмерное) ее изображение. Проанализированы обнаруженные закономерности в физических и химических свойствах аминокислот, распределенных по вершинам построенной фигуры. Произведена интерпретация трех факторных осей координат.
Усеченный октаэдр, факторный анализ, генетический код, перестановки, биоинформатика
Короткий адрес: https://sciup.org/149131404
IDR: 149131404 | DOI: 10.15688/jvolsu11.2016.4.3
Текст научной статьи Пространственная модель генетического кода в виде полуправильного многогранника "усеченный октаэдр"
DOI:
Методы математического анализа давно и широко используются для изучения генетического кода [4; 12; 20]. Наиболее популярен кластерный анализ [13; 18], а также методы комбинаторики [7] с широкими возможностями перестановок [6; 8; 10; 11]. Но с исходным представлением генетического кода на уровне кибернетики до сих пор существуют различные вариации. Мы обратили внимание, что пространственные модели лучше опи-
сывают взаимосвязь элементов в системе, а усеченный октаэдр встречается только в поле изучения скаффолдов [17]. Хотя он может быть основой для связи нескольких десятков элементов друг с другом, его до настоящего момента не рассматривали как каркас для генетического кода. В связи с вышесказанным цель нашей работы – построить пространственную модель генетического кода на основе усеченного октаэдра.
Материалы и методы
Исходными данными были взяты 4! = 24 всевозможные перестановки натуральных целых положительных чисел {1, 2, 3, 4}[5; 9]. В качестве математико-статистического метода обработки данных был взят классический метод факторного анализа в программном комплексе «SPSS» с использованием методов главных компонент, Варимакс и нормализации Кайзера [1; 3; 16].
С целью построения трехмерной фигуры по данным трех факторных координат были построены евклидовы расстояния ( Rij = Ö(( xi – xj )2 + ( yi – yj )2 + ( zi – zj )2) между всеми { i , j } 24 вершинами усеченного октаэдра. Все расстояния были нормированы на наименьшее из расстояний. Из всех нормированных расстояний была вычтена 1 (единица), для того, чтобы расстояние у вершин было равно 0 (нулю). Затем были выбраны все пары вершин, между которыми было нормированное 1 (единичное) расстояние, которое было взято за ребро усеченного октаэдра.
Для графического представления итоговых данных по усеченному октаэдру использовались графики трех проекций факторных осей.
Для корректности построенной аналогии 4 нуклеотида ДНК/РНК (CUAG) были упорядочены по возрастанию их молекулярной массы [2; 14; 15; 19] и поставлены в соответствие меткам вершин усеченного октаэдра (1234), следующим образом: 1 = С, 2 = U или Т, 3 = А, 4 = G.
Результаты
Построенная модель «усеченного октаэдра» обладает достаточной мерой общности, чтобы интерпретировать ее в различных теоретических приложениях. В настоящей статье авторами данная модель интерпретирована как трехмерный аналог известной кодовой таблицы 4 нуклеотидов и кодируемых ими 20 аминокислот. Из кодовой таблицы ДНК были выбраны все аминокислоты, которые соответствовали кодонам с неповторяющимися тройками нуклеотидов. Эти аминокислоты были приписаны соответствующим вершинам усеченного октаэдра по первым трем меткам четырехзначного кода их вершин. Старт-коды и стоп-коды были обозначены везде как «STOP» (рис. 1–4). Данные приведены в таблице.

Рис. 1. Генетический код в виде усеченного октаэдра, проекция XY

Рис. 2. Генетический код в виде усеченного октаэдра, проекция YZ

Рис. 3. Генетический код в виде усеченного октаэдра, проекция XZ

Рис. 4. Генетический код в виде усеченного октаэдра, проекция 3D
Обсуждение
Поскольку все вершины усеченного октаэдра лежат на поверхности описанной около него сферы, а все комбинации перестановок, начинающихся на 1, 2, 3 или 4, – лежат в одной плоскости сечения, то эти перестановки можно интерпретировать как «параллели глобуса», а связывающие их ребра – как «меридианы глобуса». При этом полученная трехмерная модель генетического кода обладает высокой симметрией, почти сферической, и выделяет подгруппу высокоэнтропийных (невырожденных) кодонов и их аминокислот из общей группы генетического кода, а также подгруппу «близколежащие и даль-нележащие коды и аминокислоты». Те, что в вершинах 6-угольников и 4-угольников.
Так как все расстояния в этой модели укладываются на логарифм (значения F1–F3 таблицы), то появляется возможность анализировать корреляции этих 10 типовых расстояний с параметрами кодонов и аминокислот.
Заключение
В силу большой общности построенной модели ее можно использовать в любых кодовых системах, которые имеют базовый алфавит в 24 (или менее) знаков. Например, в математической лингвистике, для букв и звуков алфавитов различных языков мира. Также построенную модель можно использовать в области искусственного интеллекта, если каждую вершину считать «формальным нейроном» в рамках персептронной парадигмы Розенблатта – Мак-Каллоха – Питса, а весовые коэффициенты межнейронных связей приписывать ребрам усеченного октаэдра.
Соотнесение генетического кода с усеченным октаэдром
Генетический код CUAG |
Метка перестановок |
Факторные оси |
|||||
F1 = X |
F2 = Y |
F3 = Z |
|||||
C |
U |
A |
L Leu |
1234 |
-0,69324 |
-0,53619 |
-1,45152 |
C |
U |
G |
R Arg |
1243 |
-1,45152 |
-0,53619 |
-0,69324 |
C |
A |
G |
Q Gln |
1342 |
-1,29448 |
-1,07238 |
0,22210 |
C |
G |
A |
L Leu |
1432 |
-0,37914 |
-1,60857 |
0,37914 |
C |
G |
U |
R Arg |
1423 |
0,37914 |
-1,60857 |
-0,37914 |
C |
A |
U |
H His |
1324 |
0,22210 |
-1,07238 |
-1,29448 |
U |
C |
A |
C Cys |
2134 |
-0,69324 |
0,53619 |
-1,45152 |
U |
C |
G |
S Ser |
2143 |
-1,45152 |
0,53619 |
-0,69324 |
U |
A |
G |
STOP |
2341 |
-1,13743 |
-0,53619 |
1,13743 |
U |
G |
A |
STOP |
2431 |
-0,22210 |
-1,07238 |
1,29448 |
U |
G |
C |
S Ser |
2413 |
1,29448 |
-1,07238 |
-0,22210 |
U |
A |
C |
Y Tyr |
2314 |
1,13743 |
-0,53619 |
-1,13743 |
A |
C |
U |
T Thr |
3124 |
0,22210 |
1,07238 |
-1,29448 |
A |
C |
G |
T Thr |
3142 |
-1,29448 |
1,07238 |
0,22210 |
A |
U |
G |
S Ser |
3241 |
-1,13743 |
0,53619 |
1,13743 |
A |
G |
U |
S Ser |
3421 |
0,69324 |
-0,53619 |
1,45152 |
A |
G |
C |
M Met |
3412 |
1,45152 |
-0,53619 |
0,69324 |
A |
U |
C |
I Ile |
3214 |
1,13743 |
0,53619 |
-1,13743 |
G |
C |
U |
A Ala |
4123 |
0,37914 |
1,60857 |
-0,37914 |
G |
C |
A |
V Val |
4132 |
-0,37914 |
1,60857 |
0,37914 |
G |
U |
A |
V Val |
4231 |
-0,22210 |
1,07238 |
1,29448 |
G |
A |
U |
D Asp |
4321 |
0,69324 |
0,53619 |
1,45152 |
G |
A |
C |
D Asp |
4312 |
1,45152 |
0,53619 |
0,69324 |
G |
U |
C |
A Ala |
4213 |
1,29448 |
1,07238 |
-0,22210 |
Список литературы Пространственная модель генетического кода в виде полуправильного многогранника "усеченный октаэдр"
- Козлов, Н. Математический анализ генетических кодов/Н. Козлов//Математическая биология и биоинформатика. -2006. -Т. 1, № 1. -С. 70-96.
- Козлов, Н. Один способ хранения генетической информации/Н. Козлов//Математическое моделирование. -2002. -Т. 14, № 8. -С. 72-78.
- Козлов, Н. О расчете генетического кода/Н. Козлов//Математическое моделирование. -2011. -Т. 23, № 6. -С. 3-17.
- Козлов, Н. Тайны генетического кода: взгляд математика/Н. Козлов//Математическое моделирование. -2015. -Т. 27, № 4. -С. 64-80.
- Корчмарюк, Я. Усеченный октаэдр как результат факторного анализа полной группы перестановок из чисел {1, 2, 3, 4}/Я. Корчмарюк//Сборник ВорГТУ «Современные проблемы информатизации в технике и технологиях». -2002. -№ 7. -С. 58-60.