Анализ митохондриальных геномов современного и древнего населения Северной Евразии: вероятности случайного совпадения гаплотипов

Автор: Малярчук Б. А., Деренко М. В., Боринская С. А., Малярчук А. Б., Андреева Т. В., Рогаев Е. И.

Журнал: Краткие сообщения Института археологии @ksia-iaran

Рубрика: Естественнонаучные методы в археологических исследованиях

Статья в выпуске: 265, 2021 года.

Бесплатный доступ

Полиморфизм митохондриальной ДНК (мтДНК) находит широкое применение в междисциплинарных палеогенетических или археогенетических исследованиях и позволяет изучать генетическую преемственность современного и древнего населения. В настоящей работе проведен сравнительный анализ значений вероятности случайного совпадения гаплотипов для целых митохондриальных геномов (митогеномов) и гипервариабельных участков (ГВС1, ГВС2, ГВС1+ГВС2 и всего контрольного региона) у населения Евразии. Проанализированы опубликованные данные (GenBank и проект 1000 Genomes), а также результаты исследования российского населения (размер выборки: 233 представителя различных этнических групп). Приводятся результаты анализа для 34 популяций ранга этнических групп, а также для объединенных региональных популяций (Европа, Сибирь, Восточная Азия, Центральная Азия, Кавказ, Западная Азия). Всего проанализировано 7011 митогеномов. Проведенное исследование показало, что величины вероятности случайного совпадения гаплотипов мтДНК в случае анализа целых митогеномов многократно выше таковых, полученных при анализе только лишь гипервариабельных участков мтДНК. Таким образом, для корректной интерпретации результатов генетических идентификаций в области археогенетики необходим анализ полноразмерных последовательностей митохондриального генома.

Еще

Митохондриальный геном, популяции человека, палеогеномика, случайное совпадение гаплотипов

Короткий адрес: https://sciup.org/143178357

IDR: 143178357   |   DOI: 10.25681/IARAS.0130-2620.265.281-293

Текст научной статьи Анализ митохондриальных геномов современного и древнего населения Северной Евразии: вероятности случайного совпадения гаплотипов

Современные палеогеномные исследования дают новую информацию о происхождении групп и индивидов древнего и средневекового населения. Для обеспечения надежности междисциплинарных исследований, объединяющих представителей гуманитарных и естественных наук, важно охарактеризовать надежность и возможность методов, с которыми работают палеогенетики. Между тем, палео-генетические методы редко обсуждаются в рамках междисциплинарных исследований. А ведь развитие знаний о методических ограничениях необходимо для более эффективного взаимодействия в междисциплинарных археогенетических работах.

Исследования изменчивости митохондриальной ДНК (мтДНК) человека в генетике популяций современного и древнего населения, а также в судебно-генетической практике долгое время базировались на анализе гипервариабельных участков главной некодирующей области (или контрольного региона) мтДНК. Эта область имеет протяженность 1122 пары нуклеотидов (п. н.) (размер всего митогенома – примерно 16569 п. н.) и представлена тремя гипервариабельными сегментами (ГВС1 между позициями 16024 и 16365, ГВС2 – 73 и 340, ГВС3 – 438 и 574) ( Anderson et al ., 1981; Lutz et al. , 1997). Наиболее вариабельным и потому самым изученным на популяционном уровне является ГВС1-участок. Между тем, частой проблемой в популяционно-генетических исследованиях является высокая распространенность в популяциях некоторых идентичных ГВС1-гаплотипов мтДНК, относящихся к разным гаплогруппам, т. е. группам филогенетически родственных последовательностей. Например, среди европейцев довольно часто (до 10 %) встречается ГВС1-гаплотип, имеющий нуклеотидную последовательность референтной кембриджской мтДНК (CRS; Cambridge Reference Sequence) ( Andrews et al ., 1999). Однако данный CRS-гаплотип может принадлежать различным гаплогруппам у населения Евразии: H*, H1, H2, H7, HV4, U4, U5b, R* (табл. 1). В табл. 1 также показаны другие примеры ГВС1-гаплотипов, относящихся к разным гаплогруппам мтДНК. Как правило, такие гаплотипы отличаются от референсной кембриджской последовательности мтДНК одной-двумя нуклеотидными заменами, но бывают случаи и большего числа отличий в гипервариабельных позициях мтДНК (например, 16278, 16311, 16362) (табл. 1).

Для увеличения разрешающей способности анализа полиморфизма мтДНК еще в 2001 г. было предложено использовать секвенирование целых митохондриальных геномов, что, предположительно, позволило бы различать индивидуумов с идентичными ГВС1-гаплотипами и, соответственно, выявлять максимально возможное число митохондриальных гаплотипов в популяциях ( Parsons, Coble , 2001). И действительно, полномитогеномный анализ, например 29 итальянцев с идентичными гаплотипами контрольного региона мтДНК позволил выявить 28 различных гаплотипов, относящихся к 19 подгруппам гаплогруппы H, что увеличило разрешающую способность анализа от 0 % в случае ГВС1/ГВС2 до 99,8 % при исследовании целых митогеномов ( Bodner et al. , 2015). Высокая эффективность использования полных поcледовательностей митохондриальной ДНК по сравнению с короткими участками гипервариабельных сегментов была показана нами ранее при исследовании останков царской семьи Романовых ( Rogaev et al. , 2009).

Таблица 1. Идентичные нуклеотидные последовательности ГВС1 мтДНК, относящиеся к разным гаплогруппам, выявленные в исследованных популяциях Евразии (n = 2861; по: Деренко, Малярчук , 2010)

ГВС1 гаплотип

Гаплогруппа мтДНК

16093C

H*, U4a2a

16223T

D4, M7c2a, M11

16298C

HV0a, V

16304C

H*, H1, H5, F

16311C

H*, H1, H2b, HV3, R1

CRS

H*, H1, H2, H7, HV4, U4, U5b, R*

16223T-16362C

D4, G2, M9a2a

16278T-16311C

HV3, R1

16223T-16278T-16362C

D4, G2

16223T-16311C-16362C

D4, G2

Примечание : мутации указаны относительно CRS (по: Andrews et al ., 1999)

В связи с развитием методов секвенирования следующего поколения и появлением популяционных наборов данных об изменчивости целых митогено-мов несколько лет назад стали появляться результаты сравнительного анализа изменчивости участков мтДНК и целых митогеномов ( King et al. , 2014; Just et al. , 2015; Garcia et al. , 2020; Taylor et al. , 2020). Как и ожидалось, полно-митогеномное секвенирование существенно улучшает дискриминирующий потенциал гаплотипов мтДНК. Так, на примере трех групп населения США было установлено, что секвенирование целых митогеномов приводило к почти двукратному увеличению числа уникальных гаплотипов в сравнении с секвенированием только участка ГВС1 ( Just et al. , 2015). Значения вероятности случайного совпадения (rmp) ГВС1-гаплотипов в трех этнорасовых группах населения США варьировали от 1,27 до 2,75 %, однако в случае полномитогеномного секвенирования значения этого показателя составляли менее 1 % (табл. 2).

Величина вероятности случайного совпадения гаплотипов зависит от размера исследованных выборок: чем больше выборка, тем меньше значение rmp. Анализ разнообразия гаплотипов по результатам секвенирования участков ГВС1 мтДНК в различных популяциях показал, что значения rmp изменяются в диапазоне от 2,5 до 0,52 % для выборок размером от 60 до 600 человек (Budowle et al., 1999). Между тем, по результатам секвенирования целых мито-геномов величина этого показателя изменяется от 1,9 % для n = 53 до 0,06 % для n = 1998 (Davidovic et al., 2020). Вероятность случайного совпадения гаплотипов зависит также от метода определения количества анализируемых гаплотипов в выборке – различия между гаплотипами могут определяться как нуклеотидными заменами, так и точечными делециями и инсерциями нуклеотидов, а также гетерогенностью молекул мтДНК в митохондриях (гетероплазмией), в связи с которой отдельный индивидуум может характеризоваться более чем одним гаплотипом мтДНК. Однако в большинстве популяционно-генетических и судебно-генетических работ используется стандартный подход, основанный на расчете числа гаплотипов, отличающихся друг от друга только нуклеотидными заменами; незначительный вклад делеций и инсерций в формирование гаплотипического разнообразия мтДНК, таким образом, игнорируется. Данный подход одобрен ДНК-комиссией Международного общества судебных генетиков (DNA Commission of the International Society for Forensic Genetics) (Parson et al., 2014; Just et al., 2015).

Таблица 2. Значения (в %) вероятности случайного совпадения гаплотипов и гаплотипического разнообразия мтДНК (в скобках) у населения США в зависимости от исследованного участка митогенома

Популяции

Участки мтДНК

ГВС1

ГВС1+ГВС2

Контрольный регион

Целый митогеном

Латиноамериканцы США (n = 155)

1,27 (99,37)

0,9 (99,74)

0,79 (99,86)

0,72 (99,92)

Афроамериканцы США (n = 170)

1,38 (99,2)

0,92 (99,67)

0,78 (99,81)

0,6 (99,99)

Белые США (n = 263)

2,75 (97,62)

0,96 (99,42)

0,6 (99,78)

0,39 (99,99)

Примечания : n – размер исследованной выборки; вероятность случайного совпадения гаплотипов (rmp, random match probability) рассчитана как ∑x2, где x – частота каждого гаплотипа в выборке (по: Fisher , 1951; Stoneking et al. , 1991); гаплотипическое разнообразие h = (1 - ∑x2)n/(n - 1) (по: Nei , 1987). Данные приводятся по: ( Just et al. , 2015. Tabl. 1). В расчетах учитывались только нуклеотидные замены

Анализ данных

В настоящее время имеется несколько крупных баз данных, в которых хранятся файлы c нуклеотидными последовательностями целых митохондриальных геномов (в формате FASTA). Однако поскольку долгое время основным условием для публикации результатов была необходимость представления нуклеотидных последовательностей мтДНК в базу данных GenBank (см. National Center…), то все эти базы дублируют друг друга, а главным хранилищем целых митогеномов является сам GenBank. Так, крупнейшая база данных Mitomap (см. MITOMAP…) располагает распределенными по гаплогруппам мтДНК данными о 51836 нуклеотидной последовательности, хранящейся в GenBank. Для носителей этих митогеномов во многих случаях имеются сведения относительно страны проживания, этнической принадлежности исследованных индивидуумов, возраста и др., что помогает проводить популяционно-генетические исследования в различных направлениях. Также примерно 50 000 митогеномов находятся в базе данных HmtDBA (HmtDB…), большая часть которых представлены в GenBank, но некоторые экстрагированы из базы данных проекта 1000 Genomes Project (см. International Genome…). Аналогично некоторыми отсутствующими в GenBank последовательностями митогеномов располагает база данных проекта Phylotree (PhyloTreemt…). К сожалению, недостатком публичных данных о митогеномных последовательностях, представленных в GenBank, является отсутствие гарантий, что нуклеотидные последовательности определены совершенно правильно, поскольку разные коллективы работают с разной степенью тщательности при секвенировании мтДНК (Yao et al., 2009). Чтобы избежать подобных проблем, судебно-генетическое сообщество основало базу данных EMPOP (EMPOP database…), в которой хранятся не только нуклеотидные последовательности митогеномов и гипервариабельных участков мтДНК, но и файлы, например, фореграмм, подтверждающих те или иные варианты полиморфизма мтДНК. В настоящее время база данных EMPOP содержит информацию о 4289 целых митогеномах из различных популяций; часть этих данных отсутствует в GenBank. В последние годы резко усилился приток данных о полиморфизме целых молекул мтДНК, полученных с помощью секвенирования геномных библиотек методами NGS. Параллельно с этим ослабло требование предоставлять нуклеотидные последовательности мтДНК (в виде FASTA-файлов) в базу данных GenBank. В публикациях результаты анализа полиморфизма мтДНК зачастую приводятся или в табличном формате – в виде строк нуклеотидных замен относительно референса (как во многих работах по древней ДНК), или вообще без отсылки на хранилища, где хранятся полученные в той или иной работе геномные данные, из которых можно экстрагировать уже данные полномитогеномные. В случае древней ДНК одной из попыток как-то привести в порядок возникший хаос стало создание базы данных AmtDB (AmtD…), в которой сейчас находятся 2443 нуклеотидные последовательности целых митогеномов от древних индивидуумов, реконструированные из опубликованных данных.

В настоящей работе нами проведен сравнительный анализ значений вероятности случайного совпадения гаплотипов rmp для целых митохондриальных геномов и гипервариабельных участков (ГВС1, ГВС2, ГВС1 + ГВС2 и всего контрольного региона) у населения Евразии. Проанализированы опубликованные результаты, представленные в базах данных GenBank (см. National Center…) и проекта 1000 Genomes Project (см. International Genome…), а кроме того, собственные данные, полученные в результате полногеномного секвенирования. В выборку исследованного российского населения (n = 233) вошли представители различных этнических групп. В табл. 3 приводятся результаты анализа для 34 популяций ранга этнических групп, а также для объединенных региональных популяций на уровне субконтинентальных групп (Европа, Сибирь, Восточная Азия, Центральная Азия, Кавказ, Западная Азия) и их объединений. Всего проанализировано 7011 митогеномов.

Сравнительный анализ показал, что величины значений rmp широко варьируют в зависимости от размера исследованных выборок, а также популяционной специфики, связанной, по-видимому, с особенностями демографической истории популяций (табл. 3). В европейских популяциях разрешающая способность анализа изменчивости целых митогеномов обычно в 2–6 раз выше в сравнении с анализом ГВС1-участка, однако в случае больших выборок (см., например, n = 814 для поляков) значение rmp уменьшается в 18,6 раза при анализе целых митогеномов. Аналогично для объединенных европейских выборок информативность анализа целых митогеномов намного выше таковой в сравнении с ГВС1: вероятность случайного совпадения гаплотипов для целых мито-геномов в 19–29 раз ниже в сравнении с участком ГВС1. Вместе с тем, информативность участка ГВС2 очень низка – значения rmp в отдельных популяциях изменяются в диапазоне от 6 до 16,5 %, однако при объединении участков ГВС1 и ГВС2 (анализ ГВС1 + ГВС2) значения rmp составляют 0,6–0,9 % (в отдельных европейских популяциях – от 0,8 до 4,2 %). В случае анализа всего контрольного региона информативность повышается еще больше – значения rmp составляют 0,3–0,7 %. В итоге, при исследовании европейских популяций вероятность случайного совпадения гаплотипов для целых митогеномов в 6,3–7,8 раза ниже в сравнении с участком ГВС1 + ГВС2 и в 3,5–5,8 раза ниже в сравнении со всем контрольным регионом.

В популяциях Сибири, Центральной и Восточной Азии также наблюдается увеличение разрешающей способности в случае анализа целых митогеномов в 1,5–4 раза на этническом уровне, а на региональном – в 6 раз (Сибирь и Центральная Азия) и 8,4 раза (Восточная Азия), в сравнении с анализом участка ГВС1. Однако анализ объединенной выборки популяций Сибири, Центральной и Восточной Азии (n = 2447) демонстрирует намного более существенное увеличение разрешающей способности в случае анализа целых митогеномов – в 20,3 раза. Исследование участка ГВС1+ГВС2 показало, что величина rmp изменяется в восточноевразийских популяциях от 0,6 до 13,4 % (и от 0,5 до 1 % на региональном уровне). Для всего контрольного региона наблюдаются похожие значения rmp – на региональном уровне они составляют 0,4–0,9 %. В итоге при исследовании популяций Сибири, Центральной и Восточной Азии вероятность случайного совпадения гаплотипов для целых митогеномов в 8 раз ниже в сравнении с участком ГВС1 + ГВС2 и в 4,4 раза ниже по сравнению с контрольным регионом мтДНК.

В популяциях Западной Азии и Кавказа увеличение разрешающей способности в случае анализа целых митогеномов в сравнении с участком ГВС1 составляет от 1,1 до 6,2 раза на этническом уровне и почти в 8 раз – на региональном (Западная Азия, Кавказ). Между тем, в объединенном наборе популяций (n = 1100) разрешающая способность в случае анализа целых митогеномов увеличилась почти в 30 раз. При исследовании изменчивости участков ГВС1 + ГВС2 и контрольного региона величина rmp в отдельных популяциях Западной Азии и Кавказа изменяется в диапазоне 0,6–4,6 % и 0,3–4,4 % соответственно, а на региональном уровне – в диапазоне 0,4–0,9 %. В итоге, для популяций Западной Азии и Кавказа вероятность случайного совпадения гаплотипов для целых митогеномов в 8,8 раза ниже в сравнении с участком ГВС1 + ГВС2 и в 6,6 раз ниже в сравнении с контрольным регионом мтДНК.

Таблица 3. Значения вероятности случайного совпадения гаплотипов (rmp) и гаплотипического разнообразия (h) мтДНК у населения Северной Евразии для всего митохондриального генома и его гипервариабельных участков

2 о

о

S

>5

3

S

-н ^

о

о

Я of 04

Я of 04

ОО О\ of 04

of

04

-н оо °ч О\ О\

-н оо О\ О\" О\

О1^

О\ о< О\

О\ О\" О\

О\

О\"

О\

О^ о< 04

-н оо О4_ 04" 04

О

ОС 04

04 04

ст ст -н 40 04 04 04

^1 of

Я

О1^

04

4О" 04

Is

40

о"

я

ст

о"

3

о

я

оо

°ч

of

04 О

О

04

СТ

9

О;

Я^ 4О"

2

04

5

ОО 04

о

оо

о

оо

О\

о

о

04

ГО

m ст

2

40

Я

к о СТ

СТ

>5

3 к

ч о ст

к £

75

-н ^

2

оо^ of 04

о

ст of 04

of

04

04

40 of 04

of

04

О\

О\

О\" О\

О\"

О\

я О\" О\

О1 'СТ

О\"

О\

оо" 04

О1^

°ч of 04

m о о

Я 04 04

ос ст

ст -н 04 ГО 04 04

О1^ of

°Ч 4О" 04

О1^

of оо

of

Я

ст<>

8S

2

04

ст

я

°ч

о

40

Я О

04 40

СТ

оо"

оо"

04

04 04

04

04

S

ОО ОО

о

оо оо

04

о

04

о

ю 04 ОО

к>

40

^

оо

04 и m

+

и ffl

^

04^

of 04

О\

04

-н ст

of

04

-н 04 Г| of 04

04^ of

04

я

О1

^1 О\ О\

^1 о<

О\

о<

О\

Я

о

О\"

О\

О^ о<

О\

04^

я

04"

04

ОС о о я 04 04

СТ

04 04

О1^ of

оо^ 4О" 04

О1^

04" ОО

of

Я

Is

о

04 °я

о"

я

О\

^„

я

О\

°ч

Я О

Я СТ

оо"

оо"

04

ОО

я 04

я

о

о

я

о

О\

я

40

я

ОО 04

ГО 40

оо

с-1 и

ffl

ОО

04^

04

О\

04

°ч

я

40,

-н О\ 04" 04

04"

04

О\

О\ я

О1^ of

of

О\

О\

°ч я

of

я

■п о

of 04

40 СТ

ст 04

О1^

04^ оо"

оо

-н о^

ОО

Is

о

04 оо^ оо"

04 оо оо"

ст ст"

Г|

оо"

О\

я

^о ''Ч оо"

о<

О1^

40"

о"

40 04

40 04

04

of

О1

Я

40

ОО

о

ОО

о

О\

9

я

О1

о

04 К> 04

К>

04

04

о

■о

и ffl

^

-н оо^ оо" 04

ОО

-н 04

Я

оо" 04

я

О\ оо" 04

О\ оо" О\

^1 оо"

О\

оо" О\

-н О\ °ч Я

оо" О\

я

04^

я

04^ О

m 04 Я

СТ

40 04

я

04^

я

Я

Is

хГ

04 40

9

of

я 04"

ст

04"

of

^о of

of

of

оо

of

40"

04

of

1Л г**)

04"

О1^

m

^

ОО

04

ОО

3

о

04 ^о

я

о

я

я ю

О1

ОО

О1

й

о

я

04 ст

о

ОО

о

2

оо О1

04

чо

04

2

о

9

04 04 04

я

я

оо

ст

о

С

>s ^ s s о щ

О

^ у ст ™ О о Ю Р

m о

lo СТ

ст?

о

С

ъ

о

С

сЗ О н m

Н G

>s

м

2 °

« Е

ffl Ри

3

о

3

я

ffl

3

ст

о

3

я

о и

3 ст

п

о

3

ст

S

еЗ

сё К О ст Й ы

04 сё К О ст а

Ы

3 ст

S

о

2

3

S

X m

S

К

Окончание табл. 3

2 о

о

S

>5

3

S

^

^

о о -н 4© ©4 ©4 ©4

-н eq

-н оо^ оо" 04

eq^

oC 04

-H eq^ oo" 04

-H

©C 04

-H

OO'

O\"

O\

0^1

-H

O\"

O\

0^1

-H

O\"

O\

O\" O\

qo

O\" O\

О\" О\

О оо с\ С\

о о о о

о 0© CS С\

Is

40

eq

о

eq"

04

eq"

oo oo_

°4

m_

00 e^ eq"

оо

о"

(*) о

го eq

0

С\ eq

0

2

го о

2

о

oo 40

eq

00

O\

O\

00

eq

eq eq

ч© ГО ■г,

(О О

0 (О ч©

к о СТ

Рн

>5 3 к

ч о а

к

£

^

2

о© о

о

©4 ГО

©4 ©4

а

оо" 04

-H

oo" 04

OO'

-H OO'

04

-H

©C 04

e^

-H

O\"

O\

-H

O\"

O\

e^

O\" O\

-H

O\"

O\

-H

O\"

O\

-н qo О\" О\

е^

О\"

О\

ОО'

О\"

О\

о eq с\

о

о

с? С\

8S

2

©4 4©

о

eq"

eq"

oo eq"

s

oo

^

^

eq"

о"

Si

qo

С\ о

S о

С\ ГО

О

eq

in

о

$

ri

oo

Si

00

^0

ОО

Si

S

го ч© го

о го

к,

(М и m

+

2

о

©4 ©4

S

оо" 04

-H

oo" 04

OO'

-H OO'

04

0^1

-H

©C 04

e^

-H

O\"

O\

-H

O\" O\

0^1

-H

O\"

O\

e^

-H

O\"

O\

O\" O\

О\" О\

е^

О\"

О\

о<

О\

о

С\

о

ГО ©\

о ^с CS С\

Is

о

о

eq"

ОО' eq"

oo eq"

s

oo eq^

04

m

eq"

3

О\

о

о

о

©4

ГО 4©

о

So

oo

ri

2

00

^0

00

00 eq

9

ОО

О\

ч© ГО ГО

■г, eq

С\ чо

с-1 и

ОО

40 о

©4

о<

ОО

qo

-н ОО' S

-H

OO'

-H

oo

eq"

-H O\ qo" oo

-H

O\" 00

eq"

-H O\ o< 00

-H

°4

Si

qo eq"

-H

O\

ОО'

О\"

ОО

eq"

-н е^

оо

eq" -н ОО'

С\ о

eq О eq

4© о С\ о С\

Is

г-

40 ©4

©4

4D

ОО О\

O'

co

qo

°4

O'

4-

O\

O'

qo

eq" eq

^© eq

eq

QO eq

с\

40

ш

eq

ОО

ОО eq

oo

eq eq

5

m

^0

eq

S

^0

к, 0

ч© ос

©4 к,

^

о IS 40 ©4

О\ ОО

-н е^ <5

-H qo qo" 04

O\

-H

S

e^

-H O\ oo" O\

©\ 00" O\

-H O\ 00" O\

e^

-H

O\"

O\

00" O\

°4

00" O\

О\" О\

qo

-н ОО' S

04

ОО' оо" О\

0 (О 0© С\

eq 0 (О 0© С\

о

eq

©4

Is

хГ

in

ГО

4D

ОО

S

eq

qo"

oo qo

eq"

S

^0

о^

о

qo

оо

го С\

©4

О

m

ОО

eq

oo

qo

о

0

0

0

O\

qo

eq

о

S

CS

ГО eq

о eq

S

й

eq

eq ©4 eq

2

eq eq

04 40

о

ri

O\ O\

Si

O\ Pl eq

к

2

оо

О\

eq

ч© С\

0 eq

4© 4© О

ст

о

С

eq л К © а Й

Ы

S

R £

3

3

t*

S

3

и

3

& w

c3

S

c3

X

3 s

s

^

3 ч о

о

2

з

1

3

к о с

^

3 ст

03

^

й а S к©

S и

s s ^

R Л к

©

©

R © Я

© а н к s S © м Д <

о о -н 04 04 04

04^

-H

°\ 04"

04

0^1

04^ 04"

04

eq^

40, О\" 04

04" 04

ш

о

re

eq

04

Г1

eq

m ОО m

о

3

00

3

eq

3 о

ОС ГП 04 04

°\

-H

е^

04" 04

40

04"

04

еЧ оС

04

04" 04

4© чо

о

m

О

04

40

Я.

ОО

о

40

СО

40 eq

о о -н eq Q0 оо 04

eq^

-H

04"

04

е^

04"

04

04"

04

04^ оо"

04

-н оо оо" 04

eq eq

О

m

3

оо

О4_

40,

OO eq

0

оо

eq

ГП

-н rn eq Ш

00 eq"

-H

3

-н е^

04

04

04^

40 eq" 04

°Ч

04" оо

00"

40

eq 00"

eq

eq

сп

9

оо

о

-H

QO 04

eq"

-H

3

40 оо" 04

е^ оо"

04

04^

04

°ч

3

04

IQ

Я.

5 eq"

04 eq"

40 ОО,

40 04

Я

S

eq 40

eq

Я

Я

О

оо

ОО

eq

04 eq

R R я

S r &Й S $ « ‘g у s О и^

3

R

К

3 ст с

3 ст я R

Я

3

СТ )Я cd СТ 1

'ст

СТ

о -н 04 04 04

04^ O\"

04

-H

0

-H 0 0 0

0

-H 0 0 0

m rn

о

О eq"

04

ir,

0

04 О

О

04 m

00 eq

40 OO

04 T,

ir, 04

0 -н 40 04 04

-H

°4

04"

04

-H

04^

04"

04

О -H QO 04 04

О -H 1Л 04 04

m 40

0

ri

eq"

04

eq^

K> ГП

О

04 1Л

О

eq m m

04

00 ri

GO

eq 0 -H ГП 04 04

40^

-H

04"

04

-H

40^

O\" 04

О -H 40 04 04

О -H rn 04 04

m 04

0

eq"

04

K> 1Л

О

О

K> 0 m

00 eq

eq 00

04 m

QO О -H 40 ГП 04

eq"

-H

eq" 04

00

-H

00^ 40 04

-H e^

04

4© О -H

rn 04

■л 0 -H

0 04

40

40

OO eq^ 04"

40 4O_ 4O"

00

O4_

s

QO ГП

04

О m

04 eq

04

ri

сП

О

-H QO

04

-H

04^ OO"

04

-H

04"

04

e^l

-H

04"

04

eq 0 -H О 04 04

rn О -H 1Л

04

eq

eq

О

О

OO

1Г,

04

eq

40 m eq

9

40 eq

О

eq K> m

QO

04

ri

00

01

40

0 0

s s ^

R Л CT ч Л e R ее

3 CT

0

VO

3 CT CT

fi1

4> CT

CS

CT Л

R S ^

R м R R CT CT 4 CT R R §Ы ее я

Fraumene et al. , 2006; 12 проект 1000 Genomes (см. International Genome…); 13 Duggan et al. , 2013; 14 Derenko et al. , 2018; 15 Derenko et al. , 2021; Peng et al. , 2018; 17 Zheng et al. , 2017; 18 Zheng et al. , 2011; 19 Schönberg et al. , 2011; 20 Derenko et al. , 2013; 21 Matisoo-Smith et al. , 2016;

Margaryan et al., 2017; 23 Derenko et al. , 2019

Таким образом, результаты проведенного исследования популяций Евразии свидетельствуют, что величины вероятности случайного совпадения гаплотипов мтДНК в случае анализа целых митогеномов в 20–30 раз меньше таковых, полученных при анализе только лишь гипервариабельного сегмента мтДНК (ГВС1) – при условии, что анализируются большие выборки (более 1000 человек). В выборках меньшего размера информативность анализа изменчивости целых митогеномов заметно ниже, но все равно в несколько раз выше, чем в случае анализа одного лишь участка ГВС1 мтДНК. Аналогичная тенденция отмечена и при анализе объединенных участков ГВС1 и ГВС2, а также всего контрольного региона мтДНК. Информативность анализа изменчивости целых митогеномов в несколько раз выше в сравнении с гипервариабельными участками мтДНК – примерно в 6–9 раз выше в сравнении с участком ГВС1 + ГВС2 и в 4–7 раз выше по сравнению с контрольным регионом мтДНК.

Заключение

Полученные результаты сопоставительного анализа в очередной раз указывают на необходимость создания геномных баз данных большого размера не только для современного, но и для древнего населения. Это возможно, так как развитие методик палеогеномных исследований последних лет впечатляюще; новые технологии секвенирования ДНК позволяют выявлять не только отдельные участки мтДНК, как это было еще 10–20 лет назад, но и реконструировать целые митохондриальные и ядерные геномы людей предшествующих эпох ( Racimo et al ., 2020). Проведенное исследование показывает, что интерпретации результатов палеогеномных исследований, сделанные только на основании данных о гипервариабельных участках мтДНК, могут быть отчасти пересмотрены и уточнены. При выполнении современных археогенетических работ важно опираться на характеристики полных митогеномов.

Список литературы Анализ митохондриальных геномов современного и древнего населения Северной Евразии: вероятности случайного совпадения гаплотипов

  • Деренко М. В., Малярчук Б. А., 2010. Молекулярная филогеография населения Северной Евразии по данным об изменчивости митохондриальной ДНК. Магадан: Северо-Восточный научный центр Дальневосточного отделения РАН. 376 с.
  • AmtDB. Ancient mtDNA database. URL: https://amtdb.org
  • Anderson S., Bankier A. T., Barrell B. G. et al., 1981. Sequence and organization of the human mitochondrial genome // Nature. Vol. 290. P. 457–465.
  • Andrews R. M., Kubacka I., Chinnery P. F. et al., 1999. Reanalysis and revision of the Cambridge reference sequence for human mitochondrial DNA // Nature Genetics. Vol. 23, 2. P. 147.
  • Bodner M., Iuvaro A., Strobl C. et al., 2015. Helena, the hidden beauty: Resolving the most common West Eurasian mtDNA control region haplotype by massively parallel sequencing an Italian population sample //Forensic Science International: Genetics. Vol. 15. P. 21–26.
  • Budowle B., Wilson M. R., DiZinno J. A. et al., 1999. Mitochondrial DNA regions HVI and HVII population data // Forensic Science International. Vol. 103. P. 23–35.
  • Bulgarian FTDNA project. URL: www.familytreedna.com
  • Davidovic S., Malyarchuk B., Grzybowski T. et al., 2020. Complete mitogenome data for the Serbian population: the contribution to high quality forensic databases // International Journal of Legal Medicine. Vol. 134. No. 5. P. 1581–1590.
  • Derenko M, Denisova G, Dambueva I, Malyarchuk B, Bazarov B. Mitogenomics of modern Mongolicspeaking populations. Mol Genet Genomics. 2021 Nov 10. doi: 10.1007/s00438-021-01830-w. (In print.)
  • Derenko M., Denisova G., Malyarchuk B. et al., 2018. Mitogenomic diversity and differentiation of the Buryats // Journal of Human Genetics. Vol. 63. P. 71–81.
  • Derenko M., Denisova G., Malyarchuk B. et al., 2019. Insights into matrilineal genetic structure, differentiation and ancestry of Armenians based on complete mitogenome data // Molecular Genetics and Genomics. Vol. 294. P. 1547–1559.
  • Derenko M., Malyarchuk B., Bahmanimehr A. et al., 2013. Complete mitochondrial DNA diversity in Iranians // PLoS One. Vol. 8. No. 12. e80673.
  • Duggan A. T., Whitten M., Wiebe V. et al., 2013. Investigating the prehistory of Tungusic peoples of Siberia and the Amur-Ussuri region with complete mtDNA genome sequences and Y-chromosomal markers // PLoS One. Vol. 8. No. 12. e83570.
  • EMPOP database – high quality population data (the collection, quality control and searchable presentation of mtDNA haplotypes from diverse world populations). URL: https://empop.online
  • Fisher R. A., 1951. Standard calculations for evaluating a blood-group system // Heredity. Vol. 5. P. 95–102.
  • Fraumene C., Belle E. M., Castri L. et al., 2006. High resolution analysis and phylogenetic network construction using complete mtDNA sequences in Sardinian genetic isolates // Molecular Biology and Evolution. Vol. 23. Iss. 11. P. 2101–2111.
  • García Ó., Alonso S., Huber N. et al., 2020. Forensically relevant phylogeographic evaluation of mitogenome variation in the Basque Country // Forensic Science International: Genetics. Vol. 46. 102260.
  • HmtDB – Human Mithochondrial Genomic Resourse based on Variability Studies, Supporting Population Genetics and Biomedical Research. URL: www.hmtdb.uniba.it
  • International Genome Sample Resource. Supporting open human variation data. URL: http://www.internationalgenome.org
  • Just R. S., Scheible M. K., Fast S. A. et al., 2015. Full mtGenome reference data: development and characterization of 588 forensic-quality haplotypes representing three U.S. populations // Forensic Science International: Genetics. Vol. 14. P. 141–155.
  • King J. L., LaRue B. L., Novroski N. M. et al., 2014. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq // Forensic Science International: Genetics. Vol. 12. P. 128–135.
  • Librado P., Rozas J., 2009. DnaSP v5: a software for comprehensive analysis of DNA polymorphism data // Bioinformatics. Vol. 25. P. 1451–1452.
  • Lutz S., Weisser H. J., Heizmann J., Pollak S., 1997. A third hypervariable region in the human mitochondrial D-loop // Human Genetics. Vol. 101. Iss. 3. P. 384.
  • Malyarchuk B., Derenko M., Denisova G., Kravtsova O., 2010. Mitogenomic diversity in Tatars from the Volga-Ural region of Russia // Molecular Biology and Evolution. Vol. 27. Iss. 10. P. 2220–2226.
  • Malyarchuk B., Derenko M., Denisova G. et al., 2018. Whole mitochondrial genome diversity in two Hungarian populations // Molecular Genetics and Genomics. Vol. 293. P. 1255–1263.
  • Malyarchuk B., Litvinov A., Derenko M. et al., 2017. Mitogenomic diversity in Russians and Poles // Forensic Science International: Genetics. Vol. 30. P. 51–56.
  • Margaryan A., Derenko M., Hovhannisyan H. et al., 2017. Eight millennia of matrilineal genetic continuity in the South Caucasus // Current Biology. Vol. 27. Iss. 13. P. 2023–2028.
  • Matisoo-Smith E. A., Gosling A. L., Boocock J. et al., 2016. A European mitochondrial haplotype identified in ancient Phoenician remains from Carthage, North Africa // PLoS One. Vol. 11. No. 5. e0155046.
  • MITOMAP. A human mitochondrial genome database // Mitobank – Mitochondrial DNA Sequences. URL: www.mitomap.org/foswiki/bin/view/ MITOMAP/Mitobank National Center for Biotechnological Information. URL: www.ncbi.nlm.nih.gov
  • Nei M., 1987. Molecular evolutionary genetics. New York: Columbia University Press. 512 p.
  • Parson W., Gusmão L., Hares D. R. et al., 2014. DNA Commission of the International Society for Forensic Genetics: Revised and extended guidelines for mitochondrial DNA typing // Forensic Science International: Genetics. Vol. 13. P. 134–142.
  • Parsons T. J., Coble M. D., 2001. Increasing the forensic discrimination of mitochondrial DNA testing through analysis of the entire mitochondrial DNA genome // Croatian Medical Journal. Vol. 42. No. 3. P. 304–309.
  • Peng M. S., Xu W., Song J. J. et al., 2018. Mitochondrial genomes uncover the maternal history of the Pamir populations // European Journal of Human Genetics. Vol. 26. P. 124–136.
  • PhyloTreemt – Phylogenetic tree of worldwide human mitochondrial DNA variation. URL: www.phylotree.org
  • Piotrowska-Nowak A., Elson J. L., Sobczyk-Kopciol A. et al., 2019a. New mtDNA association model, MutPred variant load, suggests individuals with multiple mildly deleterious mtDNA variants are more likely to suffer from atherosclerosis // Frontiers in Genetics. Vol. 9. P. 702.
  • Piotrowska-Nowak A., Kosior-Jarecka E., Schab A. et al., 2019b. Investigation of whole mitochondrial genome variation in normal tension glaucoma // Experimental Eye Research. Vol. 178. P. 186–197.
  • Racimo F., Sikora M., Vander Linden M. V. et al., 2020. Beyond broad strokes: sociocultural insights from the study of ancient genomes // Nature Reviews Genetics. Vol. 21. P. 355–366.
  • Raule N., Sevini F., Li S. et al., 2014. The co-occurrence of mtDNA mutations on different oxidative phosphorylation subunits, not detected by haplogroup analysis, affects human longevity and is population specific // Aging Cell. Vol. 13. Iss. 3. P. 401–407.
  • Rogaev E., Grigorenko A., Moliaka Yu. et al., 2009. Genomic identification in the historical case of the Nicholas II royal family // PNAS. Vol. 106. Iss. 13. P. 5258–5263.
  • Schönberg A., Theunert C., Li M. et al., 2011. High-throughput sequencing of complete human mtDNA genomes from the Caucasus and West Asia: high diversity and demographic inferences // European Journal of Human Genetics. Vol. 19. P. 988–994.
  • Skonieczna K., Malyarchuk B., Jawień A. et al., 2018. Mitogenomic differences between the normal and tumor cells of colorectal cancer patients // Human Mutation. Vol. 39. Iss. 5. P. 691–701.
  • Stoljarova M., King J. L., Takahashi M. et al., 2016. Whole mitochondrial genome genetic diversity in an Estonian population sample // International Journal of Legal Medicine. Vol. 130. No. 1. P. 67–71.
  • Stoneking M., Hedgecock D., Higuchi R. G. et al., 1991. Population variation of human mtDNA control region sequences detected by enzymatic amplification and sequence-specific oligonucleotide probes // American Journal of Human Genetics. Vol. 48. No. 2. P. 370–382.
  • Taylor C. S., Kiesler K. M., Sturk-Andreaggi K. et al., 2020. Platinum-quality mitogenome haplotypes from United States populations // Genes (Basel). Vol. 11. P. 1290.
  • Yao Y.-G., Salas A., Logan I., Bandelt H.-J., 2009. mtDNA data mining in GenBank needs surveying // American Journal of Human Genetics. Vol. 85. No. 6. P. 929–933.
  • Zheng H. X., Li L., Jiang X. Y. et al., 2017. MtDNA genomes reveal a relaxation of selective constraints in low-BMI individuals in a Uyghur population // Human Genetics. Vol. 136. P. 1353–1362.
  • Zheng H. X., Yan S., Qin Z. D. et al., 2011. Major population expansion of East Asians began before Neolithic time: evidence of mtDNA genomes // PLoS One. Vol. 6. e25835.
Еще
Статья научная