Анализ митохондриальных геномов современного и древнего населения Северной Евразии: вероятности случайного совпадения гаплотипов

Автор: Малярчук Б. А., Деренко М. В., Боринская С. А., Малярчук А. Б., Андреева Т. В., Рогаев Е. И.

Журнал: Краткие сообщения Института археологии @ksia-iaran

Рубрика: Естественнонаучные методы в археологических исследованиях

Статья в выпуске: 265, 2021 года.

Бесплатный доступ

Полиморфизм митохондриальной ДНК (мтДНК) находит широкое применение в междисциплинарных палеогенетических или археогенетических исследованиях и позволяет изучать генетическую преемственность современного и древнего населения. В настоящей работе проведен сравнительный анализ значений вероятности случайного совпадения гаплотипов для целых митохондриальных геномов (митогеномов) и гипервариабельных участков (ГВС1, ГВС2, ГВС1+ГВС2 и всего контрольного региона) у населения Евразии. Проанализированы опубликованные данные (GenBank и проект 1000 Genomes), а также результаты исследования российского населения (размер выборки: 233 представителя различных этнических групп). Приводятся результаты анализа для 34 популяций ранга этнических групп, а также для объединенных региональных популяций (Европа, Сибирь, Восточная Азия, Центральная Азия, Кавказ, Западная Азия). Всего проанализировано 7011 митогеномов. Проведенное исследование показало, что величины вероятности случайного совпадения гаплотипов мтДНК в случае анализа целых митогеномов многократно выше таковых, полученных при анализе только лишь гипервариабельных участков мтДНК. Таким образом, для корректной интерпретации результатов генетических идентификаций в области археогенетики необходим анализ полноразмерных последовательностей митохондриального генома.

Еще

Митохондриальный геном, популяции человека, палеогеномика, случайное совпадение гаплотипов

Короткий адрес: https://sciup.org/143178357

IDR: 143178357   |   DOI: 10.25681/IARAS.0130-2620.265.281-293

Analysis of mitochondrial genomes of modern and ancient population of Northern Eurasia: probabilities of random match of haplotypes

Mitochondrial DNA (mtDNA) polymorphism is widely used in interdisciplinary paleogenetic or archaeogenetic studies and allows studying the genetic continuity of modern and ancient populations. In this work, we performed a comparative analysis of the values of the random match probabilities of haplotypes for whole mitochondrial genomes and hypervariable regions (HVS1, HVS2, HVS1 + HVS2 and the entire control region) in Eurasian populations. Published data (GenBank and the 1000 Genomes project), as well as the results of the Russian Federation population study (N = 233 individuals representing various ethnic groups) were analyzed. The results of the analysis are presented for 34 populations of the rank of ethnic groups, as well as for the combined regional samples (Europe, Siberia, East Asia, Central Asia, Caucasus, West Asia). A total of 7011 mitogenomes were analyzed. The study has shown that the random match probabilities of mtDNA haplotypes in the case of analysis of whole mitogenomes is much higher than those obtained for mtDNA hypervariable regions only. Thus, the analysis of full-length mitochondrial genome sequences is necessary for the correct interpretation of the results of genetic identifications in the field of archaeogenetics.

Еще

Текст научной статьи Анализ митохондриальных геномов современного и древнего населения Северной Евразии: вероятности случайного совпадения гаплотипов

Современные палеогеномные исследования дают новую информацию о происхождении групп и индивидов древнего и средневекового населения. Для обеспечения надежности междисциплинарных исследований, объединяющих представителей гуманитарных и естественных наук, важно охарактеризовать надежность и возможность методов, с которыми работают палеогенетики. Между тем, палео-генетические методы редко обсуждаются в рамках междисциплинарных исследований. А ведь развитие знаний о методических ограничениях необходимо для более эффективного взаимодействия в междисциплинарных археогенетических работах.

Исследования изменчивости митохондриальной ДНК (мтДНК) человека в генетике популяций современного и древнего населения, а также в судебно-генетической практике долгое время базировались на анализе гипервариабельных участков главной некодирующей области (или контрольного региона) мтДНК. Эта область имеет протяженность 1122 пары нуклеотидов (п. н.) (размер всего митогенома – примерно 16569 п. н.) и представлена тремя гипервариабельными сегментами (ГВС1 между позициями 16024 и 16365, ГВС2 – 73 и 340, ГВС3 – 438 и 574) ( Anderson et al ., 1981; Lutz et al. , 1997). Наиболее вариабельным и потому самым изученным на популяционном уровне является ГВС1-участок. Между тем, частой проблемой в популяционно-генетических исследованиях является высокая распространенность в популяциях некоторых идентичных ГВС1-гаплотипов мтДНК, относящихся к разным гаплогруппам, т. е. группам филогенетически родственных последовательностей. Например, среди европейцев довольно часто (до 10 %) встречается ГВС1-гаплотип, имеющий нуклеотидную последовательность референтной кембриджской мтДНК (CRS; Cambridge Reference Sequence) ( Andrews et al ., 1999). Однако данный CRS-гаплотип может принадлежать различным гаплогруппам у населения Евразии: H*, H1, H2, H7, HV4, U4, U5b, R* (табл. 1). В табл. 1 также показаны другие примеры ГВС1-гаплотипов, относящихся к разным гаплогруппам мтДНК. Как правило, такие гаплотипы отличаются от референсной кембриджской последовательности мтДНК одной-двумя нуклеотидными заменами, но бывают случаи и большего числа отличий в гипервариабельных позициях мтДНК (например, 16278, 16311, 16362) (табл. 1).

Для увеличения разрешающей способности анализа полиморфизма мтДНК еще в 2001 г. было предложено использовать секвенирование целых митохондриальных геномов, что, предположительно, позволило бы различать индивидуумов с идентичными ГВС1-гаплотипами и, соответственно, выявлять максимально возможное число митохондриальных гаплотипов в популяциях ( Parsons, Coble , 2001). И действительно, полномитогеномный анализ, например 29 итальянцев с идентичными гаплотипами контрольного региона мтДНК позволил выявить 28 различных гаплотипов, относящихся к 19 подгруппам гаплогруппы H, что увеличило разрешающую способность анализа от 0 % в случае ГВС1/ГВС2 до 99,8 % при исследовании целых митогеномов ( Bodner et al. , 2015). Высокая эффективность использования полных поcледовательностей митохондриальной ДНК по сравнению с короткими участками гипервариабельных сегментов была показана нами ранее при исследовании останков царской семьи Романовых ( Rogaev et al. , 2009).

Таблица 1. Идентичные нуклеотидные последовательности ГВС1 мтДНК, относящиеся к разным гаплогруппам, выявленные в исследованных популяциях Евразии (n = 2861; по: Деренко, Малярчук , 2010)

ГВС1 гаплотип

Гаплогруппа мтДНК

16093C

H*, U4a2a

16223T

D4, M7c2a, M11

16298C

HV0a, V

16304C

H*, H1, H5, F

16311C

H*, H1, H2b, HV3, R1

CRS

H*, H1, H2, H7, HV4, U4, U5b, R*

16223T-16362C

D4, G2, M9a2a

16278T-16311C

HV3, R1

16223T-16278T-16362C

D4, G2

16223T-16311C-16362C

D4, G2

Примечание : мутации указаны относительно CRS (по: Andrews et al ., 1999)

В связи с развитием методов секвенирования следующего поколения и появлением популяционных наборов данных об изменчивости целых митогено-мов несколько лет назад стали появляться результаты сравнительного анализа изменчивости участков мтДНК и целых митогеномов ( King et al. , 2014; Just et al. , 2015; Garcia et al. , 2020; Taylor et al. , 2020). Как и ожидалось, полно-митогеномное секвенирование существенно улучшает дискриминирующий потенциал гаплотипов мтДНК. Так, на примере трех групп населения США было установлено, что секвенирование целых митогеномов приводило к почти двукратному увеличению числа уникальных гаплотипов в сравнении с секвенированием только участка ГВС1 ( Just et al. , 2015). Значения вероятности случайного совпадения (rmp) ГВС1-гаплотипов в трех этнорасовых группах населения США варьировали от 1,27 до 2,75 %, однако в случае полномитогеномного секвенирования значения этого показателя составляли менее 1 % (табл. 2).

Величина вероятности случайного совпадения гаплотипов зависит от размера исследованных выборок: чем больше выборка, тем меньше значение rmp. Анализ разнообразия гаплотипов по результатам секвенирования участков ГВС1 мтДНК в различных популяциях показал, что значения rmp изменяются в диапазоне от 2,5 до 0,52 % для выборок размером от 60 до 600 человек (Budowle et al., 1999). Между тем, по результатам секвенирования целых мито-геномов величина этого показателя изменяется от 1,9 % для n = 53 до 0,06 % для n = 1998 (Davidovic et al., 2020). Вероятность случайного совпадения гаплотипов зависит также от метода определения количества анализируемых гаплотипов в выборке – различия между гаплотипами могут определяться как нуклеотидными заменами, так и точечными делециями и инсерциями нуклеотидов, а также гетерогенностью молекул мтДНК в митохондриях (гетероплазмией), в связи с которой отдельный индивидуум может характеризоваться более чем одним гаплотипом мтДНК. Однако в большинстве популяционно-генетических и судебно-генетических работ используется стандартный подход, основанный на расчете числа гаплотипов, отличающихся друг от друга только нуклеотидными заменами; незначительный вклад делеций и инсерций в формирование гаплотипического разнообразия мтДНК, таким образом, игнорируется. Данный подход одобрен ДНК-комиссией Международного общества судебных генетиков (DNA Commission of the International Society for Forensic Genetics) (Parson et al., 2014; Just et al., 2015).

Таблица 2. Значения (в %) вероятности случайного совпадения гаплотипов и гаплотипического разнообразия мтДНК (в скобках) у населения США в зависимости от исследованного участка митогенома

Популяции

Участки мтДНК

ГВС1

ГВС1+ГВС2

Контрольный регион

Целый митогеном

Латиноамериканцы США (n = 155)

1,27 (99,37)

0,9 (99,74)

0,79 (99,86)

0,72 (99,92)

Афроамериканцы США (n = 170)

1,38 (99,2)

0,92 (99,67)

0,78 (99,81)

0,6 (99,99)

Белые США (n = 263)

2,75 (97,62)

0,96 (99,42)

0,6 (99,78)

0,39 (99,99)

Примечания : n – размер исследованной выборки; вероятность случайного совпадения гаплотипов (rmp, random match probability) рассчитана как ∑x2, где x – частота каждого гаплотипа в выборке (по: Fisher , 1951; Stoneking et al. , 1991); гаплотипическое разнообразие h = (1 - ∑x2)n/(n - 1) (по: Nei , 1987). Данные приводятся по: ( Just et al. , 2015. Tabl. 1). В расчетах учитывались только нуклеотидные замены

Анализ данных

В настоящее время имеется несколько крупных баз данных, в которых хранятся файлы c нуклеотидными последовательностями целых митохондриальных геномов (в формате FASTA). Однако поскольку долгое время основным условием для публикации результатов была необходимость представления нуклеотидных последовательностей мтДНК в базу данных GenBank (см. National Center…), то все эти базы дублируют друг друга, а главным хранилищем целых митогеномов является сам GenBank. Так, крупнейшая база данных Mitomap (см. MITOMAP…) располагает распределенными по гаплогруппам мтДНК данными о 51836 нуклеотидной последовательности, хранящейся в GenBank. Для носителей этих митогеномов во многих случаях имеются сведения относительно страны проживания, этнической принадлежности исследованных индивидуумов, возраста и др., что помогает проводить популяционно-генетические исследования в различных направлениях. Также примерно 50 000 митогеномов находятся в базе данных HmtDBA (HmtDB…), большая часть которых представлены в GenBank, но некоторые экстрагированы из базы данных проекта 1000 Genomes Project (см. International Genome…). Аналогично некоторыми отсутствующими в GenBank последовательностями митогеномов располагает база данных проекта Phylotree (PhyloTreemt…). К сожалению, недостатком публичных данных о митогеномных последовательностях, представленных в GenBank, является отсутствие гарантий, что нуклеотидные последовательности определены совершенно правильно, поскольку разные коллективы работают с разной степенью тщательности при секвенировании мтДНК (Yao et al., 2009). Чтобы избежать подобных проблем, судебно-генетическое сообщество основало базу данных EMPOP (EMPOP database…), в которой хранятся не только нуклеотидные последовательности митогеномов и гипервариабельных участков мтДНК, но и файлы, например, фореграмм, подтверждающих те или иные варианты полиморфизма мтДНК. В настоящее время база данных EMPOP содержит информацию о 4289 целых митогеномах из различных популяций; часть этих данных отсутствует в GenBank. В последние годы резко усилился приток данных о полиморфизме целых молекул мтДНК, полученных с помощью секвенирования геномных библиотек методами NGS. Параллельно с этим ослабло требование предоставлять нуклеотидные последовательности мтДНК (в виде FASTA-файлов) в базу данных GenBank. В публикациях результаты анализа полиморфизма мтДНК зачастую приводятся или в табличном формате – в виде строк нуклеотидных замен относительно референса (как во многих работах по древней ДНК), или вообще без отсылки на хранилища, где хранятся полученные в той или иной работе геномные данные, из которых можно экстрагировать уже данные полномитогеномные. В случае древней ДНК одной из попыток как-то привести в порядок возникший хаос стало создание базы данных AmtDB (AmtD…), в которой сейчас находятся 2443 нуклеотидные последовательности целых митогеномов от древних индивидуумов, реконструированные из опубликованных данных.

В настоящей работе нами проведен сравнительный анализ значений вероятности случайного совпадения гаплотипов rmp для целых митохондриальных геномов и гипервариабельных участков (ГВС1, ГВС2, ГВС1 + ГВС2 и всего контрольного региона) у населения Евразии. Проанализированы опубликованные результаты, представленные в базах данных GenBank (см. National Center…) и проекта 1000 Genomes Project (см. International Genome…), а кроме того, собственные данные, полученные в результате полногеномного секвенирования. В выборку исследованного российского населения (n = 233) вошли представители различных этнических групп. В табл. 3 приводятся результаты анализа для 34 популяций ранга этнических групп, а также для объединенных региональных популяций на уровне субконтинентальных групп (Европа, Сибирь, Восточная Азия, Центральная Азия, Кавказ, Западная Азия) и их объединений. Всего проанализировано 7011 митогеномов.

Сравнительный анализ показал, что величины значений rmp широко варьируют в зависимости от размера исследованных выборок, а также популяционной специфики, связанной, по-видимому, с особенностями демографической истории популяций (табл. 3). В европейских популяциях разрешающая способность анализа изменчивости целых митогеномов обычно в 2–6 раз выше в сравнении с анализом ГВС1-участка, однако в случае больших выборок (см., например, n = 814 для поляков) значение rmp уменьшается в 18,6 раза при анализе целых митогеномов. Аналогично для объединенных европейских выборок информативность анализа целых митогеномов намного выше таковой в сравнении с ГВС1: вероятность случайного совпадения гаплотипов для целых мито-геномов в 19–29 раз ниже в сравнении с участком ГВС1. Вместе с тем, информативность участка ГВС2 очень низка – значения rmp в отдельных популяциях изменяются в диапазоне от 6 до 16,5 %, однако при объединении участков ГВС1 и ГВС2 (анализ ГВС1 + ГВС2) значения rmp составляют 0,6–0,9 % (в отдельных европейских популяциях – от 0,8 до 4,2 %). В случае анализа всего контрольного региона информативность повышается еще больше – значения rmp составляют 0,3–0,7 %. В итоге, при исследовании европейских популяций вероятность случайного совпадения гаплотипов для целых митогеномов в 6,3–7,8 раза ниже в сравнении с участком ГВС1 + ГВС2 и в 3,5–5,8 раза ниже в сравнении со всем контрольным регионом.

В популяциях Сибири, Центральной и Восточной Азии также наблюдается увеличение разрешающей способности в случае анализа целых митогеномов в 1,5–4 раза на этническом уровне, а на региональном – в 6 раз (Сибирь и Центральная Азия) и 8,4 раза (Восточная Азия), в сравнении с анализом участка ГВС1. Однако анализ объединенной выборки популяций Сибири, Центральной и Восточной Азии (n = 2447) демонстрирует намного более существенное увеличение разрешающей способности в случае анализа целых митогеномов – в 20,3 раза. Исследование участка ГВС1+ГВС2 показало, что величина rmp изменяется в восточноевразийских популяциях от 0,6 до 13,4 % (и от 0,5 до 1 % на региональном уровне). Для всего контрольного региона наблюдаются похожие значения rmp – на региональном уровне они составляют 0,4–0,9 %. В итоге при исследовании популяций Сибири, Центральной и Восточной Азии вероятность случайного совпадения гаплотипов для целых митогеномов в 8 раз ниже в сравнении с участком ГВС1 + ГВС2 и в 4,4 раза ниже по сравнению с контрольным регионом мтДНК.

В популяциях Западной Азии и Кавказа увеличение разрешающей способности в случае анализа целых митогеномов в сравнении с участком ГВС1 составляет от 1,1 до 6,2 раза на этническом уровне и почти в 8 раз – на региональном (Западная Азия, Кавказ). Между тем, в объединенном наборе популяций (n = 1100) разрешающая способность в случае анализа целых митогеномов увеличилась почти в 30 раз. При исследовании изменчивости участков ГВС1 + ГВС2 и контрольного региона величина rmp в отдельных популяциях Западной Азии и Кавказа изменяется в диапазоне 0,6–4,6 % и 0,3–4,4 % соответственно, а на региональном уровне – в диапазоне 0,4–0,9 %. В итоге, для популяций Западной Азии и Кавказа вероятность случайного совпадения гаплотипов для целых митогеномов в 8,8 раза ниже в сравнении с участком ГВС1 + ГВС2 и в 6,6 раз ниже в сравнении с контрольным регионом мтДНК.

Таблица 3. Значения вероятности случайного совпадения гаплотипов (rmp) и гаплотипического разнообразия (h) мтДНК у населения Северной Евразии для всего митохондриального генома и его гипервариабельных участков

2 о

о

S

>5

3

S

-н ^

о

о

Я of 04

Я of 04

ОО О\ of 04

of

04

-н оо °ч О\ О\

-н оо О\ О\" О\

О1^

О\ о< О\

О\ О\" О\

О\

О\"

О\

О^ о< 04

-н оо О4_ 04" 04

О

ОС 04

04 04

ст ст -н 40 04 04 04

^1 of

Я

О1^

04

4О" 04

Is

40

о"

я

ст

о"

3

о

я

оо

°ч

of

04 О

О

04

СТ

9

О;

Я^ 4О"

2

04

5

ОО 04

о

оо

о

оо

О\

о

о

04

ГО

m ст

2

40

Я

к о СТ

СТ

>5

3 к

ч о ст

к £

75

-н ^

2

оо^ of 04

о

ст of 04

of

04

04

40 of 04

of

04

О\

О\

О\" О\

О\"

О\

я О\" О\

О1 'СТ

О\"

О\

оо" 04

О1^

°ч of 04

m о о

Я 04 04

ос ст

ст -н 04 ГО 04 04

О1^ of

°Ч 4О" 04

О1^

of оо

of

Я

ст<>

8S

2

04

ст

я

°ч

о

40

Я О

04 40

СТ

оо"

оо"

04

04 04

04

04

S

ОО ОО

о

оо оо

04

о

04

о

ю 04 ОО

к>

40

^

оо

04 и m

+

и ffl

^

04^

of 04

О\

04

-н ст

of

04

-н 04 Г| of 04

04^ of

04

я

О1

^1 О\ О\

^1 о<

О\

о<

О\

Я

о

О\"

О\

О^ о<

О\

04^

я

04"

04

ОС о о я 04 04

СТ

04 04

О1^ of

оо^ 4О" 04

О1^

04" ОО

of

Я

Is

о

04 °я

о"

я

О\

^„

я

О\

°ч

Я О

Я СТ

оо"

оо"

04

ОО

я 04

я

о

о

я

о

О\

я

40

я

ОО 04

ГО 40

оо

с-1 и

ffl

ОО

04^

04

О\

04

°ч

я

40,

-н О\ 04" 04

04"

04

О\

О\ я

О1^ of

of

О\

О\

°ч я

of

я

■п о

of 04

40 СТ

ст 04

О1^

04^ оо"

оо

-н о^

ОО

Is

о

04 оо^ оо"

04 оо оо"

ст ст"

Г|

оо"

О\

я

^о ''Ч оо"

о<

О1^

40"

о"

40 04

40 04

04

of

О1

Я

40

ОО

о

ОО

о

О\

9

я

О1

о

04 К> 04

К>

04

04

о

■о

и ffl

^

-н оо^ оо" 04

ОО

-н 04

Я

оо" 04

я

О\ оо" 04

О\ оо" О\

^1 оо"

О\

оо" О\

-н О\ °ч Я

оо" О\

я

04^

я

04^ О

m 04 Я

СТ

40 04

я

04^

я

Я

Is

хГ

04 40

9

of

я 04"

ст

04"

of

^о of

of

of

оо

of

40"

04

of

1Л г**)

04"

О1^

m

^

ОО

04

ОО

3

о

04 ^о

я

о

я

я ю

О1

ОО

О1

й

о

я

04 ст

о

ОО

о

2

оо О1

04

чо

04

2

о

9

04 04 04

я

я

оо

ст

о

С

>s ^ s s о щ

О

^ у ст ™ О о Ю Р

m о

lo СТ

ст?

о

С

ъ

о

С

сЗ О н m

Н G

>s

м

2 °

« Е

ffl Ри

3

о

3

я

ffl

3

ст

о

3

я

о и

3 ст

п

о

3

ст

S

еЗ

сё К О ст Й ы

04 сё К О ст а

Ы

3 ст

S

о

2

3

S

X m

S

К

Окончание табл. 3

2 о

о

S

>5

3

S

^

^

о о -н 4© ©4 ©4 ©4

-н eq

-н оо^ оо" 04

eq^

oC 04

-H eq^ oo" 04

-H

©C 04

-H

OO'

O\"

O\

0^1

-H

O\"

O\

0^1

-H

O\"

O\

O\" O\

qo

O\" O\

О\" О\

О оо с\ С\

о о о о

о 0© CS С\

Is

40

eq

о

eq"

04

eq"

oo oo_

°4

m_

00 e^ eq"

оо

о"

(*) о

го eq

0

С\ eq

0

2

го о

2

о

oo 40

eq

00

O\

O\

00

eq

eq eq

ч© ГО ■г,

(О О

0 (О ч©

к о СТ

Рн

>5 3 к

ч о а

к

£

^

2

о© о

о

©4 ГО

©4 ©4

а

оо" 04

-H

oo" 04

OO'

-H OO'

04

-H

©C 04

e^

-H

O\"

O\

-H

O\"

O\

e^

O\" O\

-H

O\"

O\

-H

O\"

O\

-н qo О\" О\

е^

О\"

О\

ОО'

О\"

О\

о eq с\

о

о

с? С\

8S

2

©4 4©

о

eq"

eq"

oo eq"

s

oo

^

^

eq"

о"

Si

qo

С\ о

S о

С\ ГО

О

eq

in

о

$

ri

oo

Si

00

^0

ОО

Si

S

го ч© го

о го

к,

(М и m

+

2

о

©4 ©4

S

оо" 04

-H

oo" 04

OO'

-H OO'

04

0^1

-H

©C 04

e^

-H

O\"

O\

-H

O\" O\

0^1

-H

O\"

O\

e^

-H

O\"

O\

O\" O\

О\" О\

е^

О\"

О\

о<

О\

о

С\

о

ГО ©\

о ^с CS С\

Is

о

о

eq"

ОО' eq"

oo eq"

s

oo eq^

04

m

eq"

3

О\

о

о

о

©4

ГО 4©

о

So

oo

ri

2

00

^0

00

00 eq

9

ОО

О\

ч© ГО ГО

■г, eq

С\ чо

с-1 и

ОО

40 о

©4

о<

ОО

qo

-н ОО' S

-H

OO'

-H

oo

eq"

-H O\ qo" oo

-H

O\" 00

eq"

-H O\ o< 00

-H

°4

Si

qo eq"

-H

O\

ОО'

О\"

ОО

eq"

-н е^

оо

eq" -н ОО'

С\ о

eq О eq

4© о С\ о С\

Is

г-

40 ©4

©4

4D

ОО О\

O'

co

qo

°4

O'

4-

O\

O'

qo

eq" eq

^© eq

eq

QO eq

с\

40

ш

eq

ОО

ОО eq

oo

eq eq

5

m

^0

eq

S

^0

к, 0

ч© ос

©4 к,

^

о IS 40 ©4

О\ ОО

-н е^ <5

-H qo qo" 04

O\

-H

S

e^

-H O\ oo" O\

©\ 00" O\

-H O\ 00" O\

e^

-H

O\"

O\

00" O\

°4

00" O\

О\" О\

qo

-н ОО' S

04

ОО' оо" О\

0 (О 0© С\

eq 0 (О 0© С\

о

eq

©4

Is

хГ

in

ГО

4D

ОО

S

eq

qo"

oo qo

eq"

S

^0

о^

о

qo

оо

го С\

©4

О

m

ОО

eq

oo

qo

о

0

0

0

O\

qo

eq

о

S

CS

ГО eq

о eq

S

й

eq

eq ©4 eq

2

eq eq

04 40

о

ri

O\ O\

Si

O\ Pl eq

к

2

оо

О\

eq

ч© С\

0 eq

4© 4© О

ст

о

С

eq л К © а Й

Ы

S

R £

3

3

t*

S

3

и

3

& w

c3

S

c3

X

3 s

s

^

3 ч о

о

2

з

1

3

к о с

^

3 ст

03

^

й а S к©

S и

s s ^

R Л к

©

©

R © Я

© а н к s S © м Д <

о о -н 04 04 04

04^

-H

°\ 04"

04

0^1

04^ 04"

04

eq^

40, О\" 04

04" 04

ш

о

re

eq

04

Г1

eq

m ОО m

о

3

00

3

eq

3 о

ОС ГП 04 04

°\

-H

е^

04" 04

40

04"

04

еЧ оС

04

04" 04

4© чо

о

m

О

04

40

Я.

ОО

о

40

СО

40 eq

о о -н eq Q0 оо 04

eq^

-H

04"

04

е^

04"

04

04"

04

04^ оо"

04

-н оо оо" 04

eq eq

О

m

3

оо

О4_

40,

OO eq

0

оо

eq

ГП

-н rn eq Ш

00 eq"

-H

3

-н е^

04

04

04^

40 eq" 04

°Ч

04" оо

00"

40

eq 00"

eq

eq

сп

9

оо

о

-H

QO 04

eq"

-H

3

40 оо" 04

е^ оо"

04

04^

04

°ч

3

04

IQ

Я.

5 eq"

04 eq"

40 ОО,

40 04

Я

S

eq 40

eq

Я

Я

О

оо

ОО

eq

04 eq

R R я

S r &Й S $ « ‘g у s О и^

3

R

К

3 ст с

3 ст я R

Я

3

СТ )Я cd СТ 1

'ст

СТ

о -н 04 04 04

04^ O\"

04

-H

0

-H 0 0 0

0

-H 0 0 0

m rn

о

О eq"

04

ir,

0

04 О

О

04 m

00 eq

40 OO

04 T,

ir, 04

0 -н 40 04 04

-H

°4

04"

04

-H

04^

04"

04

О -H QO 04 04

О -H 1Л 04 04

m 40

0

ri

eq"

04

eq^

K> ГП

О

04 1Л

О

eq m m

04

00 ri

GO

eq 0 -H ГП 04 04

40^

-H

04"

04

-H

40^

O\" 04

О -H 40 04 04

О -H rn 04 04

m 04

0

eq"

04

K> 1Л

О

О

K> 0 m

00 eq

eq 00

04 m

QO О -H 40 ГП 04

eq"

-H

eq" 04

00

-H

00^ 40 04

-H e^

04

4© О -H

rn 04

■л 0 -H

0 04

40

40

OO eq^ 04"

40 4O_ 4O"

00

O4_

s

QO ГП

04

О m

04 eq

04

ri

сП

О

-H QO

04

-H

04^ OO"

04

-H

04"

04

e^l

-H

04"

04

eq 0 -H О 04 04

rn О -H 1Л

04

eq

eq

О

О

OO

1Г,

04

eq

40 m eq

9

40 eq

О

eq K> m

QO

04

ri

00

01

40

0 0

s s ^

R Л CT ч Л e R ее

3 CT

0

VO

3 CT CT

fi1

4> CT

CS

CT Л

R S ^

R м R R CT CT 4 CT R R §Ы ее я

Fraumene et al. , 2006; 12 проект 1000 Genomes (см. International Genome…); 13 Duggan et al. , 2013; 14 Derenko et al. , 2018; 15 Derenko et al. , 2021; Peng et al. , 2018; 17 Zheng et al. , 2017; 18 Zheng et al. , 2011; 19 Schönberg et al. , 2011; 20 Derenko et al. , 2013; 21 Matisoo-Smith et al. , 2016;

Margaryan et al., 2017; 23 Derenko et al. , 2019

Таким образом, результаты проведенного исследования популяций Евразии свидетельствуют, что величины вероятности случайного совпадения гаплотипов мтДНК в случае анализа целых митогеномов в 20–30 раз меньше таковых, полученных при анализе только лишь гипервариабельного сегмента мтДНК (ГВС1) – при условии, что анализируются большие выборки (более 1000 человек). В выборках меньшего размера информативность анализа изменчивости целых митогеномов заметно ниже, но все равно в несколько раз выше, чем в случае анализа одного лишь участка ГВС1 мтДНК. Аналогичная тенденция отмечена и при анализе объединенных участков ГВС1 и ГВС2, а также всего контрольного региона мтДНК. Информативность анализа изменчивости целых митогеномов в несколько раз выше в сравнении с гипервариабельными участками мтДНК – примерно в 6–9 раз выше в сравнении с участком ГВС1 + ГВС2 и в 4–7 раз выше по сравнению с контрольным регионом мтДНК.

Заключение

Полученные результаты сопоставительного анализа в очередной раз указывают на необходимость создания геномных баз данных большого размера не только для современного, но и для древнего населения. Это возможно, так как развитие методик палеогеномных исследований последних лет впечатляюще; новые технологии секвенирования ДНК позволяют выявлять не только отдельные участки мтДНК, как это было еще 10–20 лет назад, но и реконструировать целые митохондриальные и ядерные геномы людей предшествующих эпох ( Racimo et al ., 2020). Проведенное исследование показывает, что интерпретации результатов палеогеномных исследований, сделанные только на основании данных о гипервариабельных участках мтДНК, могут быть отчасти пересмотрены и уточнены. При выполнении современных археогенетических работ важно опираться на характеристики полных митогеномов.

Список литературы Анализ митохондриальных геномов современного и древнего населения Северной Евразии: вероятности случайного совпадения гаплотипов

  • Деренко М. В., Малярчук Б. А., 2010. Молекулярная филогеография населения Северной Евразии по данным об изменчивости митохондриальной ДНК. Магадан: Северо-Восточный научный центр Дальневосточного отделения РАН. 376 с.
  • AmtDB. Ancient mtDNA database. URL: https://amtdb.org
  • Anderson S., Bankier A. T., Barrell B. G. et al., 1981. Sequence and organization of the human mitochondrial genome // Nature. Vol. 290. P. 457–465.
  • Andrews R. M., Kubacka I., Chinnery P. F. et al., 1999. Reanalysis and revision of the Cambridge reference sequence for human mitochondrial DNA // Nature Genetics. Vol. 23, 2. P. 147.
  • Bodner M., Iuvaro A., Strobl C. et al., 2015. Helena, the hidden beauty: Resolving the most common West Eurasian mtDNA control region haplotype by massively parallel sequencing an Italian population sample //Forensic Science International: Genetics. Vol. 15. P. 21–26.
  • Budowle B., Wilson M. R., DiZinno J. A. et al., 1999. Mitochondrial DNA regions HVI and HVII population data // Forensic Science International. Vol. 103. P. 23–35.
  • Bulgarian FTDNA project. URL: www.familytreedna.com
  • Davidovic S., Malyarchuk B., Grzybowski T. et al., 2020. Complete mitogenome data for the Serbian population: the contribution to high quality forensic databases // International Journal of Legal Medicine. Vol. 134. No. 5. P. 1581–1590.
  • Derenko M, Denisova G, Dambueva I, Malyarchuk B, Bazarov B. Mitogenomics of modern Mongolicspeaking populations. Mol Genet Genomics. 2021 Nov 10. doi: 10.1007/s00438-021-01830-w. (In print.)
  • Derenko M., Denisova G., Malyarchuk B. et al., 2018. Mitogenomic diversity and differentiation of the Buryats // Journal of Human Genetics. Vol. 63. P. 71–81.
  • Derenko M., Denisova G., Malyarchuk B. et al., 2019. Insights into matrilineal genetic structure, differentiation and ancestry of Armenians based on complete mitogenome data // Molecular Genetics and Genomics. Vol. 294. P. 1547–1559.
  • Derenko M., Malyarchuk B., Bahmanimehr A. et al., 2013. Complete mitochondrial DNA diversity in Iranians // PLoS One. Vol. 8. No. 12. e80673.
  • Duggan A. T., Whitten M., Wiebe V. et al., 2013. Investigating the prehistory of Tungusic peoples of Siberia and the Amur-Ussuri region with complete mtDNA genome sequences and Y-chromosomal markers // PLoS One. Vol. 8. No. 12. e83570.
  • EMPOP database – high quality population data (the collection, quality control and searchable presentation of mtDNA haplotypes from diverse world populations). URL: https://empop.online
  • Fisher R. A., 1951. Standard calculations for evaluating a blood-group system // Heredity. Vol. 5. P. 95–102.
  • Fraumene C., Belle E. M., Castri L. et al., 2006. High resolution analysis and phylogenetic network construction using complete mtDNA sequences in Sardinian genetic isolates // Molecular Biology and Evolution. Vol. 23. Iss. 11. P. 2101–2111.
  • García Ó., Alonso S., Huber N. et al., 2020. Forensically relevant phylogeographic evaluation of mitogenome variation in the Basque Country // Forensic Science International: Genetics. Vol. 46. 102260.
  • HmtDB – Human Mithochondrial Genomic Resourse based on Variability Studies, Supporting Population Genetics and Biomedical Research. URL: www.hmtdb.uniba.it
  • International Genome Sample Resource. Supporting open human variation data. URL: http://www.internationalgenome.org
  • Just R. S., Scheible M. K., Fast S. A. et al., 2015. Full mtGenome reference data: development and characterization of 588 forensic-quality haplotypes representing three U.S. populations // Forensic Science International: Genetics. Vol. 14. P. 141–155.
  • King J. L., LaRue B. L., Novroski N. M. et al., 2014. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq // Forensic Science International: Genetics. Vol. 12. P. 128–135.
  • Librado P., Rozas J., 2009. DnaSP v5: a software for comprehensive analysis of DNA polymorphism data // Bioinformatics. Vol. 25. P. 1451–1452.
  • Lutz S., Weisser H. J., Heizmann J., Pollak S., 1997. A third hypervariable region in the human mitochondrial D-loop // Human Genetics. Vol. 101. Iss. 3. P. 384.
  • Malyarchuk B., Derenko M., Denisova G., Kravtsova O., 2010. Mitogenomic diversity in Tatars from the Volga-Ural region of Russia // Molecular Biology and Evolution. Vol. 27. Iss. 10. P. 2220–2226.
  • Malyarchuk B., Derenko M., Denisova G. et al., 2018. Whole mitochondrial genome diversity in two Hungarian populations // Molecular Genetics and Genomics. Vol. 293. P. 1255–1263.
  • Malyarchuk B., Litvinov A., Derenko M. et al., 2017. Mitogenomic diversity in Russians and Poles // Forensic Science International: Genetics. Vol. 30. P. 51–56.
  • Margaryan A., Derenko M., Hovhannisyan H. et al., 2017. Eight millennia of matrilineal genetic continuity in the South Caucasus // Current Biology. Vol. 27. Iss. 13. P. 2023–2028.
  • Matisoo-Smith E. A., Gosling A. L., Boocock J. et al., 2016. A European mitochondrial haplotype identified in ancient Phoenician remains from Carthage, North Africa // PLoS One. Vol. 11. No. 5. e0155046.
  • MITOMAP. A human mitochondrial genome database // Mitobank – Mitochondrial DNA Sequences. URL: www.mitomap.org/foswiki/bin/view/ MITOMAP/Mitobank National Center for Biotechnological Information. URL: www.ncbi.nlm.nih.gov
  • Nei M., 1987. Molecular evolutionary genetics. New York: Columbia University Press. 512 p.
  • Parson W., Gusmão L., Hares D. R. et al., 2014. DNA Commission of the International Society for Forensic Genetics: Revised and extended guidelines for mitochondrial DNA typing // Forensic Science International: Genetics. Vol. 13. P. 134–142.
  • Parsons T. J., Coble M. D., 2001. Increasing the forensic discrimination of mitochondrial DNA testing through analysis of the entire mitochondrial DNA genome // Croatian Medical Journal. Vol. 42. No. 3. P. 304–309.
  • Peng M. S., Xu W., Song J. J. et al., 2018. Mitochondrial genomes uncover the maternal history of the Pamir populations // European Journal of Human Genetics. Vol. 26. P. 124–136.
  • PhyloTreemt – Phylogenetic tree of worldwide human mitochondrial DNA variation. URL: www.phylotree.org
  • Piotrowska-Nowak A., Elson J. L., Sobczyk-Kopciol A. et al., 2019a. New mtDNA association model, MutPred variant load, suggests individuals with multiple mildly deleterious mtDNA variants are more likely to suffer from atherosclerosis // Frontiers in Genetics. Vol. 9. P. 702.
  • Piotrowska-Nowak A., Kosior-Jarecka E., Schab A. et al., 2019b. Investigation of whole mitochondrial genome variation in normal tension glaucoma // Experimental Eye Research. Vol. 178. P. 186–197.
  • Racimo F., Sikora M., Vander Linden M. V. et al., 2020. Beyond broad strokes: sociocultural insights from the study of ancient genomes // Nature Reviews Genetics. Vol. 21. P. 355–366.
  • Raule N., Sevini F., Li S. et al., 2014. The co-occurrence of mtDNA mutations on different oxidative phosphorylation subunits, not detected by haplogroup analysis, affects human longevity and is population specific // Aging Cell. Vol. 13. Iss. 3. P. 401–407.
  • Rogaev E., Grigorenko A., Moliaka Yu. et al., 2009. Genomic identification in the historical case of the Nicholas II royal family // PNAS. Vol. 106. Iss. 13. P. 5258–5263.
  • Schönberg A., Theunert C., Li M. et al., 2011. High-throughput sequencing of complete human mtDNA genomes from the Caucasus and West Asia: high diversity and demographic inferences // European Journal of Human Genetics. Vol. 19. P. 988–994.
  • Skonieczna K., Malyarchuk B., Jawień A. et al., 2018. Mitogenomic differences between the normal and tumor cells of colorectal cancer patients // Human Mutation. Vol. 39. Iss. 5. P. 691–701.
  • Stoljarova M., King J. L., Takahashi M. et al., 2016. Whole mitochondrial genome genetic diversity in an Estonian population sample // International Journal of Legal Medicine. Vol. 130. No. 1. P. 67–71.
  • Stoneking M., Hedgecock D., Higuchi R. G. et al., 1991. Population variation of human mtDNA control region sequences detected by enzymatic amplification and sequence-specific oligonucleotide probes // American Journal of Human Genetics. Vol. 48. No. 2. P. 370–382.
  • Taylor C. S., Kiesler K. M., Sturk-Andreaggi K. et al., 2020. Platinum-quality mitogenome haplotypes from United States populations // Genes (Basel). Vol. 11. P. 1290.
  • Yao Y.-G., Salas A., Logan I., Bandelt H.-J., 2009. mtDNA data mining in GenBank needs surveying // American Journal of Human Genetics. Vol. 85. No. 6. P. 929–933.
  • Zheng H. X., Li L., Jiang X. Y. et al., 2017. MtDNA genomes reveal a relaxation of selective constraints in low-BMI individuals in a Uyghur population // Human Genetics. Vol. 136. P. 1353–1362.
  • Zheng H. X., Yan S., Qin Z. D. et al., 2011. Major population expansion of East Asians began before Neolithic time: evidence of mtDNA genomes // PLoS One. Vol. 6. e25835.
Еще