Анализ митохондриальных геномов современного и древнего населения Северной Евразии: вероятности случайного совпадения гаплотипов
Автор: Малярчук Б. А., Деренко М. В., Боринская С. А., Малярчук А. Б., Андреева Т. В., Рогаев Е. И.
Журнал: Краткие сообщения Института археологии @ksia-iaran
Рубрика: Естественнонаучные методы в археологических исследованиях
Статья в выпуске: 265, 2021 года.
Бесплатный доступ
Полиморфизм митохондриальной ДНК (мтДНК) находит широкое применение в междисциплинарных палеогенетических или археогенетических исследованиях и позволяет изучать генетическую преемственность современного и древнего населения. В настоящей работе проведен сравнительный анализ значений вероятности случайного совпадения гаплотипов для целых митохондриальных геномов (митогеномов) и гипервариабельных участков (ГВС1, ГВС2, ГВС1+ГВС2 и всего контрольного региона) у населения Евразии. Проанализированы опубликованные данные (GenBank и проект 1000 Genomes), а также результаты исследования российского населения (размер выборки: 233 представителя различных этнических групп). Приводятся результаты анализа для 34 популяций ранга этнических групп, а также для объединенных региональных популяций (Европа, Сибирь, Восточная Азия, Центральная Азия, Кавказ, Западная Азия). Всего проанализировано 7011 митогеномов. Проведенное исследование показало, что величины вероятности случайного совпадения гаплотипов мтДНК в случае анализа целых митогеномов многократно выше таковых, полученных при анализе только лишь гипервариабельных участков мтДНК. Таким образом, для корректной интерпретации результатов генетических идентификаций в области археогенетики необходим анализ полноразмерных последовательностей митохондриального генома.
Митохондриальный геном, популяции человека, палеогеномика, случайное совпадение гаплотипов
Короткий адрес: https://sciup.org/143178357
IDR: 143178357 | DOI: 10.25681/IARAS.0130-2620.265.281-293
Текст научной статьи Анализ митохондриальных геномов современного и древнего населения Северной Евразии: вероятности случайного совпадения гаплотипов
Современные палеогеномные исследования дают новую информацию о происхождении групп и индивидов древнего и средневекового населения. Для обеспечения надежности междисциплинарных исследований, объединяющих представителей гуманитарных и естественных наук, важно охарактеризовать надежность и возможность методов, с которыми работают палеогенетики. Между тем, палео-генетические методы редко обсуждаются в рамках междисциплинарных исследований. А ведь развитие знаний о методических ограничениях необходимо для более эффективного взаимодействия в междисциплинарных археогенетических работах.
Исследования изменчивости митохондриальной ДНК (мтДНК) человека в генетике популяций современного и древнего населения, а также в судебно-генетической практике долгое время базировались на анализе гипервариабельных участков главной некодирующей области (или контрольного региона) мтДНК. Эта область имеет протяженность 1122 пары нуклеотидов (п. н.) (размер всего митогенома – примерно 16569 п. н.) и представлена тремя гипервариабельными сегментами (ГВС1 между позициями 16024 и 16365, ГВС2 – 73 и 340, ГВС3 – 438 и 574) ( Anderson et al ., 1981; Lutz et al. , 1997). Наиболее вариабельным и потому самым изученным на популяционном уровне является ГВС1-участок. Между тем, частой проблемой в популяционно-генетических исследованиях является высокая распространенность в популяциях некоторых идентичных ГВС1-гаплотипов мтДНК, относящихся к разным гаплогруппам, т. е. группам филогенетически родственных последовательностей. Например, среди европейцев довольно часто (до 10 %) встречается ГВС1-гаплотип, имеющий нуклеотидную последовательность референтной кембриджской мтДНК (CRS; Cambridge Reference Sequence) ( Andrews et al ., 1999). Однако данный CRS-гаплотип может принадлежать различным гаплогруппам у населения Евразии: H*, H1, H2, H7, HV4, U4, U5b, R* (табл. 1). В табл. 1 также показаны другие примеры ГВС1-гаплотипов, относящихся к разным гаплогруппам мтДНК. Как правило, такие гаплотипы отличаются от референсной кембриджской последовательности мтДНК одной-двумя нуклеотидными заменами, но бывают случаи и большего числа отличий в гипервариабельных позициях мтДНК (например, 16278, 16311, 16362) (табл. 1).
Для увеличения разрешающей способности анализа полиморфизма мтДНК еще в 2001 г. было предложено использовать секвенирование целых митохондриальных геномов, что, предположительно, позволило бы различать индивидуумов с идентичными ГВС1-гаплотипами и, соответственно, выявлять максимально возможное число митохондриальных гаплотипов в популяциях ( Parsons, Coble , 2001). И действительно, полномитогеномный анализ, например 29 итальянцев с идентичными гаплотипами контрольного региона мтДНК позволил выявить 28 различных гаплотипов, относящихся к 19 подгруппам гаплогруппы H, что увеличило разрешающую способность анализа от 0 % в случае ГВС1/ГВС2 до 99,8 % при исследовании целых митогеномов ( Bodner et al. , 2015). Высокая эффективность использования полных поcледовательностей митохондриальной ДНК по сравнению с короткими участками гипервариабельных сегментов была показана нами ранее при исследовании останков царской семьи Романовых ( Rogaev et al. , 2009).
Таблица 1. Идентичные нуклеотидные последовательности ГВС1 мтДНК, относящиеся к разным гаплогруппам, выявленные в исследованных популяциях Евразии (n = 2861; по: Деренко, Малярчук , 2010)
ГВС1 гаплотип |
Гаплогруппа мтДНК |
16093C |
H*, U4a2a |
16223T |
D4, M7c2a, M11 |
16298C |
HV0a, V |
16304C |
H*, H1, H5, F |
16311C |
H*, H1, H2b, HV3, R1 |
CRS |
H*, H1, H2, H7, HV4, U4, U5b, R* |
16223T-16362C |
D4, G2, M9a2a |
16278T-16311C |
HV3, R1 |
16223T-16278T-16362C |
D4, G2 |
16223T-16311C-16362C |
D4, G2 |
Примечание : мутации указаны относительно CRS (по: Andrews et al ., 1999)
В связи с развитием методов секвенирования следующего поколения и появлением популяционных наборов данных об изменчивости целых митогено-мов несколько лет назад стали появляться результаты сравнительного анализа изменчивости участков мтДНК и целых митогеномов ( King et al. , 2014; Just et al. , 2015; Garcia et al. , 2020; Taylor et al. , 2020). Как и ожидалось, полно-митогеномное секвенирование существенно улучшает дискриминирующий потенциал гаплотипов мтДНК. Так, на примере трех групп населения США было установлено, что секвенирование целых митогеномов приводило к почти двукратному увеличению числа уникальных гаплотипов в сравнении с секвенированием только участка ГВС1 ( Just et al. , 2015). Значения вероятности случайного совпадения (rmp) ГВС1-гаплотипов в трех этнорасовых группах населения США варьировали от 1,27 до 2,75 %, однако в случае полномитогеномного секвенирования значения этого показателя составляли менее 1 % (табл. 2).
Величина вероятности случайного совпадения гаплотипов зависит от размера исследованных выборок: чем больше выборка, тем меньше значение rmp. Анализ разнообразия гаплотипов по результатам секвенирования участков ГВС1 мтДНК в различных популяциях показал, что значения rmp изменяются в диапазоне от 2,5 до 0,52 % для выборок размером от 60 до 600 человек (Budowle et al., 1999). Между тем, по результатам секвенирования целых мито-геномов величина этого показателя изменяется от 1,9 % для n = 53 до 0,06 % для n = 1998 (Davidovic et al., 2020). Вероятность случайного совпадения гаплотипов зависит также от метода определения количества анализируемых гаплотипов в выборке – различия между гаплотипами могут определяться как нуклеотидными заменами, так и точечными делециями и инсерциями нуклеотидов, а также гетерогенностью молекул мтДНК в митохондриях (гетероплазмией), в связи с которой отдельный индивидуум может характеризоваться более чем одним гаплотипом мтДНК. Однако в большинстве популяционно-генетических и судебно-генетических работ используется стандартный подход, основанный на расчете числа гаплотипов, отличающихся друг от друга только нуклеотидными заменами; незначительный вклад делеций и инсерций в формирование гаплотипического разнообразия мтДНК, таким образом, игнорируется. Данный подход одобрен ДНК-комиссией Международного общества судебных генетиков (DNA Commission of the International Society for Forensic Genetics) (Parson et al., 2014; Just et al., 2015).
Таблица 2. Значения (в %) вероятности случайного совпадения гаплотипов и гаплотипического разнообразия мтДНК (в скобках) у населения США в зависимости от исследованного участка митогенома
Популяции |
Участки мтДНК |
|||
ГВС1 |
ГВС1+ГВС2 |
Контрольный регион |
Целый митогеном |
|
Латиноамериканцы США (n = 155) |
1,27 (99,37) |
0,9 (99,74) |
0,79 (99,86) |
0,72 (99,92) |
Афроамериканцы США (n = 170) |
1,38 (99,2) |
0,92 (99,67) |
0,78 (99,81) |
0,6 (99,99) |
Белые США (n = 263) |
2,75 (97,62) |
0,96 (99,42) |
0,6 (99,78) |
0,39 (99,99) |
Примечания : n – размер исследованной выборки; вероятность случайного совпадения гаплотипов (rmp, random match probability) рассчитана как ∑x2, где x – частота каждого гаплотипа в выборке (по: Fisher , 1951; Stoneking et al. , 1991); гаплотипическое разнообразие h = (1 - ∑x2)n/(n - 1) (по: Nei , 1987). Данные приводятся по: ( Just et al. , 2015. Tabl. 1). В расчетах учитывались только нуклеотидные замены
Анализ данных
В настоящее время имеется несколько крупных баз данных, в которых хранятся файлы c нуклеотидными последовательностями целых митохондриальных геномов (в формате FASTA). Однако поскольку долгое время основным условием для публикации результатов была необходимость представления нуклеотидных последовательностей мтДНК в базу данных GenBank (см. National Center…), то все эти базы дублируют друг друга, а главным хранилищем целых митогеномов является сам GenBank. Так, крупнейшая база данных Mitomap (см. MITOMAP…) располагает распределенными по гаплогруппам мтДНК данными о 51836 нуклеотидной последовательности, хранящейся в GenBank. Для носителей этих митогеномов во многих случаях имеются сведения относительно страны проживания, этнической принадлежности исследованных индивидуумов, возраста и др., что помогает проводить популяционно-генетические исследования в различных направлениях. Также примерно 50 000 митогеномов находятся в базе данных HmtDBA (HmtDB…), большая часть которых представлены в GenBank, но некоторые экстрагированы из базы данных проекта 1000 Genomes Project (см. International Genome…). Аналогично некоторыми отсутствующими в GenBank последовательностями митогеномов располагает база данных проекта Phylotree (PhyloTreemt…). К сожалению, недостатком публичных данных о митогеномных последовательностях, представленных в GenBank, является отсутствие гарантий, что нуклеотидные последовательности определены совершенно правильно, поскольку разные коллективы работают с разной степенью тщательности при секвенировании мтДНК (Yao et al., 2009). Чтобы избежать подобных проблем, судебно-генетическое сообщество основало базу данных EMPOP (EMPOP database…), в которой хранятся не только нуклеотидные последовательности митогеномов и гипервариабельных участков мтДНК, но и файлы, например, фореграмм, подтверждающих те или иные варианты полиморфизма мтДНК. В настоящее время база данных EMPOP содержит информацию о 4289 целых митогеномах из различных популяций; часть этих данных отсутствует в GenBank. В последние годы резко усилился приток данных о полиморфизме целых молекул мтДНК, полученных с помощью секвенирования геномных библиотек методами NGS. Параллельно с этим ослабло требование предоставлять нуклеотидные последовательности мтДНК (в виде FASTA-файлов) в базу данных GenBank. В публикациях результаты анализа полиморфизма мтДНК зачастую приводятся или в табличном формате – в виде строк нуклеотидных замен относительно референса (как во многих работах по древней ДНК), или вообще без отсылки на хранилища, где хранятся полученные в той или иной работе геномные данные, из которых можно экстрагировать уже данные полномитогеномные. В случае древней ДНК одной из попыток как-то привести в порядок возникший хаос стало создание базы данных AmtDB (AmtD…), в которой сейчас находятся 2443 нуклеотидные последовательности целых митогеномов от древних индивидуумов, реконструированные из опубликованных данных.
В настоящей работе нами проведен сравнительный анализ значений вероятности случайного совпадения гаплотипов rmp для целых митохондриальных геномов и гипервариабельных участков (ГВС1, ГВС2, ГВС1 + ГВС2 и всего контрольного региона) у населения Евразии. Проанализированы опубликованные результаты, представленные в базах данных GenBank (см. National Center…) и проекта 1000 Genomes Project (см. International Genome…), а кроме того, собственные данные, полученные в результате полногеномного секвенирования. В выборку исследованного российского населения (n = 233) вошли представители различных этнических групп. В табл. 3 приводятся результаты анализа для 34 популяций ранга этнических групп, а также для объединенных региональных популяций на уровне субконтинентальных групп (Европа, Сибирь, Восточная Азия, Центральная Азия, Кавказ, Западная Азия) и их объединений. Всего проанализировано 7011 митогеномов.
Сравнительный анализ показал, что величины значений rmp широко варьируют в зависимости от размера исследованных выборок, а также популяционной специфики, связанной, по-видимому, с особенностями демографической истории популяций (табл. 3). В европейских популяциях разрешающая способность анализа изменчивости целых митогеномов обычно в 2–6 раз выше в сравнении с анализом ГВС1-участка, однако в случае больших выборок (см., например, n = 814 для поляков) значение rmp уменьшается в 18,6 раза при анализе целых митогеномов. Аналогично для объединенных европейских выборок информативность анализа целых митогеномов намного выше таковой в сравнении с ГВС1: вероятность случайного совпадения гаплотипов для целых мито-геномов в 19–29 раз ниже в сравнении с участком ГВС1. Вместе с тем, информативность участка ГВС2 очень низка – значения rmp в отдельных популяциях изменяются в диапазоне от 6 до 16,5 %, однако при объединении участков ГВС1 и ГВС2 (анализ ГВС1 + ГВС2) значения rmp составляют 0,6–0,9 % (в отдельных европейских популяциях – от 0,8 до 4,2 %). В случае анализа всего контрольного региона информативность повышается еще больше – значения rmp составляют 0,3–0,7 %. В итоге, при исследовании европейских популяций вероятность случайного совпадения гаплотипов для целых митогеномов в 6,3–7,8 раза ниже в сравнении с участком ГВС1 + ГВС2 и в 3,5–5,8 раза ниже в сравнении со всем контрольным регионом.
В популяциях Сибири, Центральной и Восточной Азии также наблюдается увеличение разрешающей способности в случае анализа целых митогеномов в 1,5–4 раза на этническом уровне, а на региональном – в 6 раз (Сибирь и Центральная Азия) и 8,4 раза (Восточная Азия), в сравнении с анализом участка ГВС1. Однако анализ объединенной выборки популяций Сибири, Центральной и Восточной Азии (n = 2447) демонстрирует намного более существенное увеличение разрешающей способности в случае анализа целых митогеномов – в 20,3 раза. Исследование участка ГВС1+ГВС2 показало, что величина rmp изменяется в восточноевразийских популяциях от 0,6 до 13,4 % (и от 0,5 до 1 % на региональном уровне). Для всего контрольного региона наблюдаются похожие значения rmp – на региональном уровне они составляют 0,4–0,9 %. В итоге при исследовании популяций Сибири, Центральной и Восточной Азии вероятность случайного совпадения гаплотипов для целых митогеномов в 8 раз ниже в сравнении с участком ГВС1 + ГВС2 и в 4,4 раза ниже по сравнению с контрольным регионом мтДНК.
В популяциях Западной Азии и Кавказа увеличение разрешающей способности в случае анализа целых митогеномов в сравнении с участком ГВС1 составляет от 1,1 до 6,2 раза на этническом уровне и почти в 8 раз – на региональном (Западная Азия, Кавказ). Между тем, в объединенном наборе популяций (n = 1100) разрешающая способность в случае анализа целых митогеномов увеличилась почти в 30 раз. При исследовании изменчивости участков ГВС1 + ГВС2 и контрольного региона величина rmp в отдельных популяциях Западной Азии и Кавказа изменяется в диапазоне 0,6–4,6 % и 0,3–4,4 % соответственно, а на региональном уровне – в диапазоне 0,4–0,9 %. В итоге, для популяций Западной Азии и Кавказа вероятность случайного совпадения гаплотипов для целых митогеномов в 8,8 раза ниже в сравнении с участком ГВС1 + ГВС2 и в 6,6 раз ниже в сравнении с контрольным регионом мтДНК.
Таблица 3. Значения вероятности случайного совпадения гаплотипов (rmp) и гаплотипического разнообразия (h) мтДНК у населения Северной Евразии для всего митохондриального генома и его гипервариабельных участков
2 о о S >5 3 S |
-н ^ |
о |
-н |
о -н Я of 04 |
-н Я of 04 |
-н ОО О\ of 04 |
-н of 04 |
-н оо °ч О\ О\ |
-н оо О\ О\" О\ |
О1^ -н О\ о< О\ |
-н О\ О\" О\ |
-н О\ О\" О\ |
-н О^ о< 04 |
-н оо О4_ 04" 04 |
О -н ОС 04 04 04 |
ст ст -н 40 04 04 04 |
^1 of -Н Я |
-н О1^ 04 |
-н 4О" 04 |
Is |
40 |
о" |
я |
ст |
о" |
3 |
о |
я |
оо °ч |
of |
04 О О |
04 СТ |
9 |
О; |
Я^ 4О" |
||||
2 |
04 |
5 |
ОО 04 |
о |
оо (М |
о |
оо |
О\ |
о |
о |
04 ГО |
m ст |
2 |
40 |
Я |
||||
к о СТ СТ >5 3 к ч о ст к £ |
75 -н ^ |
2 |
-н оо^ of 04 |
о -н ст of 04 |
-н of 04 |
-н 04 40 of 04 |
-н of 04 |
О\ -н О\ |
-н О\" О\ |
-н О\" О\ |
-н я О\" О\ |
-н О1 'СТ О\" О\ |
-н оо" 04 |
О1^ -н °ч of 04 |
m о о -н Я 04 04 |
ос ст ст -н 04 ГО 04 04 |
О1^ of -н °Ч 4О" 04 |
О1^ -н of оо |
of -н Я |
ст<> 8S |
2 |
04 |
ст |
я |
°ч |
о |
40 |
Я О |
04 40 СТ |
оо" |
оо" |
||||||||
04 |
04 04 |
04 04 |
S |
ОО ОО |
о |
оо оо |
04 |
о |
04 |
о |
ю 04 ОО |
к> 40 |
^ |
оо |
|||||
04 и m + и ffl |
-н |
^ |
04^ -н of 04 |
-н О\ 04 |
-н ст of 04 |
-н 04 Г| of 04 |
-н 04^ of 04 |
я -н О1 ^1 О\ О\ |
-н ^1 о< О\ |
-н о< О\ |
Я -н о О\" О\ |
-н О^ о< О\ |
04^ -н я |
-н 04" 04 |
ОС о о -н я 04 04 |
СТ -н 04 04 |
О1^ of -н оо^ 4О" 04 |
О1^ -н 04" ОО |
of -н Я |
Is |
о |
04 °я |
о" |
я |
О\ |
^„ |
я |
О\ |
°ч |
Я О |
Я СТ |
оо" |
оо" |
||||||
04 |
ОО |
я 04 |
я |
о |
о |
я |
о |
О\ |
я |
40 |
я |
ОО 04 |
ГО 40 |
оо |
|||||
с-1 и ffl |
-н |
ОО |
04^ -н 04 |
О\ -н 04 |
°ч -н я |
40, -н О\ 04" 04 |
-н 04" 04 |
-Н О\ |
-н О\ я |
О1^ of -н of О\ |
-Н О\ |
-Н |
-н °ч я |
of -н я |
■п о -н of 04 |
40 СТ -н ст 04 |
О1^ -н 04^ оо" оо |
-н о^ ОО |
-н |
Is |
о |
04 оо^ оо" |
04 оо оо" |
ст ст" |
Г| |
оо" |
О\ |
я |
^о ''Ч оо" |
о< |
О1^ |
40" |
о" |
40 04 |
40 04 04 |
of О1 |
Я |
||
40 |
ОО |
о |
ОО |
о |
О\ |
9 |
я |
О1 |
о |
04 К> 04 |
К> 04 |
04 |
о |
■о |
|||||
и ffl |
-н |
^ |
-н оо^ оо" 04 |
ОО -н 04 Я |
-н оо" 04 |
-н я |
-н О\ оо" 04 |
-н О\ оо" О\ |
-н ^1 оо" О\ |
-н оо" О\ |
-н О\ °ч Я |
-н оо" О\ |
-н я |
04^ -н я |
04^ О -н m 04 Я |
СТ -н 40 04 |
-н я |
04^ -н я |
-н Я |
Is |
хГ |
04 40 |
9 of |
я 04" |
ст 04" |
of |
^о of |
of |
of |
оо of |
40" |
04 |
of |
1Л г**) |
04" |
О1^ |
|||
m |
^ |
ОО 04 |
ОО |
3 |
о |
04 ^о |
я |
о |
я |
я ю |
О1 |
ОО |
О1 |
||||||
й |
о |
я |
04 ст |
о |
ОО |
о |
2 |
оо О1 04 |
чо 04 |
2 |
о |
9 |
04 04 04 |
я |
я |
оо |
|||
ст о С |
>s ^ s s о щ О ^ у ст ™ О о Ю Р m о |
lo СТ ст? |
о С |
ъ о С |
сЗ О н m Н G |
>s м 2 ° « Е ffl Ри |
3 о |
3 я ffl |
3 ст о |
3 я о и |
3 ст п о |
3 ст S еЗ |
сё К О ст Й ы |
04 сё К О ст а Ы |
3 ст S о 2 |
3 |
S X m S К |
Окончание табл. 3
2 о о S >5 3 S |
-н ^ |
^ |
о о -н 4© ©4 ©4 ©4 |
-н eq |
-н оо^ оо" 04 |
eq^ -н oC 04 |
-H eq^ oo" 04 |
-H ©C 04 |
-H OO' O\" O\ |
0^1 -H O\" O\ |
0^1 -H O\" O\ |
O\" O\ |
qo O\" O\ |
-н О\" О\ |
-н |
-н |
О -н оо с\ С\ |
о -н о о о |
о -н 0© CS С\ |
Is |
40 |
eq о |
eq" |
04 |
eq" |
oo oo_ |
°4 |
m_ |
00 e^ eq" |
оо |
о" |
(*) о |
го eq 0 |
С\ eq 0 |
|||||
2 |
го о |
2 |
о |
oo 40 |
eq |
00 |
O\ |
O\ |
00 |
eq |
eq eq |
ч© ГО ■г, |
(О О |
0 (О ч© |
|||||
к о СТ Рн >5 3 к ч о а к £ |
7© -н ^ |
2 |
о© о о -н ©4 ГО ©4 ©4 |
-н а |
-н оо" 04 |
-H oo" 04 |
OO' -H OO' 04 |
-H ©C 04 |
e^ -H O\" O\ |
-H O\" O\ |
e^ O\" O\ |
-H O\" O\ |
-H O\" O\ |
-н qo О\" О\ |
е^ -н О\" О\ |
-н ОО' О\" О\ |
о -н eq с\ |
о -н |
о -н с? С\ |
8S |
2 |
©4 4© о |
eq" |
eq" |
oo eq" |
s |
oo |
^ |
^ |
eq" |
о" |
Si |
qo |
С\ о |
S о |
С\ ГО О |
|||
eq |
in 4© |
о |
$ |
ri |
oo |
Si |
00 |
^0 |
ОО |
Si |
S |
го ч© го |
о го |
к, |
|||||
(М и m + |
-н |
2 |
о -н ©4 ©4 |
-н S |
-н оо" 04 |
-H oo" 04 |
OO' -H OO' 04 |
0^1 -H ©C 04 |
e^ -H O\" O\ |
-H O\" O\ |
0^1 -H O\" O\ |
e^ -H O\" O\ |
O\" O\ |
-н О\" О\ |
-н е^ О\" О\ |
-н о< О\ |
о -н С\ |
о -н ГО ©\ |
о -н ^с CS С\ |
Is |
о |
о |
eq" |
ОО' eq" |
oo eq" |
s |
oo eq^ |
04 |
m |
eq" |
3 |
О\ |
о |
о |
о |
||||
©4 |
ГО 4© |
о |
So |
oo |
ri |
2 |
00 |
^0 |
00 |
00 eq |
9 |
ОО |
О\ |
ч© ГО ГО |
■г, eq |
С\ чо |
|||
с-1 и |
-н |
ОО |
40 о -н ©4 |
-н о< ОО |
qo -н ОО' S |
-H |
OO' -H oo |
eq" -H O\ qo" oo |
-H O\" 00 |
eq" -H O\ o< 00 |
-H |
°4 Si |
qo eq" -H O\ |
ОО' -н О\" ОО |
eq" -н е^ оо |
eq" -н ОО' |
С\ о -н 1Л |
eq -н О eq |
4© о -н С\ о С\ |
Is |
г- |
40 ©4 ©4 |
4D |
ОО О\ |
O' |
co |
qo |
°4 |
O' |
4- |
O\ |
O' |
qo |
eq" eq |
^© eq |
eq QO eq |
0© с\ |
||
40 |
ш eq |
ОО |
ОО eq |
oo |
eq eq |
5 |
m |
^0 |
eq |
S |
^0 |
к, 0 |
ч© ос |
©4 к, |
|||||
-н |
^ |
о -н IS 40 ©4 |
-н О\ ОО |
-н е^ <5 |
-H qo qo" 04 |
O\ -H S |
e^ -H O\ oo" O\ |
©\ 00" O\ |
-H O\ 00" O\ |
e^ -H O\" O\ |
00" O\ |
°4 00" O\ |
-н О\" О\ |
qo -н ОО' S |
04 -н ОО' оо" О\ |
0 -н (О 0© С\ |
eq 0 -н (О 0© С\ |
о -н eq ©4 |
|
Is |
хГ |
in ГО |
4D |
ОО |
S |
eq qo" |
oo qo |
eq" |
S |
^0 |
о^ |
о |
qo |
оо |
го С\ |
©4 0© О |
|||
m |
ОО |
eq |
oo |
qo |
о |
0 |
0 |
0 |
O\ |
qo eq |
о |
S |
CS ГО eq |
о eq |
S |
||||
й |
eq |
eq ©4 eq |
2 |
eq eq |
04 40 |
о |
ri |
O\ O\ |
Si |
O\ Pl eq |
к |
2 |
оо |
О\ eq |
ч© С\ |
0 eq |
4© 4© О |
||
ст о С |
eq л К © а Й Ы |
S R £ |
3 |
3 t* |
S |
3 и |
3 & w |
c3 S c3 X |
3 s s ^ |
3 ч о о 2 |
з 1 |
3 к о с ^ |
3 ст 03 ^ |
й а S к© S и |
s s ^ R Л к © © |
R © Я © а н к s S © м Д < |
о о -н 04 04 04 |
04^ -H |
-н °\ 04" 04 |
0^1 -н 04^ 04" 04 |
eq^ -н 40, О\" 04 |
-н 04" 04 |
ш о |
re |
eq |
04 Г1 |
eq |
|
m ОО m |
о |
3 |
00 |
3 |
eq |
3 о -н ОС ГП 04 04 |
°\ -H |
е^ -н 04" 04 |
-н 40 04" 04 |
-н еЧ оС 04 |
-н 04" 04 |
4© чо о |
m |
О |
04 40 |
Я. |
|
ОО |
о |
40 |
СО |
40 eq |
|
о о -н eq Q0 оо 04 |
eq^ -H 04" 04 |
-н е^ 04" 04 |
-н 04" 04 |
-н 04^ оо" 04 |
-н оо оо" 04 |
eq eq |
О |
m |
3 |
оо О4_ |
40, |
4© |
OO eq |
0 |
оо |
eq |
|
ГП -н rn eq Ш |
00 eq" -H 3 |
-н е^ 04 |
-н 04 |
04^ -н 40 eq" 04 |
°Ч -н 04" оо |
00" |
40 |
eq 00" |
|||
eq |
eq |
сп |
9 |
оо |
|
о -H QO 04 |
eq" -H 3 |
-н 40 оо" 04 |
-н е^ оо" 04 |
-н 04^ 04 |
°ч -н 3 |
04 |
IQ |
Я. |
5 eq" |
04 eq" |
40 ОО, |
40 04 |
Я |
S |
eq 40 |
eq |
Я |
Я |
О |
оо |
ОО |
eq |
04 eq |
R R я S r &Й S $ « ‘g у s О и^ |
3 R К |
3 ст с |
3 ст я R Я |
3 СТ )Я cd СТ 1 |
'ст СТ |
о -н 04 04 04 |
04^ O\" 04 |
-H |
0 -H 0 0 0 |
0 -H 0 0 0 |
|
m rn о |
О eq" |
04 |
ir, 0 |
04 О О |
|
04 m |
00 eq |
40 OO |
04 T, |
ir, 04 |
|
0 -н 40 04 04 |
-H °4 04" 04 |
-H 04^ 04" 04 |
О -H QO 04 04 |
О -H 1Л 04 04 |
|
m 40 0 |
ri eq" |
04 eq^ |
K> ГП О |
04 1Л О |
|
eq m m |
04 |
00 ri |
GO |
4© |
|
eq 0 -H ГП 04 04 |
40^ -H 04" 04 |
-H 40^ O\" 04 |
О -H 40 04 04 |
О -H rn 04 04 |
|
m 04 0 |
eq" |
04 |
K> 1Л О |
О |
|
K> 0 m |
00 eq |
eq 00 |
04 m 4© |
||
QO О -H 40 ГП 04 |
eq" -H eq" 04 |
00 -H 00^ 40 04 |
-H e^ 04 |
4© О -H rn 04 |
■л 0 -H 0 04 |
40 40 |
OO eq^ 04" |
40 4O_ 4O" |
00 O4_ |
s |
QO ГП 04 |
О m |
04 eq |
04 |
ri |
сП |
|
О -H QO 04 |
-H 04^ OO" 04 |
-H 04" 04 |
e^l -H 04" 04 |
eq 0 -H О 04 04 |
rn О -H 1Л 04 |
eq eq |
О |
О |
OO |
1Г, |
04 eq |
40 m eq |
9 |
40 eq |
О |
eq K> m |
QO |
04 |
ri |
00 01 |
40 |
4© 4© |
0 0 |
s s ^ R Л CT ч Л e R ее |
3 CT 0 VO |
3 CT CT fi1 |
4> CT |
CS CT Л |
R S ^ R м R R CT CT 4 CT R R §Ы ее я |
Fraumene et al. , 2006; 12 проект 1000 Genomes (см. International Genome…); 13 Duggan et al. , 2013; 14 Derenko et al. , 2018; 15 Derenko et al. , 2021; Peng et al. , 2018; 17 Zheng et al. , 2017; 18 Zheng et al. , 2011; 19 Schönberg et al. , 2011; 20 Derenko et al. , 2013; 21 Matisoo-Smith et al. , 2016;
Margaryan et al., 2017; 23 Derenko et al. , 2019
Таким образом, результаты проведенного исследования популяций Евразии свидетельствуют, что величины вероятности случайного совпадения гаплотипов мтДНК в случае анализа целых митогеномов в 20–30 раз меньше таковых, полученных при анализе только лишь гипервариабельного сегмента мтДНК (ГВС1) – при условии, что анализируются большие выборки (более 1000 человек). В выборках меньшего размера информативность анализа изменчивости целых митогеномов заметно ниже, но все равно в несколько раз выше, чем в случае анализа одного лишь участка ГВС1 мтДНК. Аналогичная тенденция отмечена и при анализе объединенных участков ГВС1 и ГВС2, а также всего контрольного региона мтДНК. Информативность анализа изменчивости целых митогеномов в несколько раз выше в сравнении с гипервариабельными участками мтДНК – примерно в 6–9 раз выше в сравнении с участком ГВС1 + ГВС2 и в 4–7 раз выше по сравнению с контрольным регионом мтДНК.
Заключение
Полученные результаты сопоставительного анализа в очередной раз указывают на необходимость создания геномных баз данных большого размера не только для современного, но и для древнего населения. Это возможно, так как развитие методик палеогеномных исследований последних лет впечатляюще; новые технологии секвенирования ДНК позволяют выявлять не только отдельные участки мтДНК, как это было еще 10–20 лет назад, но и реконструировать целые митохондриальные и ядерные геномы людей предшествующих эпох ( Racimo et al ., 2020). Проведенное исследование показывает, что интерпретации результатов палеогеномных исследований, сделанные только на основании данных о гипервариабельных участках мтДНК, могут быть отчасти пересмотрены и уточнены. При выполнении современных археогенетических работ важно опираться на характеристики полных митогеномов.
Список литературы Анализ митохондриальных геномов современного и древнего населения Северной Евразии: вероятности случайного совпадения гаплотипов
- Деренко М. В., Малярчук Б. А., 2010. Молекулярная филогеография населения Северной Евразии по данным об изменчивости митохондриальной ДНК. Магадан: Северо-Восточный научный центр Дальневосточного отделения РАН. 376 с.
- AmtDB. Ancient mtDNA database. URL: https://amtdb.org
- Anderson S., Bankier A. T., Barrell B. G. et al., 1981. Sequence and organization of the human mitochondrial genome // Nature. Vol. 290. P. 457–465.
- Andrews R. M., Kubacka I., Chinnery P. F. et al., 1999. Reanalysis and revision of the Cambridge reference sequence for human mitochondrial DNA // Nature Genetics. Vol. 23, 2. P. 147.
- Bodner M., Iuvaro A., Strobl C. et al., 2015. Helena, the hidden beauty: Resolving the most common West Eurasian mtDNA control region haplotype by massively parallel sequencing an Italian population sample //Forensic Science International: Genetics. Vol. 15. P. 21–26.
- Budowle B., Wilson M. R., DiZinno J. A. et al., 1999. Mitochondrial DNA regions HVI and HVII population data // Forensic Science International. Vol. 103. P. 23–35.
- Bulgarian FTDNA project. URL: www.familytreedna.com
- Davidovic S., Malyarchuk B., Grzybowski T. et al., 2020. Complete mitogenome data for the Serbian population: the contribution to high quality forensic databases // International Journal of Legal Medicine. Vol. 134. No. 5. P. 1581–1590.
- Derenko M, Denisova G, Dambueva I, Malyarchuk B, Bazarov B. Mitogenomics of modern Mongolicspeaking populations. Mol Genet Genomics. 2021 Nov 10. doi: 10.1007/s00438-021-01830-w. (In print.)
- Derenko M., Denisova G., Malyarchuk B. et al., 2018. Mitogenomic diversity and differentiation of the Buryats // Journal of Human Genetics. Vol. 63. P. 71–81.
- Derenko M., Denisova G., Malyarchuk B. et al., 2019. Insights into matrilineal genetic structure, differentiation and ancestry of Armenians based on complete mitogenome data // Molecular Genetics and Genomics. Vol. 294. P. 1547–1559.
- Derenko M., Malyarchuk B., Bahmanimehr A. et al., 2013. Complete mitochondrial DNA diversity in Iranians // PLoS One. Vol. 8. No. 12. e80673.
- Duggan A. T., Whitten M., Wiebe V. et al., 2013. Investigating the prehistory of Tungusic peoples of Siberia and the Amur-Ussuri region with complete mtDNA genome sequences and Y-chromosomal markers // PLoS One. Vol. 8. No. 12. e83570.
- EMPOP database – high quality population data (the collection, quality control and searchable presentation of mtDNA haplotypes from diverse world populations). URL: https://empop.online
- Fisher R. A., 1951. Standard calculations for evaluating a blood-group system // Heredity. Vol. 5. P. 95–102.
- Fraumene C., Belle E. M., Castri L. et al., 2006. High resolution analysis and phylogenetic network construction using complete mtDNA sequences in Sardinian genetic isolates // Molecular Biology and Evolution. Vol. 23. Iss. 11. P. 2101–2111.
- García Ó., Alonso S., Huber N. et al., 2020. Forensically relevant phylogeographic evaluation of mitogenome variation in the Basque Country // Forensic Science International: Genetics. Vol. 46. 102260.
- HmtDB – Human Mithochondrial Genomic Resourse based on Variability Studies, Supporting Population Genetics and Biomedical Research. URL: www.hmtdb.uniba.it
- International Genome Sample Resource. Supporting open human variation data. URL: http://www.internationalgenome.org
- Just R. S., Scheible M. K., Fast S. A. et al., 2015. Full mtGenome reference data: development and characterization of 588 forensic-quality haplotypes representing three U.S. populations // Forensic Science International: Genetics. Vol. 14. P. 141–155.
- King J. L., LaRue B. L., Novroski N. M. et al., 2014. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq // Forensic Science International: Genetics. Vol. 12. P. 128–135.
- Librado P., Rozas J., 2009. DnaSP v5: a software for comprehensive analysis of DNA polymorphism data // Bioinformatics. Vol. 25. P. 1451–1452.
- Lutz S., Weisser H. J., Heizmann J., Pollak S., 1997. A third hypervariable region in the human mitochondrial D-loop // Human Genetics. Vol. 101. Iss. 3. P. 384.
- Malyarchuk B., Derenko M., Denisova G., Kravtsova O., 2010. Mitogenomic diversity in Tatars from the Volga-Ural region of Russia // Molecular Biology and Evolution. Vol. 27. Iss. 10. P. 2220–2226.
- Malyarchuk B., Derenko M., Denisova G. et al., 2018. Whole mitochondrial genome diversity in two Hungarian populations // Molecular Genetics and Genomics. Vol. 293. P. 1255–1263.
- Malyarchuk B., Litvinov A., Derenko M. et al., 2017. Mitogenomic diversity in Russians and Poles // Forensic Science International: Genetics. Vol. 30. P. 51–56.
- Margaryan A., Derenko M., Hovhannisyan H. et al., 2017. Eight millennia of matrilineal genetic continuity in the South Caucasus // Current Biology. Vol. 27. Iss. 13. P. 2023–2028.
- Matisoo-Smith E. A., Gosling A. L., Boocock J. et al., 2016. A European mitochondrial haplotype identified in ancient Phoenician remains from Carthage, North Africa // PLoS One. Vol. 11. No. 5. e0155046.
- MITOMAP. A human mitochondrial genome database // Mitobank – Mitochondrial DNA Sequences. URL: www.mitomap.org/foswiki/bin/view/ MITOMAP/Mitobank National Center for Biotechnological Information. URL: www.ncbi.nlm.nih.gov
- Nei M., 1987. Molecular evolutionary genetics. New York: Columbia University Press. 512 p.
- Parson W., Gusmão L., Hares D. R. et al., 2014. DNA Commission of the International Society for Forensic Genetics: Revised and extended guidelines for mitochondrial DNA typing // Forensic Science International: Genetics. Vol. 13. P. 134–142.
- Parsons T. J., Coble M. D., 2001. Increasing the forensic discrimination of mitochondrial DNA testing through analysis of the entire mitochondrial DNA genome // Croatian Medical Journal. Vol. 42. No. 3. P. 304–309.
- Peng M. S., Xu W., Song J. J. et al., 2018. Mitochondrial genomes uncover the maternal history of the Pamir populations // European Journal of Human Genetics. Vol. 26. P. 124–136.
- PhyloTreemt – Phylogenetic tree of worldwide human mitochondrial DNA variation. URL: www.phylotree.org
- Piotrowska-Nowak A., Elson J. L., Sobczyk-Kopciol A. et al., 2019a. New mtDNA association model, MutPred variant load, suggests individuals with multiple mildly deleterious mtDNA variants are more likely to suffer from atherosclerosis // Frontiers in Genetics. Vol. 9. P. 702.
- Piotrowska-Nowak A., Kosior-Jarecka E., Schab A. et al., 2019b. Investigation of whole mitochondrial genome variation in normal tension glaucoma // Experimental Eye Research. Vol. 178. P. 186–197.
- Racimo F., Sikora M., Vander Linden M. V. et al., 2020. Beyond broad strokes: sociocultural insights from the study of ancient genomes // Nature Reviews Genetics. Vol. 21. P. 355–366.
- Raule N., Sevini F., Li S. et al., 2014. The co-occurrence of mtDNA mutations on different oxidative phosphorylation subunits, not detected by haplogroup analysis, affects human longevity and is population specific // Aging Cell. Vol. 13. Iss. 3. P. 401–407.
- Rogaev E., Grigorenko A., Moliaka Yu. et al., 2009. Genomic identification in the historical case of the Nicholas II royal family // PNAS. Vol. 106. Iss. 13. P. 5258–5263.
- Schönberg A., Theunert C., Li M. et al., 2011. High-throughput sequencing of complete human mtDNA genomes from the Caucasus and West Asia: high diversity and demographic inferences // European Journal of Human Genetics. Vol. 19. P. 988–994.
- Skonieczna K., Malyarchuk B., Jawień A. et al., 2018. Mitogenomic differences between the normal and tumor cells of colorectal cancer patients // Human Mutation. Vol. 39. Iss. 5. P. 691–701.
- Stoljarova M., King J. L., Takahashi M. et al., 2016. Whole mitochondrial genome genetic diversity in an Estonian population sample // International Journal of Legal Medicine. Vol. 130. No. 1. P. 67–71.
- Stoneking M., Hedgecock D., Higuchi R. G. et al., 1991. Population variation of human mtDNA control region sequences detected by enzymatic amplification and sequence-specific oligonucleotide probes // American Journal of Human Genetics. Vol. 48. No. 2. P. 370–382.
- Taylor C. S., Kiesler K. M., Sturk-Andreaggi K. et al., 2020. Platinum-quality mitogenome haplotypes from United States populations // Genes (Basel). Vol. 11. P. 1290.
- Yao Y.-G., Salas A., Logan I., Bandelt H.-J., 2009. mtDNA data mining in GenBank needs surveying // American Journal of Human Genetics. Vol. 85. No. 6. P. 929–933.
- Zheng H. X., Li L., Jiang X. Y. et al., 2017. MtDNA genomes reveal a relaxation of selective constraints in low-BMI individuals in a Uyghur population // Human Genetics. Vol. 136. P. 1353–1362.
- Zheng H. X., Yan S., Qin Z. D. et al., 2011. Major population expansion of East Asians began before Neolithic time: evidence of mtDNA genomes // PLoS One. Vol. 6. e25835.