GWAS-анализ голштинского крупного рогатого скота Свердловской области с использованием полной и экстремальной выборок

Автор: Богатова П.С., Лиходеевская О.Е., Лоретц О.Г., Лиходеевский Г.А., Минина О.А., Евсеева Т.П.

Журнал: Вестник Красноярского государственного аграрного университета @vestnik-kgau

Рубрика: Зоотехния и ветеринария

Статья в выпуске: 3, 2026 года.

Бесплатный доступ

Цель исследования - выявление генетических маркеров, ассоциированных с показателями молочной продуктивности (удоем, содержанием жира и белка в молоке) у голштинского крупного рогатого скота, с использованием метода полногеномного ассоциативного анализа (GWAS) на выборке животных из племенных хозяйств Свердловской области за 2018-2024 гг. Задачи: провести генотипирование выборки коров с использованием ДНК-биочипов и осуществить контроль качества данных; выполнить GWAS-анализ молочной продуктивности на полной популяции и на экстремальных фенотипических группах; идентифицировать статистически значимые однонуклеотидные полиморфизмы (ОНП), связанные с удоем, содержанием жира и белка; проанализировать гены, расположенные вблизи значимых ОНП, для понимания их роли в метаболизме липидов, иммунном ответе и развитии ткани молочной железы; оценить совпадение генетических ассоциаций между полной выборкой и экстремальными группами для подтверждения надежности маркеров. GWAS-анализ молочной продуктивности проведен на 539 голштинских коровах из 3 племенных хозяйств Свердловской области (2018-2024 гг.). Анализ удоя, жира и белка выполнен на полной выборке и экстремальных квартилях Q1/Q4 (удой: (10028 ± 680) и (6775 ± 653) кг; жир: (4,07 ± 0,068) и (3,79 ± 0,092) %; белок: (3,38 ± 0,066) и (3,12 ± 0,045) %). Всего идентифицировано 20 значимых ОНП, ассоциированных с показателями продуктивности крупного рогатого скота. Вблизи некоторых полиморфизмов расположены гены, ответственные за метаболизм жирных кислот и липидов (SLC27A6), а также связанные с молочной продуктивностью и иммунным ответом (GPX8, CDC20B и GZMA). Выявленные ОНП и локусы могут выступать в качестве кандидатных маркеров для геномной селекции голштинского скота. Совпадение GWAS-результатов на полной выборке и экстремальных квартилях Q1/Q4 подтверждает надежность выявленных ассоциаций и эффективность использования метода экстремальных выборок.

Еще

Молочная продуктивность, онп, геномная селекция, крупный рогатый скот, голштинская порода

Короткий адрес: https://sciup.org/140314942

IDR: 140314942   |   УДК: 636.234.1+636.082   |   DOI: 10.36718/1819-4036-2026-3-130-142

GWAS analysis of Holstein cattle in the Sverdlovsk region using full and extreme samples

The aim of the study is to identify genetic markers associated with dairy productivity parameters (milk yield, milk fat and protein content) in Holstein cattle using the genome-wide association analysis (GWAS) method on a sample of animals from breeding farms in the Sverdlovsk Region for 2018-2024.

Еще

Текст научной статьи GWAS-анализ голштинского крупного рогатого скота Свердловской области с использованием полной и экстремальной выборок

Введение. Интенсивная селекция по признакам молочной продуктивности, усиленная улучшенным кормлением и управлением, а также ускоренная за счет развития репродуктивных технологий и геномной селекции [1], значительно увеличила производство молока за последние годы [2]. Голштинская порода на сегодняшний день доминирует в мировом молочном животноводстве. На многих рынках, включая США, Бразилию, Японию и Европу [3], а также в России [4, 5] основная часть молочной продукции производится именно коровами голштинской породы, которые демонстрируют высокие удои.

В современных условиях для более эффективной селекции необходимы углубленные знания о генетической структуре и взаимодействии генов, влияющих на ключевые экономические признаки, что позволит точно определить вклад каждого гена и оптимизировать селекционные стратегии для улучшения молочной продуктивности, особенно учитывая, что большинство из них являются комплексными и зависят от многих генов и факторов среды.

В этой связи метод GWAS (Genome-Wide Association Study) становится важным инструментом в молочном скотоводстве для выявления генов и генетических маркеров, влияющих на ключевые хозяйственно важные признаки, такие как молочная продуктивность (удой, содержание жира и белка) [6–8], здоровье животных (устойчивость к маститу, инфекционным и метаболическим заболеваниям) [9], фертильность, а также экстерьерные характеристики коров. Благодаря GWAS ученые могут локализовать количественные локусы признаков (QTL) и идентифицировать кандидатные гены, которые оказывают влияние на эти признаки [10].

Полученные с помощью GWAS данные используются для разработки и внедрения систем геномной оценки племенной ценности, что позволяет повысить точность прогнозирования генетического потенциала животных и ускорить генетический прогресс. Применение геномной селекции помогает проводить отбор по ранее недостаточно оцененным или поздно проявляющимся признакам, таким как здоровье и воспроизводственная способность.

Цель исследования – выявление генетических маркеров, ассоциированных с показателями молочной продуктивности (удоем, содержанием жира и белка в молоке) у голштинского крупного рогатого скота, с использованием метода полногеномного ассоциативного анализа (GWAS) на выборке животных из племенных хозяйств Свердловской области за 2018–2024 гг.

Задачи: провести генотипирование выборки коров с использованием ДНК-биочипов и осуществить контроль качества данных; выполнить GWAS-анализ молочной продуктивности на полной популяции и экстремальных фенотипических группах; идентифицировать статистически значимые однонуклеотидные полиморфизмы (ОНП), связанные с удоем, содержанием жира и белка; проанализировать гены, расположенные вблизи значимых онп, для понимания их роли в метаболизме липидов, иммунном ответе и развитии ткани молочной железы; оценить совпадение генетических ассоциаций между полной выборкой и экстремальными группами для подтверждения надежности маркеров.

Объекты и методы. Исследование проводилось на базе трех племенных хозяйств Свердловской области, специализирующихся на разведении молочного скота. Всего в группу исследования было отобрано 539 полновозрастных коров 2018–2024 гг. рождения.

Для геномного анализа у коров отбирали кровь из подхвостовой вены, используя пробирки с ЭДТА (для стабилизации образцов). Далее образцы были отправлены в сторонние лаборатории для выделения ДНК и генотипирования.

Часть крови поступила в ЦКП «Биоресурсы и биоинженерия сельскохозяйственных животных» (ФГБНУ ФИЦ ВИЖ им. Л.К. Эрнста), где проводилось генотипирование на ДНК-биочипах GGP Bovine 150K (Neogen, США).

Остальные образцы были направлены в Центр геномной селекции ООО «Мираторг», где использовались Bovine 50K ДНК-биочипы (Illumina, США).

Первичную фильтрацию по GeneScore > 0,35 проводили в программном обеспечении R Foundation for Statistical Computing. Последующие фильтрации по отсутствующим данным генотипов проводили с помощью PLINK v1.9 (Purcell S. и др., 2007) и опций – geno 0,05 – mind 0,05, – maf 0,01.

В первом варианте GWAS-анализа использовали всю доступную популяцию животных за 2018–2024 гг, прошедшую контроль качества по генотипам и фенотипам. Для трех признаков продуктивности (удой, содержание жира, содержание белка в молоке за первую лактацию с поправкой на 305 дней) на полной выборке животных были проведены ассоциативные исследования с помощью линейной регрессии в PLINK – без разделения животных по уровням признаков или выделения экстремальных групп.

Кроме того, был проведен второй вариант полногеномного ассоциативного анализа на основе экстремальной выборки фенотипов [11]. Исходная выборка животных была разделена по каждому признаку – удою молока, содержанию жира и белка – на четыре квартиля, в соответствии с их значениями фенотипов. Разделение выполняли с использованием функции qcut() библиотеки pandas языка Python, которая обеспечивает равное распределение наблюдений по квартилям. Для каждого признака были сформированы две группы, объединяющие животных из крайних квартилей: Q1 (высокие значения признака) и Q4 (низкие значения признака). В дальнейшем были созданы выборки Q1 + Q4 по удою, Q1 + Q4 по содержанию жира в молоке и Q1 + Q4 по содержанию белка в молоке, которые использовались для проведения GWAS-анализа. Для каждой группы дополнительно вычислялись средние значения и стандартные отклонения основных показателей продуктивности (удой, массовая доля жира и белка) и количество включенных животных. В результате для анализа были использованы 3 группы по 270 животных в каждой.

Для выявления ассоциаций между однонуклеотидными полиморфизмами (ОНП) и количественными признаками был проведен полногеномный ассоциативный анализ с использованием программного пакета PLINK версии 1.9.

Анализ ассоциаций осуществлялся методом линейной регрессии, реализованным в PLINK (–linear), при котором для каждой ОНП-позиции тестировалась зависимость значения признака от количества минорных аллелей.

Для оценки статистической значимости ассоциаций использовали p-value, полученные для каждого маркера, а также применяли поправки на множественное тестирование (например критерий Бонферрони). Результаты визуализировали в виде Манхэттенских графиков с распределением значимых ОНП по хромосомам.

Результаты и их обсуждение . В исследовании молочной продуктивности крупного рогатого скота анализировались три ключевых показателя продуктивности: удой, содержание жира и белка в молоке. Средние показатели продуктивности для анализируемых особей приведены в таблице 1.

Кроме того, для анализа было проведено разделение на квартили по значениям удоя, жира и белка и объединение первого и четвертого квартиля для создания контрастной группы (табл. 2).

Таблица 1

Группа

Значение

Общее

x ± sd

Удой

8437 ± 1285

Жир

3,92 ± 0,12

Белок

3,24 ± 0,11

Таблица 2

Группа

Квартиль

Удой, кг

Жир, %

Белок, %

x ± sd

Удой, кг

Q1

10028 ± 680

3,93 ± 0,136

3,231 ± 0,109

Q4

6775 ± 653

3,92 ± 0,123

3,256 ± 0,103

Жир, %

Q1

8643 ± 1315

4,07 ± 0,068

3,254 ± 0,146

Q4

8582 ± 1238

3,79 ± 0,092

3,191 ± 0,078

Белок, %

Q1

8324 ± 1366

3,998 ± 0,109

3,379 ± 0,066

Q4

8619 ± 1166

3,92 ± 0,150

3,115 ± 0,045

Средние показатели молочной продуктивности и состава молока проанализированного крупного рогатого скота (n = 539)

Mean milk productivity and composition indicators in analyzed cattle

Средние показатели молочной продуктивности и состава молока по группам крупного рогатого скота (n = 135)

Mean milk productivity and composition indicators by cattle group

Данные таблицы 2 демонстрируют различия в средних значениях и вариабельности ключевых продуктивных признаков – удоя, содержания жира и белка в молоке – между группами животных, отобранных по низким и высоким квартилям каждого из этих признаков.

Для каждой из трех групп, сформированных по квартилям по удою, жиру и белку, наблюдается четкое разделение уровней этих признаков, что подтверждает адекватность квартильного разбиения для выделения подгрупп с разной продуктивностью. В то же время стандартные отклонения показывают вариацию внутри каждой подгруппы, что позволяет оценить однородность или разброс признаков среди животных с низким и высоким уровнем отбора.

В результате проведения полногеномного ассоциативного анализа (GWAS) на выборке крупного рогатого скота были построены три Манхэттенских графика, иллюстрирующих распределение значимости ОНП для трех основных показателей продуктивности: удой, содержание жира и содержание белка в молоке как для всей анализируемой популяции, так и для группы первого и четвертого квартилей (рис. 1, 2).

Сравнительный анализ GWAS, выполненный как на полной выборке животных за 2018–2024 гг., так и на экстремальной подвыборке, сформированной из крайних квартилей фенотипов, выявил высокую степень совпадения обнаруженных генетических ассоциаций. Этот факт подтверждает, что основные маркеры, связанные с продуктивными признаками, обнаруживаются независимо от выбора стратегии отбора животных, будь то полный состав популяции или ее крайние фенотипы. Подобные наблюдения согласуются с ранее опубликованными исследованиями, где анализ крайних фенотипов, известный как метод «extreme phenotype sampling», демонстрирует повышение статистической мощности при идентификации значимых генетических вариантов без потери информации, выявляемой классическим GWAS на всей выборке [12, 13].

-loglO(p-value)                                                                      -loglO(p-value)                                                                      -loglO(p-value)

Рис. 1. Манхэттенские графики распределения ОНП-ассоциаций по хромосомам для всех животных: А – удоя; Б – жира; В – белка

Manhattan plots showing the distribution of SNP associations across chromosomes for all animals: A – milk yield; Б – fat content; В – protein content

Рис. 2. Манхэттенские графики распределения ОНП-ассоциаций по хромосомам для квартилей: А – удоя; Б – жира; В – белка

Manhattan plots showing the distribution of SNP associations across chromosomes for quartiles: A – milk yield; Б – fat content; В – protein content

Единственным ОНП, описанным ранее в научной литературе, оказался ARS-BFGL-BAC-36190 – Генетический маркер на 20-й хромосоме крупного рогатого скота, который был выявлен в исследованиях GWAS как связанный с молочной продуктивностью и ростом животных. Он располагается в области, где находятся важные гены, включая GPX8, CDC20B и GZMA, которые играют роль в регуляции молочного производства и иммунных процессов у коров. Этот ОНП был описан в работе D. Lu et al. [14], где выявлена его значимая ассоциация с признаками роста и кормовой эффективности коров.

В целом в результате анализа было обнаружено двадцать значимых маркеров, локализованных на разных хромосомах; в пределах

250 Мн (мегануклиотидов) справа и слева от ОНП были определены близлежащие гены (табл. 3).

Наиболее выраженное скопление ассоциированных ОНП, выявленное на 14-й хромосоме, охватывает несколько связанных между собой генов, таких как SAMD12, TNFRSF11B, COLEC10, MTBP, MRPL13. В исследованиях SAMD12 и TNFRSF11B показаны как гены, влияющие на мясную продуктивность крупного рогатого скота [15, 16]. Гены COLEC10 и MRPL13 играют роль в метаболических процессах и формировании иммунных реакций [17, 18].

На 20-й хромосоме выделен ОНП в области, включающей гены GPX8, GZMK, GZMA, CDC20B и др., что также может свидетельствовать о комплексном генетическом влиянии на продуктивные признаки – аналогично хорошо изученным регионам у мировых пород скота [19–21].

Ряд ОНП лежат в локусах с генами, отвечающими у млекопитающих за эмбрио- и морфогенез [22, 23], липидный и энергетический обмен [24–26], структурную организацию клеток, иммунный ответ [17, 18, 27–32], тепловой стресс [33–36] и опорно-двигательную систему [23, 37–39].

Отдельно стоит отметить следующие гены: ген SLC27A6 из семейства SLC27, кодирующий белок, вовлеченный в транспорт жирных кислот, играющий критическую роль в метаболизме липидов, формировании мяса, регуляции метаболических путей в ткани молочных желез и жировой составляющей мяса и молока [40, 41]. COX7A2, DEPTOR, PLPP1 также связаны с молочной продуктивностью и кормовой эффективностью [42–44]. Белок TCN2 транспортирует витамин B 12 и ассоциирован с содержанием транс-кобаламина в молоке [45].

Таблица 3

Significant SNPs identified by GWAS and their nearest genes

ОНП

Хромосома:позиция

Ближайшие гены

1

2

3

BTB-011652481

2: 55372153

BTB-011652381

2: 55405767

BTA-91681-no-rs2

5: 2425567

BTA-94737-no-rs1

6: 2584893

TMA16; TKTL2; NPY5R; NPY1R; NAF1

BTA-20553-no-rs1

7: 26286219

FBN2; ISOC1; ADAMTS19; SLC27A6

ARS-BFGL-NGS-1166901

9: 15110882

COX7A2; COL12A1; TMEM30A; FILIP1; SENP6

BTB-005677141

14: 47542510

MAL2; SAMD12; TNFRSF11B; COLEC10

ARS-BFGL-NGS-296221

14: 47615069

UA-IFASA-91401

14: 47652361

ARS-BFGL-NGS-154241

14: 81878266

ARS-BFGL-NGS-266621

14: 84275325

DEPTOR; MTBP; MRPL13

ARS-BFGL-NGS-207611

17: 69459128

PITPNB

ARS-BFGL-NGS-540341

17: 70962192

GAS2L1; RHBDD3; EWSR1; EMID1; AP1B1;

RASL10A; TCN2; CCDC157; OSM; GAL3ST1;

DUSP18; MTFP1; NIPSNAP1; TBC1D10A;

SF3A1; CASTOR1; ZMAT5; SEC14L3; LIF;

MTMR3; OSBP2; SEC14L4; SEC14L2;

ASCC2; C17H5orf52; UQCR10; SLC35E4;

THOC5; PES1; HORMAD2

ARS-BFGL-BAC-356231

17: 71352459

ARS-BFGL-NGS-417451

18: 43614762

GPATCH1; FAAP24; RGS9BP; NUDT19;

CEBPG; SLC7A9; ANKRD27; CEBPA;

RHPN2; PDCD5; SLC7A10; PEPD

ARS-BFGL-BAC-361902

20: 24179723

PLPP1; GPX8; MIR449B; GZMK; DHX29;

GZMA; SNX18; MTREX; gzmA; ESM1;

COX8A; HSPB3; CDC20B

Окончание табл. 3

1

2

3

BTA-52945-no-rs1

21: 7369556

TTC23; SYNM; LRRC28; MEF2A; LYSMD4

BovineHD21000165521

21: 57602687

GOLGA5; TC2N; CPSF2; SLC24A4; NDUFB1;

ATXN3; FBLN5; LGMN

Hapmap51532-BTA-1012061

24: 49547605

ACAA2; DYM; RPL17; SMAD7; C24H18orf32

BTA-61940-no-rs1

26: 918433

IPMK; CISD1; UBE2D1

1ОНП, ассоциированные с массовой долей белка (P).

2ОНП, ассоциированные с массовой долей жира (FC).