GWAS-анализ голштинского крупного рогатого скота Свердловской области с использованием полной и экстремальной выборок
Автор: Богатова П.С., Лиходеевская О.Е., Лоретц О.Г., Лиходеевский Г.А., Минина О.А., Евсеева Т.П.
Журнал: Вестник Красноярского государственного аграрного университета @vestnik-kgau
Рубрика: Зоотехния и ветеринария
Статья в выпуске: 3, 2026 года.
Бесплатный доступ
Цель исследования - выявление генетических маркеров, ассоциированных с показателями молочной продуктивности (удоем, содержанием жира и белка в молоке) у голштинского крупного рогатого скота, с использованием метода полногеномного ассоциативного анализа (GWAS) на выборке животных из племенных хозяйств Свердловской области за 2018-2024 гг. Задачи: провести генотипирование выборки коров с использованием ДНК-биочипов и осуществить контроль качества данных; выполнить GWAS-анализ молочной продуктивности на полной популяции и на экстремальных фенотипических группах; идентифицировать статистически значимые однонуклеотидные полиморфизмы (ОНП), связанные с удоем, содержанием жира и белка; проанализировать гены, расположенные вблизи значимых ОНП, для понимания их роли в метаболизме липидов, иммунном ответе и развитии ткани молочной железы; оценить совпадение генетических ассоциаций между полной выборкой и экстремальными группами для подтверждения надежности маркеров. GWAS-анализ молочной продуктивности проведен на 539 голштинских коровах из 3 племенных хозяйств Свердловской области (2018-2024 гг.). Анализ удоя, жира и белка выполнен на полной выборке и экстремальных квартилях Q1/Q4 (удой: (10028 ± 680) и (6775 ± 653) кг; жир: (4,07 ± 0,068) и (3,79 ± 0,092) %; белок: (3,38 ± 0,066) и (3,12 ± 0,045) %). Всего идентифицировано 20 значимых ОНП, ассоциированных с показателями продуктивности крупного рогатого скота. Вблизи некоторых полиморфизмов расположены гены, ответственные за метаболизм жирных кислот и липидов (SLC27A6), а также связанные с молочной продуктивностью и иммунным ответом (GPX8, CDC20B и GZMA). Выявленные ОНП и локусы могут выступать в качестве кандидатных маркеров для геномной селекции голштинского скота. Совпадение GWAS-результатов на полной выборке и экстремальных квартилях Q1/Q4 подтверждает надежность выявленных ассоциаций и эффективность использования метода экстремальных выборок.
Молочная продуктивность, онп, геномная селекция, крупный рогатый скот, голштинская порода
Короткий адрес: https://sciup.org/140314942
IDR: 140314942 | УДК: 636.234.1+636.082 | DOI: 10.36718/1819-4036-2026-3-130-142
GWAS analysis of Holstein cattle in the Sverdlovsk region using full and extreme samples
The aim of the study is to identify genetic markers associated with dairy productivity parameters (milk yield, milk fat and protein content) in Holstein cattle using the genome-wide association analysis (GWAS) method on a sample of animals from breeding farms in the Sverdlovsk Region for 2018-2024.
Текст научной статьи GWAS-анализ голштинского крупного рогатого скота Свердловской области с использованием полной и экстремальной выборок
Введение. Интенсивная селекция по признакам молочной продуктивности, усиленная улучшенным кормлением и управлением, а также ускоренная за счет развития репродуктивных технологий и геномной селекции [1], значительно увеличила производство молока за последние годы [2]. Голштинская порода на сегодняшний день доминирует в мировом молочном животноводстве. На многих рынках, включая США, Бразилию, Японию и Европу [3], а также в России [4, 5] основная часть молочной продукции производится именно коровами голштинской породы, которые демонстрируют высокие удои.
В современных условиях для более эффективной селекции необходимы углубленные знания о генетической структуре и взаимодействии генов, влияющих на ключевые экономические признаки, что позволит точно определить вклад каждого гена и оптимизировать селекционные стратегии для улучшения молочной продуктивности, особенно учитывая, что большинство из них являются комплексными и зависят от многих генов и факторов среды.
В этой связи метод GWAS (Genome-Wide Association Study) становится важным инструментом в молочном скотоводстве для выявления генов и генетических маркеров, влияющих на ключевые хозяйственно важные признаки, такие как молочная продуктивность (удой, содержание жира и белка) [6–8], здоровье животных (устойчивость к маститу, инфекционным и метаболическим заболеваниям) [9], фертильность, а также экстерьерные характеристики коров. Благодаря GWAS ученые могут локализовать количественные локусы признаков (QTL) и идентифицировать кандидатные гены, которые оказывают влияние на эти признаки [10].
Полученные с помощью GWAS данные используются для разработки и внедрения систем геномной оценки племенной ценности, что позволяет повысить точность прогнозирования генетического потенциала животных и ускорить генетический прогресс. Применение геномной селекции помогает проводить отбор по ранее недостаточно оцененным или поздно проявляющимся признакам, таким как здоровье и воспроизводственная способность.
Цель исследования – выявление генетических маркеров, ассоциированных с показателями молочной продуктивности (удоем, содержанием жира и белка в молоке) у голштинского крупного рогатого скота, с использованием метода полногеномного ассоциативного анализа (GWAS) на выборке животных из племенных хозяйств Свердловской области за 2018–2024 гг.
Задачи: провести генотипирование выборки коров с использованием ДНК-биочипов и осуществить контроль качества данных; выполнить GWAS-анализ молочной продуктивности на полной популяции и экстремальных фенотипических группах; идентифицировать статистически значимые однонуклеотидные полиморфизмы (ОНП), связанные с удоем, содержанием жира и белка; проанализировать гены, расположенные вблизи значимых онп, для понимания их роли в метаболизме липидов, иммунном ответе и развитии ткани молочной железы; оценить совпадение генетических ассоциаций между полной выборкой и экстремальными группами для подтверждения надежности маркеров.
Объекты и методы. Исследование проводилось на базе трех племенных хозяйств Свердловской области, специализирующихся на разведении молочного скота. Всего в группу исследования было отобрано 539 полновозрастных коров 2018–2024 гг. рождения.
Для геномного анализа у коров отбирали кровь из подхвостовой вены, используя пробирки с ЭДТА (для стабилизации образцов). Далее образцы были отправлены в сторонние лаборатории для выделения ДНК и генотипирования.
Часть крови поступила в ЦКП «Биоресурсы и биоинженерия сельскохозяйственных животных» (ФГБНУ ФИЦ ВИЖ им. Л.К. Эрнста), где проводилось генотипирование на ДНК-биочипах GGP Bovine 150K (Neogen, США).
Остальные образцы были направлены в Центр геномной селекции ООО «Мираторг», где использовались Bovine 50K ДНК-биочипы (Illumina, США).
Первичную фильтрацию по GeneScore > 0,35 проводили в программном обеспечении R Foundation for Statistical Computing. Последующие фильтрации по отсутствующим данным генотипов проводили с помощью PLINK v1.9 (Purcell S. и др., 2007) и опций – geno 0,05 – mind 0,05, – maf 0,01.
В первом варианте GWAS-анализа использовали всю доступную популяцию животных за 2018–2024 гг, прошедшую контроль качества по генотипам и фенотипам. Для трех признаков продуктивности (удой, содержание жира, содержание белка в молоке за первую лактацию с поправкой на 305 дней) на полной выборке животных были проведены ассоциативные исследования с помощью линейной регрессии в PLINK – без разделения животных по уровням признаков или выделения экстремальных групп.
Кроме того, был проведен второй вариант полногеномного ассоциативного анализа на основе экстремальной выборки фенотипов [11]. Исходная выборка животных была разделена по каждому признаку – удою молока, содержанию жира и белка – на четыре квартиля, в соответствии с их значениями фенотипов. Разделение выполняли с использованием функции qcut() библиотеки pandas языка Python, которая обеспечивает равное распределение наблюдений по квартилям. Для каждого признака были сформированы две группы, объединяющие животных из крайних квартилей: Q1 (высокие значения признака) и Q4 (низкие значения признака). В дальнейшем были созданы выборки Q1 + Q4 по удою, Q1 + Q4 по содержанию жира в молоке и Q1 + Q4 по содержанию белка в молоке, которые использовались для проведения GWAS-анализа. Для каждой группы дополнительно вычислялись средние значения и стандартные отклонения основных показателей продуктивности (удой, массовая доля жира и белка) и количество включенных животных. В результате для анализа были использованы 3 группы по 270 животных в каждой.
Для выявления ассоциаций между однонуклеотидными полиморфизмами (ОНП) и количественными признаками был проведен полногеномный ассоциативный анализ с использованием программного пакета PLINK версии 1.9.
Анализ ассоциаций осуществлялся методом линейной регрессии, реализованным в PLINK (–linear), при котором для каждой ОНП-позиции тестировалась зависимость значения признака от количества минорных аллелей.
Для оценки статистической значимости ассоциаций использовали p-value, полученные для каждого маркера, а также применяли поправки на множественное тестирование (например критерий Бонферрони). Результаты визуализировали в виде Манхэттенских графиков с распределением значимых ОНП по хромосомам.
Результаты и их обсуждение . В исследовании молочной продуктивности крупного рогатого скота анализировались три ключевых показателя продуктивности: удой, содержание жира и белка в молоке. Средние показатели продуктивности для анализируемых особей приведены в таблице 1.
Кроме того, для анализа было проведено разделение на квартили по значениям удоя, жира и белка и объединение первого и четвертого квартиля для создания контрастной группы (табл. 2).
Таблица 1
|
Группа |
Значение |
|
Общее |
x ± sd |
|
Удой |
8437 ± 1285 |
|
Жир |
3,92 ± 0,12 |
|
Белок |
3,24 ± 0,11 |
Таблица 2
|
Группа |
Квартиль |
Удой, кг |
Жир, % |
Белок, % |
|
x ± sd |
||||
|
Удой, кг |
Q1 |
10028 ± 680 |
3,93 ± 0,136 |
3,231 ± 0,109 |
|
Q4 |
6775 ± 653 |
3,92 ± 0,123 |
3,256 ± 0,103 |
|
|
Жир, % |
Q1 |
8643 ± 1315 |
4,07 ± 0,068 |
3,254 ± 0,146 |
|
Q4 |
8582 ± 1238 |
3,79 ± 0,092 |
3,191 ± 0,078 |
|
|
Белок, % |
Q1 |
8324 ± 1366 |
3,998 ± 0,109 |
3,379 ± 0,066 |
|
Q4 |
8619 ± 1166 |
3,92 ± 0,150 |
3,115 ± 0,045 |
Средние показатели молочной продуктивности и состава молока проанализированного крупного рогатого скота (n = 539)
Mean milk productivity and composition indicators in analyzed cattle
Средние показатели молочной продуктивности и состава молока по группам крупного рогатого скота (n = 135)
Mean milk productivity and composition indicators by cattle group
Данные таблицы 2 демонстрируют различия в средних значениях и вариабельности ключевых продуктивных признаков – удоя, содержания жира и белка в молоке – между группами животных, отобранных по низким и высоким квартилям каждого из этих признаков.
Для каждой из трех групп, сформированных по квартилям по удою, жиру и белку, наблюдается четкое разделение уровней этих признаков, что подтверждает адекватность квартильного разбиения для выделения подгрупп с разной продуктивностью. В то же время стандартные отклонения показывают вариацию внутри каждой подгруппы, что позволяет оценить однородность или разброс признаков среди животных с низким и высоким уровнем отбора.
В результате проведения полногеномного ассоциативного анализа (GWAS) на выборке крупного рогатого скота были построены три Манхэттенских графика, иллюстрирующих распределение значимости ОНП для трех основных показателей продуктивности: удой, содержание жира и содержание белка в молоке как для всей анализируемой популяции, так и для группы первого и четвертого квартилей (рис. 1, 2).
Сравнительный анализ GWAS, выполненный как на полной выборке животных за 2018–2024 гг., так и на экстремальной подвыборке, сформированной из крайних квартилей фенотипов, выявил высокую степень совпадения обнаруженных генетических ассоциаций. Этот факт подтверждает, что основные маркеры, связанные с продуктивными признаками, обнаруживаются независимо от выбора стратегии отбора животных, будь то полный состав популяции или ее крайние фенотипы. Подобные наблюдения согласуются с ранее опубликованными исследованиями, где анализ крайних фенотипов, известный как метод «extreme phenotype sampling», демонстрирует повышение статистической мощности при идентификации значимых генетических вариантов без потери информации, выявляемой классическим GWAS на всей выборке [12, 13].
-loglO(p-value) -loglO(p-value) -loglO(p-value)
Рис. 1. Манхэттенские графики распределения ОНП-ассоциаций по хромосомам для всех животных: А – удоя; Б – жира; В – белка
Manhattan plots showing the distribution of SNP associations across chromosomes for all animals: A – milk yield; Б – fat content; В – protein content
Рис. 2. Манхэттенские графики распределения ОНП-ассоциаций по хромосомам для квартилей: А – удоя; Б – жира; В – белка
Manhattan plots showing the distribution of SNP associations across chromosomes for quartiles: A – milk yield; Б – fat content; В – protein content
Единственным ОНП, описанным ранее в научной литературе, оказался ARS-BFGL-BAC-36190 – Генетический маркер на 20-й хромосоме крупного рогатого скота, который был выявлен в исследованиях GWAS как связанный с молочной продуктивностью и ростом животных. Он располагается в области, где находятся важные гены, включая GPX8, CDC20B и GZMA, которые играют роль в регуляции молочного производства и иммунных процессов у коров. Этот ОНП был описан в работе D. Lu et al. [14], где выявлена его значимая ассоциация с признаками роста и кормовой эффективности коров.
В целом в результате анализа было обнаружено двадцать значимых маркеров, локализованных на разных хромосомах; в пределах
250 Мн (мегануклиотидов) справа и слева от ОНП были определены близлежащие гены (табл. 3).
Наиболее выраженное скопление ассоциированных ОНП, выявленное на 14-й хромосоме, охватывает несколько связанных между собой генов, таких как SAMD12, TNFRSF11B, COLEC10, MTBP, MRPL13. В исследованиях SAMD12 и TNFRSF11B показаны как гены, влияющие на мясную продуктивность крупного рогатого скота [15, 16]. Гены COLEC10 и MRPL13 играют роль в метаболических процессах и формировании иммунных реакций [17, 18].
На 20-й хромосоме выделен ОНП в области, включающей гены GPX8, GZMK, GZMA, CDC20B и др., что также может свидетельствовать о комплексном генетическом влиянии на продуктивные признаки – аналогично хорошо изученным регионам у мировых пород скота [19–21].
Ряд ОНП лежат в локусах с генами, отвечающими у млекопитающих за эмбрио- и морфогенез [22, 23], липидный и энергетический обмен [24–26], структурную организацию клеток, иммунный ответ [17, 18, 27–32], тепловой стресс [33–36] и опорно-двигательную систему [23, 37–39].
Отдельно стоит отметить следующие гены: ген SLC27A6 из семейства SLC27, кодирующий белок, вовлеченный в транспорт жирных кислот, играющий критическую роль в метаболизме липидов, формировании мяса, регуляции метаболических путей в ткани молочных желез и жировой составляющей мяса и молока [40, 41]. COX7A2, DEPTOR, PLPP1 также связаны с молочной продуктивностью и кормовой эффективностью [42–44]. Белок TCN2 транспортирует витамин B 12 и ассоциирован с содержанием транс-кобаламина в молоке [45].
Таблица 3
Significant SNPs identified by GWAS and their nearest genes
|
ОНП |
Хромосома:позиция |
Ближайшие гены |
|
1 |
2 |
3 |
|
BTB-011652481 |
2: 55372153 |
|
|
BTB-011652381 |
2: 55405767 |
|
|
BTA-91681-no-rs2 |
5: 2425567 |
|
|
BTA-94737-no-rs1 |
6: 2584893 |
TMA16; TKTL2; NPY5R; NPY1R; NAF1 |
|
BTA-20553-no-rs1 |
7: 26286219 |
FBN2; ISOC1; ADAMTS19; SLC27A6 |
|
ARS-BFGL-NGS-1166901 |
9: 15110882 |
COX7A2; COL12A1; TMEM30A; FILIP1; SENP6 |
|
BTB-005677141 |
14: 47542510 |
MAL2; SAMD12; TNFRSF11B; COLEC10 |
|
ARS-BFGL-NGS-296221 |
14: 47615069 |
|
|
UA-IFASA-91401 |
14: 47652361 |
|
|
ARS-BFGL-NGS-154241 |
14: 81878266 |
|
|
ARS-BFGL-NGS-266621 |
14: 84275325 |
DEPTOR; MTBP; MRPL13 |
|
ARS-BFGL-NGS-207611 |
17: 69459128 |
PITPNB |
|
ARS-BFGL-NGS-540341 |
17: 70962192 |
GAS2L1; RHBDD3; EWSR1; EMID1; AP1B1; RASL10A; TCN2; CCDC157; OSM; GAL3ST1; DUSP18; MTFP1; NIPSNAP1; TBC1D10A; SF3A1; CASTOR1; ZMAT5; SEC14L3; LIF; MTMR3; OSBP2; SEC14L4; SEC14L2; ASCC2; C17H5orf52; UQCR10; SLC35E4; THOC5; PES1; HORMAD2 |
|
ARS-BFGL-BAC-356231 |
17: 71352459 |
|
|
ARS-BFGL-NGS-417451 |
18: 43614762 |
GPATCH1; FAAP24; RGS9BP; NUDT19; CEBPG; SLC7A9; ANKRD27; CEBPA; RHPN2; PDCD5; SLC7A10; PEPD |
|
ARS-BFGL-BAC-361902 |
20: 24179723 |
PLPP1; GPX8; MIR449B; GZMK; DHX29; GZMA; SNX18; MTREX; gzmA; ESM1; COX8A; HSPB3; CDC20B |
Окончание табл. 3
|
1 |
2 |
3 |
|
BTA-52945-no-rs1 |
21: 7369556 |
TTC23; SYNM; LRRC28; MEF2A; LYSMD4 |
|
BovineHD21000165521 |
21: 57602687 |
GOLGA5; TC2N; CPSF2; SLC24A4; NDUFB1; ATXN3; FBLN5; LGMN |
|
Hapmap51532-BTA-1012061 |
24: 49547605 |
ACAA2; DYM; RPL17; SMAD7; C24H18orf32 |
|
BTA-61940-no-rs1 |
26: 918433 |
IPMK; CISD1; UBE2D1 |
1ОНП, ассоциированные с массовой долей белка (P).
2ОНП, ассоциированные с массовой долей жира (FC).