Использование методов многомерной статистики для оптимизации селекционного подбора быков-производителей

Автор: Мурленков Н.В., Шендаков А.И., Крюков В.И.

Журнал: Биология в сельском хозяйстве @biology-in-agriculture

Рубрика: Актуальные вопросы зоотехнии и ветеринарии

Статья в выпуске: 4 (49), 2025 года.

Бесплатный доступ

В статье представлена методика кластерной типизации голштинских быков-производителей на основе комплекса племенных признаков, включающих показатели продуктивности, здоровья, экстерьера, фертильности и адаптивности. Целью работы являлась идентификация устойчивых селекционных типов животных с использованием алгоритма K-средних и последующего анализа методом главных компонент (PCA). В исследование включен 2141 бык австрийского происхождения, данные по которым были стандартизированы и обработаны с применением двадцати селекционных индексов. В результате выделено четыре устойчивых кластера, различающихся по совокупности генетических признаков. Дисперсионный анализ (ANOVA) подтвердил статистическую значимость различий между кластерами (p<0,001) по большинству показателей, включая общий индекс племенной ценности (RZG), продуктивность (RZM), здоровье (RZОko) и фертильность (RZN). Визуализация методом PCA позволила подтвердить биологическую обоснованность и устойчивость кластеров. Полученные результаты свидетельствуют о высокой гетерогенности импортной популяции голштинов и позволяют использовать выявленные типы в качестве основы для построения национальной системы типизации быков-производителей, направленной на повышение эффективности селекционного процесса и адаптацию зарубежного генофонда к отечественным условиям.

Еще

Кластерный анализ, быкипроизводители, селекция, голштинская порода, племенная ценность, PCA, ANOVA, индексы продуктивности, типизация

Короткий адрес: https://sciup.org/147252730

IDR: 147252730   |   УДК: 636.2.082.2:519.23

Текст научной статьи Использование методов многомерной статистики для оптимизации селекционного подбора быков-производителей

алгоритмами кластеризации являются K-средние, иерархическая кластеризация и алгоритмы на основе DBSCAN (Density-Based Spatial Clustering of Applications with Noise) – плотностноориентированной пространственной кластеризации с выделением шума (Ester M. и др., 1996 ) [6]. Каждый из этих методов имеет свои преимущества и ограничения, что определяет выбор подходящего алгоритма в зависимости от специфики исследуемой задачи.

В условиях скотоводства кластерный анализ находит множество практических применений, способствуя оптимизации процессов управления и повышения эффективности производства. Одним из основных направлений является селекция и разведение животных. Например, с помощью кластерного анали-

I 18   1

за можно выделить группы животных с аналогичными производственными показателями, такими как среднесуточный прирост, динамика роста или устойчивость к заболеваниям. Это позволяет более точно подбирать пары для разведения, что способствует улучшению генетического потенциала стада.

Кроме того, кластерный анализ может использоваться для выявления паттернов в кормлении и условиях содержания животных. Группируя животных по метрикам, связанным с условиями содержания (влажность, температура, количество доступа к воде и пищи), исследователи/заводчики могут оптимизировать эти параметры и, как следствие, улучшить здоровье и продуктивность скота.

Актуальность применения кластерного анализа в современных условиях объясняется целым рядом факторов. Во-первых, в эпоху массивных данных, когда скотоводческие предприятия получают огромное количество информации, способность эффективно обрабатывать и анализировать эти данные становится необходимостью. Кластерный анализ позволяет выявить закономерности и сформулировать рекомендации на основании объективных данных, что крайне важно для принятия обоснованных решений. Во-вторых, с учетом изменений в эколого-экономической ситуации в мире, скотоводство сталкивается с новыми вызовами. Кластерный анализ может помочь в адаптации к этим изменениям, позволяя селекционерам и производителям идентифицировать наиболее адаптированные к новой среде группы скота и разрабатывать стратегии их управления. В-третьих, современное скотоводство требует все более индивидуализированного подхода к животным. Кластерный анализ позволяет не только сегментировать стадо, но и разрабатывать персонализированные схемы кормления и условий содержания для различных групп животных.

В своих исследованиях Федотова Г.В. (2024) подтверждает [5], что кластерная модель является эффективным инструментом для анализа и развития российского животноводства. Автор выделяет ключевые аспекты, такие как возможность сегментации хозяйств по различным критериям, включая производственные мощности, технологии и финансовые результаты. Это позволяет выявлять сильные и слабые стороны отдельных предприятий, а также формировать стратегические направления для их развития.

Исследование Козиной А.М. и соавторов (2016) дополняет данное направление [2], показывая, что многомерный анализ может увеличить эффективность управления отраслью молочного скотоводства. Авторы представляют методологию оценки, которая включает в себя оценку множества факторов, влияющих на производительность. Результаты показывают, что использование многомерного анализа позволяет выделить наиболее продуктивные группы животных и адаптировать условия их содержания и кормления.

Абдурахимов А.А. (2018) также акцентирует внимание на важности кластерного метода для оценки эффективности молочного скотоводства [1]. В своих исследованиях он разрабатывает методические основы, позволяющие оценивать производительность и экономическую эффективность различных сегментов отрасли. В результате его анализа было установлено, что кластерный подход позволяет комплексно учитывать влияние различных факторов на продуктивность, что в свою очередь повышает общий уровень управления в сфере животноводства.

Авторский коллектив Ефимова И.А. и коллег (2018) рассматривает математическое обеспечение построения селекционных индексов и его связь с кластерным анализом [3]. Они подчеркивают, что применение селекционных индексов, основанных на кластерной оценке, может существенно повысить эффективность селекции, позволяя более точно определять генетически ценные группы животных и оптимизировать процесс отбора.

Таким образом, результаты, представленные авторами, подтверждают, что кластерный анализ в скотоводстве служит мощным инструментом для повышения эффективности управления, селекции и оценки производительности как отдельных животных, так и целых хозяйств, что делает его незаменимым в современных условиях агропромышленного производства.

В целом, кластерный анализ представляет важный инструмент в скотоводстве, способствующий оптимизации многих процессов, включая селекцию, кормление и содержание животных. В условиях современного агропромышленного комплекса, насыщенного данными, применение данного анализа становится не только актуальным, но и необходимым для достижения высокой эффективности и устойчивости скотоводческих предприятий.

В данной статье кластерный анализ был проведён с целью типологизации быков голштинской породы по комплексу племенных признаков, характеризующих продуктивность, здоровье, экстерьер, фертильность и адаптивные особенности. Такой подход позволяет перейти от индивидуальных точечных характеристик к выявлению устойчивых профилей, что особенно важно при отсутствии единой национальной базы и в условиях необходимости адаптации селекционных решений к российской практике. В то же время подобная группировка открывает возможность обоснованного выбора быков в зависимости от задач разведения - будь то повышение молочной продуктивности, улучшение здоровья стада или усиление экстерьерных показателей.

Материалы и методы исследований. Для эксперимента использовались первичные данные племенных индексов голштинских быков-производителей австрийского происхождения (n=2141), представленные в открытом доступе на ресурсе Zuchtwert Austria.

Анализ был осуществлен методом кластеризации K-средних ( K-Means ) с использованием двадцати племенных параметров, охватывающих наиболее значимые направления генетической оценки. Перед проведением кластеризации данные были стандартизированы методом Z-преобразования, что позволило исключить влияние разнородных шкал измерения и обеспечить сопоставимость признаков между собой. В выборку включались только те быки, у которых имелись полные данные по всем признакам.

Таблица 1 – Кластерная оценка быков-производителей по племенным индексам

н о 03

о

О

Я

К

Ж Я я

ю к

Q К

К

RZG

о

я

к

RZM

Я

о н

о

о

к к

RZE

s £

RZОko

о о

RZN

н я я

н

S § Л

о

RZR

Й

НЧ ни

Й 3 О о

RZS

О Я

S g

н к

1 ^

DDC

03 я

н

о

я к

03

о о

к

RZKM

н

о

н

К

PER

0

137,7

128,0

115,5

127,6

117,7

108,4

113,0

107,8

107,9

107,4

1

65,3

78,1

79,1

74,3

80,1

91,2

87,0

93,8

91,7

93,9

2

114,9

113,0

110,4

109,0

106,2

100,0

105,5

101,0

103,0

105,0

3

89,2

91,9

96,4

91,4

94,0

97,7

95,9

97,0

96,4

97,2

а о н о я £

К

а g О О я

к

Й

§ о

и ч

ю

О

к

Я Я О

Я

S

Я R о

Н

Я

Я

Й U и Й

Й

к « и

Й 2

о X

S

Я ® X

Я о Я о п ю я щ о 3 s к

ж

и

о о

я 2

Й §

к

5 я

я н

BCS

GES

KON

MAS

KLW

SPV

SPH

VA

EB

ETI

0

97,5

115,6

108,0

107,7

103,4

101,2

100,6

111,0

107,9

110,0

1

103,5

82,9

90,9

91,1

98,0

89,3

94,1

85,3

89,3

80,8

2

94,8

104,1

100,1

102,1

101,2

110,2

109,3

109,0

105,6

109,9

3

100,8

95,0

97,6

97,5

100,1

100,2

102,6

97,8

98,2

97,6

Результаты исследований и их анализ. По результатам кластеризации были выделены четыре устойчивых группы. Каждая из них характеризуется собственной конфигурацией признаков, что позволяет рассматривать их как определенные селекционные типы. Так, один из кластеров объединяет животных с выраженными продуктивными характеристиками (RZM и PER), другой – с доминированием показателей здоровья и устойчивости (GES, DDC и RZОko), третий демонстрирует баланс продуктивности и экстерьера, а четвертый может быть охарактеризован как экстерьерно ориентированный, с выраженными морфологическими особенностями.

Сводная таблица 1, включающая средние значения племенных признаков по каждому кластеру, позволяет наглядно сравнить профили выделенных групп и использовать эти данные при разработке селекционной стратегии. На ее основе возможно целенаправленно подбирать быков, соответствующих конкретным хозяйственным задачам и технологическим условиям.

Проведенный кластерный анализ позволил структурировать генетическое разнообразие импортных быков и выделить основные векторы селекционного потенциала. Это создало базу для последующего сопоставительного анализа между группами, а также для разработки индивидуализированных индексов пригодности в зависимости от региональных и производственных особенностей. Учитывая ограниченность открытых российских данных, подобная типология может быть использована как ориентир при формировании отечественной селекционной базы в условиях интеграции с международными системами оценки.

После выполнения кластерного анализа следующим этапом исследования стало применение метода главных компонент ( PCA ) с целью понижения размерности данных и визуализации пространственного распределения выделенных кластеров. Данный подход позволяет представить многомерное признаковое пространство в виде двух главных осей [4], каждая из которых объясняет наибольшую долю вариативности в массиве данных (Смарагдов М.Г., 2019). В условиях, когда каждый бык характеризуется десятками племенных признаков, подобная трансформация обеспечивает удобный способ интерпретации данных и упрощает выявление закономерностей.

Построенная карта распределения быков в координатах двух главных компонент наглядно демонстрирует устойчивость выделенных кластеров. На графике отчетливо визуализированы четыре компактных группы животных, между которыми сохраняется пространственное разделение, что подтверждает валидность предыдущей кластеризации. Отсутствие значительных перекрытий между группами свидетельствует о том, что выделенные типы быков имеют объективную биологическую основу, выражающуюся в различиях по совокупности ключевых селекционных признаков.

I 20   1

Рис. 1 - Метод главных компонент для оценки кластеров быков-производителей

В дополнение к визуализации самих животных на график были нанесены центры каждого кластера, вычисленные на основе трансформированных координат центров масс в исходном признаковом пространстве. Эти центры отображены в виде маркировок «X» и отражают усредненную племенную структуру соответствующей группы. Такая доработка позволяет не только понимать внутреннюю организацию каждого кластера, но и использовать полученные координаты в качестве эталонных точек при прогнозной классификации новых животных. Например, при появлении быка с неизвестной кластерной принадлежностью можно оценить его координаты по PCA и определить, к какому типу он ближе всего - по эвклидову расстоянию до центров.

Важно подчеркнуть, что каждая из главных компонент является линейной комбинацией исходных признаков. Хотя сами компоненты не имеют прямой биологической интерпретации, анализ вкладов переменных в формирование осей ( loadings ) позволяет в дальнейшем установить, какие племенные признаки обусловливают разделение животных на кластеры -например, продуктивность, здоровье, экстерьер и т.д. Это станет предметом последующего анализа.

Таким образом, комбинация кластерного анализа с PCA и визуализацией центров кластеров дает целостное представление о структуре генофонда представленных быков и позволяет на следующем этапе переходить к формализованному сравнительному анализу между группами по каждому из племенных показателей.

После визуальной и пространственной фиксации различий между кластерами методом главных компонент следующим этапом стала количественная проверка статистической обоснованности этих различий. Для этого был применен классический дисперсион- ный анализ (ANOVA), позволяющий установить, насколько значимо отличаются значения того или иного племенного признака между группами, сформированными в процессе кластеризации (табл. 2).

В рамках анализа рассматривалось 20 селекционно значимых признаков, охватывающих продуктивность, здоровье, экстерьерные характеристики, фертильность, телосложение и адаптивные качества быков. Для каждого признака было рассчитано среднее значение ( x ) по всем четырем кластерам ( КО , К1 , К2 , КЗ ), после чего определялись значения F -критерия и соответствующего уровня значимости ( р -значения). Результаты представлены в форме расширенной таблицы 2, где наглядно видно, как каждый признак варьирует между группами.

Наибольшие различия между кластерами были выявлены по следующим параметрам (выделены синим цветом в таблице):

  • -    Общий  племенной индекс  (RZG): F =

    6212,76, р <0,0001;

  • -    Индекс здоровья (RZOko): F = 5786,94,

    р <0,0001;

  • -    Индекс фертильности (RZN): F = 3459,43, р <0,0001;

  • -    Индекс продуктивности (RZM): F = 2064,67, р <0,0001;

  • -    Индекс экстерьера (RZE): F =  1933,72,

    р <0,0001.

Высокие значения F -критерия и крайне низкие значения р -уровня (вплоть до нуля) свидетельствуют о наличии выраженных и устойчивых различий между кластерами по указанным признакам. Это подтверждает, что формирование групп не было случайным, а основано на глубинных различиях в племенной структуре.

Таблица 2 – Дисперсионный анализ

Признак

К0

К1

К2

К3

F

p <

Общий племенной индекс RZG

137,7

65,3

114,9

89,2

6212,76

0,0001

Индекс продуктивности RZM

128,0

78,1

113,0

91,9

2064,67

0,0001

Индекс экстерьера RZE

115,5

79,1

110,4

96,4

1933,72

0,0001

Индекс здоровья RZОko

127,6

74,3

109,0

91,4

5786,94

0,0001

Индекс фертильности RZN

117,7

80,1

106,2

94,0

3459,43

0,0001

Индекс сохранности телят RZR

108,4

91,2

100,0

97,7

621,82

0,05

Индекс соматических клеток RZS

113,0

87,0

105,5

95,9

1299,84

0,001

Генетическая устойчивость к дерматиту DDC

107,8

93,8

101,0

97,0

566,9

0,05

Индекс легкости отела по матери RZKM

107,9

91,7

103,0

96,4

714,85

0,05

Производительность PER

107,4

93,9

105,0

97,2

483,42

0,05

Оценка упитанности BCS

97,5

103,5

94,8

100,8

72,1

0,05

Общая оценка здоровья GES

115,6

82,9

104,1

95,0

4485,53

0,001

Конечности KON

108,0

90,9

100,1

97,6

606,86

0,05

Масса тела MAS

107,7

91,1

102,1

97,5

1772,44

0,01

Длина тела KLW

103,4

98,0

101,2

100,1

56,26

0,05

Способность к пастьбе SPV

101,2

89,3

110,2

100,2

416,62

0,01

Способность к хождению SPH

100,6

94,1

109,3

102,6

215,6

0,05

Общий жизненный индекс VA

111,0

85,3

109,0

97,8

1470,16

0,05

Энергетический баланс EB

107,9

89,3

105,6

98,2

400,93

0,05

Индекс телосложения ETI

110,0

80,8

109,9

97,6

1432,64

0,05

Так, например, по признаку RZG (общий индекс племенной ценности) наблюдается четкое разделение: кластеры 0 и 2 демонстрируют наибольшие значения, в то время как кластер 1 характеризуется выраженно заниженным уровнем, что может быть интерпретировано как тип с пониженной комплексной селекционной ценностью. Аналогичная тенденция наблюдается по индексам продуктивности (RZM) и здоровья (RZОko), что позволяет классифицировать кластеры не только как формальные группы, но и как биологически различающиеся типы быков.

Особый интерес представляет то, что различия наблюдаются не только по экстремальным значениям, но и по умеренным – например, показатели телосложения, массы, пастбищных качеств. Это говорит о многомерной природе кластерной структуры, где каждый тип обладает не просто «лучшим» или «худшим» показателем, а определенной уникальной конфигурацией, отражающей комплексное направление селекции.

Важно подчеркнуть, что статистически значимые различия наблюдаются практически по всем признакам, что дополнительно подтверждает качество и устойчивость ранее проведенной кластеризации. Это позволяет сделать вывод о том, что группы сформированы не на основе единичных экстремумов, а отражают устойчивые биотипы, различающиеся по множеству ключевых показателей.

Выводы . Проведенный комплексный анализ – включающий кластеризацию, пространственное моделирование методом главных компонент (PCA) и дисперсионную оценку различий между группами – позволил выявить в рамках импортной популяции быков голштинской породы четыре отчетливо выраженных селекционных типа. Эти типы различаются как по визуальной, так и по статистической оценке, что свидетельствует о высокой степени гетерогенности генофонда. Результаты анализа не только подтвердили наличие внутренних структурных различий, но и обеспечили инструментальную базу для последующего применения: от подбора быков под конкретные цели (молочность, здоровье, телосложение) до разработки собственных индексов или интеграции в региональные программы. Сформированная типология может использоваться как ориентир при построении национальной селекционной платформы, особенно в условиях отсутствия единой базы или при необходимости адаптации зарубежного материала к отечественным условиям.

Таким образом, данный этап работы не только дал развернутую характеристику генофонда, но и заложил научно обоснованный фундамент для формирования селекционной стратегии в рамках практических задач животноводства.

I 22   1