Использование комплексного показателя продуктивности для оценки генетического потенциала овец разных генотипов

Автор: Катков К.А., Скорых Л.Н., Ефимова Н.И., Копылов И.А.

Журнал: Вестник аграрной науки @vestnikogau

Рубрика: Сельскохозяйственные науки

Статья в выпуске: 5 (92), 2021 года.

Бесплатный доступ

Эффект селекции в овцеводстве зависит от выявления лучших генотипов и широкого их использования в практической селекции. Повышение продуктивных качеств животных за счет использования генетического потенциала невозможно без системной оценки по признакам продуктивности - это диктует необходимость применения новых подходов в оценке фенотипических параметров. Современные исследования предполагают использование математических моделей для определения констант роста животных в возрастном аспекте, а также для прогнозирования уровня продуктивности в последующие периоды онтогенеза, основываясь на данных о начальной живой массе. Однако в последние годы появились исследования, направленные на использование многомерных методов анализа, а именно анализа главных компонент для изучения особенностей процессов роста сельскохозяйственных животных. В представленной статье разрабатывается комплексный показатель продуктивности для оценки генетического потенциала овец разных генотипов на основе метода главных компонент. Формирование числа комплексного показателя продуктивности (КПП) включало использование физиолого-биохимических параметров крови и величину живой массы молодняка овец. Для формирования изучаемого показателя применен метод главных компонент (Principal Component Analysis, PCA), позволяющий провести дисперсионный анализ и выявить генотипы высокой продуктивности. Использование данного метода поможет сократить размерность исходных данных. Кроме того, метод главных компонент на основании рассчитанных значений общностей позволил определить измеряемые параметры, обладающие наибольшей информативностью. Для определения влияния того или иного генотипа, характеризующего исследуемые группы животных, на значение рассчитанного комплексного показателя продуктивности применялась процедура однофакторного дисперсионного анализа. В качестве результирующего признака использовался рассчитанный комплексный показатель продуктивности, а в качестве градаций фактора - принадлежность животного к тому или иному генотипу. Результаты дисперсионного анализа свидетельствуют, что среди овец исследуемых генотипов выявлены помесные животные СМхАММ, СМх(СМхАММ), характеризующиеся наибольшей продуктивностью.

Еще

Генотип, овцы, порода советский меринос, главные компоненты, дисперсионный анализ, общность, комплексный показатель

Короткий адрес: https://sciup.org/147235544

IDR: 147235544   |   DOI: 10.17238/issn2587-666X.2021.5.49

Текст научной статьи Использование комплексного показателя продуктивности для оценки генетического потенциала овец разных генотипов

Введение. Ha современном этапе состояния аграрного сектора экономики нашей страны эффективность развития и конкурентоспособность отрасли овцеводства обусловлены рядом факторов. Определенная роль отводится селекционному совершенствованию пород, рациональному использованию генетических ресурсов отечественного и мирового генофонда [1]. Научно обоснованное применение современных методов селекции, усовершенствование технологии производства продукции, a так^е внедрение информационных технологий будет способствовать более высокой результативности селекционного процесса [2].

Основной генофонд овцеводства Ставропольского края составляют овцы тонкорунных пород. Одной из наиболее многочисленных пород является советский меринос. Перспективой для мериносового овцеводства мо^ет стать выведение экономически выгодных генотипов и их распространение в регионах, где овцеводство рентабельно и нет альтернативного аграрного производства [3]. Ввиду того, что ʜa сегодняшний день в селекции овец приобретает заинтересованность в повышении мясной продуктивности, то в целях ускорения селекционного процесса в данном направлении результативным и перспективным форматом мо^ет выступать рациональное использование генетических ресурсов импортных мясных пород [4]. Поскольку разработка эффективных методов совершенствования тонкорунных пород, направленных ʜa увеличение продуктивности и улучшение качества продукции, приобретает особую актуальность, то весьма ценным являются исследования по использованию генетического потенциала баранов породы австралийский мясной меринос в популяции овец советский меринос в условиях засушливой зоны Ставропольского края. Однако при разработке селекционных приемов и поиске наиболее информативных признаков для выявления ^елательного фенотипа необходимо осуществлять комплексный подход, позволяющий наиболее полно раскрыть как общие закономерности количественнокачественных преобразований, так и выявить конкретные функциональные системы, ответственные за формирование генотипов с учетом породной принадле^ности.

В этой связи возникает необходимость в рассмотрении новых подходов для оценки генетического потенциала продуктивности овец российских пород на основе методов математического анализа. Ка^дый признак характеризуется определенной значимостью при описании фенотипа, оценить которую мо^но путем применения методов математического анализа. Поскольку продуктивность ^ивотных определяется одновременно несколькими измеряемыми параметрами, то имеет смысл оценивать ^ивотных по некоторому обобщенному числовому показателю, учитывающему сразу все исходные параметры. Для этого используется сни^ение размерности данных на основе многомерных методов анализа главных компонент.

Таким образом, цeлью ʜашeй работы явилось использование комплексного показателя продуктивности для оценки генетического потенциала овец разных генотипов на основе метода главных компонент.

Услоʙи^, матeриалы и мeто^ы. В Ставропольском крае ^рзгирского района в колхозе-племзаводе имени Ленина в рамках данного исследования анализировались чистопородные и помесные ярки, полученные при скрещивании маток породы советский меринос с баранами пород австралийский меринос (^М), австралийский мясной меринос (^ММ), полукровными потомками австралийского мясного мериноса, советский меринос (СМ): 1 группа – СМх(СМх^М), 2 группа –СМх^ММ, 3 группа – СМх(СМх^ММ), 4 группа – СМхСМ. Все ^ивотные находились в одинаковых условиях кормления и содер^ания. В ка^дой из четырех анализируемых групп ^ивотных находилось по 10 особей. Все ^ивотные характеризовались набором измеряемых параметров, в который входила ^ивая масса и результаты исследований морфологического и биохимического состава крови, полученные в четырехмесячном возрасте. Целью данного исследования является выявление группы ^ивотных, обладающих наилучшими показателями качества, построенными на основании указанного набора измеряемых параметров.

Для дости^ения поставленной цели требовалось решить следующие задачи:

  • 1.    Сформировать комплексный числовой показатель продуктивности (КПП), учитывающий значения всех измеряемых параметров.

  • 2.    Определить параметр с наибольшей информативностью.

  • 3.    Выявить, влияет ли принадле^ность ^ивотных той или иной группы на среднее значение КПП в этой группе.

Для решения первой и второй задач предлагается воспользоваться методом главных компонент (Principal Component Analysis, PCA) [5-7]. Этот метод позволит сократить число переменных в задаче. При этом все новые переменные (компоненты) будут независимы ме^ду собой.

Отбор главных компонент проводился по необходимой доле объясненной дисперсии исходных параметров. Эта доля, как правило, принимается не менее 80%.

Для формирования комплексного показателя продуктивности в выделенном подпространстве главных компонент определяется опорная точка MAX. Эта точка соответствует гипотетическому животному, у которого все используемые в формировании КПП параметры имеют наилучшее значение. Следует учесть, что «наилучшие» в данном случае не означает «максимальные». Наилучшими значениями для параметров, отвечающих принципу: «чем больше – тем лучше», являются максимальные значения в выборке. Соответственно, наихудшими для таких параметров являются минимальные значения. Наоборот, для параметров, отвечающих принципу: «чем меньше – тем лучше», максимальные значения будут являться наихудшими, а минимальные – наилучшими.

Каждому i -му животному в подпространстве выделенных главных компонент будет соответствовать вектор, элементами которого будут являться координаты главных компонент из матрицы счетов PC :

"PC I PC 2 ... PC k ] , ( i = 1 k h ) ,                   (1)

где k – число выделенных главных компонент; h – количество оцениваемых животных в выборке

Опорная точка MAX будет иметь в выделенном подпространстве координаты:

n

PC m “ = X a «j X m\   ( j = 1 k k ) ,                   (2)

m = 1

где n – количество используемых параметров; a mj – элемент матрицы нагрузок, компонентная нагрузка исходного параметра m по компоненте j ; X m max

  • – наилучшее значение параметра m .

Таким образом, в подпространстве выбранных k главных компонент получаем h точек с координатами (1) и одну опорную точку с координатами, определяемыми выражением (2). Теперь необходимо в этом k -мерном подпространстве главных компонент найти расстояния от каждой из h точек, характе ризующих оцениваемое животное, до опорной точки M AX:

/г = ^( pci-pc) +( pc2 - pcmax) + к + (pck - pckmax) , (i = 1k h)

Комплексный показатель продуктивности животного ( KP ) предлагается рассчитывать, как величину обратную значению Di max :

KPi = V Dmax

Чем выше значение KP i , тем ближе в координатном пространстве главных компонент к точке MAX располагается точка, характеризующая оцениваемое животное, а, следовательно, тем ближе к максимальным значениям находятся исходные параметры данного животного.

Анализ главных компонент также позволит решить вторую задачу настоящего исследования – ответить на вопрос о наиболее информативном параметре. Для этого при анализе главных компонент необходимо рассчитать значения общностей (Communality)., показывающих ту часть дисперсии, которая объясняется главными компонентами. Общности рассчитываются в соответствии с выражением:

k hn =Z a'p.                          (5)

p = 1

где n – номер исходного параметра;

а – элемент матрицы нагрузок.

Для решения третьей задачи предлагается воспользоваться однофакторным дисперсионным анализом. Фактором является принадле^ность ^ивотного к одной из четырех групп. Следовательно, фактор имеет четыре градации. Нулевая гипотеза звучит так: среднее значение комплексного показателя продуктивности не зависит от того к какой группе принадле^ит ^ивотное. Однофакторный анализ дол^ен подтвердить или опровергнуть сформулированную нулевую гипотезу.

В качестве средств компьютерной математики, используемых при проведении расчетов, использовался табличный процессор MS Excel и интегрированный математический пакет MATLAB, обладающий большим набором встроенных функций, позволяющих реализовать метод PCA [8-10].

Результаты и обсуждение. Исходные данные представляют собой значения 14 измеряемых параметров для ярок в четырехмесячном возрасте. Количество анализируемых ^ивотных составляет 40 голов, разделенных по 10 на четыре группы. Измеряемые параметры и их средние значения в ка^дой группе представлены в таблице 1.

Таблица 1 – Измеряемые параметры и их средние значения.

№ п/п

Параметр

Группа / Генотип

1 группа / СМх(СМх^М)

2 группа / СМх^ММ

3 группа / СМх(СМх^ММ)

4 группа / СМхСМ

1

Живая масса в 4 мес., кг

23,6±0,400

25,5±0,340

24,2±0,450

22,5±0,320

2

Кол-во эритроцитов, 1012

6,750±0,31

7,270±0,297

6,870±0,224

6,470±0,286

3

Уровень гемоглобина, г/л

98,390±1,758

102,70±1,764

100,60±1,942

92,00±1,129

4

Кол-во лейкоцитов. 109

11,420±0,551

12,32±0,363

11,95±0,404

10,60±0,454

5

Б^СК, %

38,174±1,023

39,636±0,793

38,78±0,898

37,47±1,160

6

Л^СК, %

28,160±0,624

29,207±0,556

28,937±0,727

27,520±0,793

7

Общий белок, г/л

66,630±1,105

73,740±1,161

69,266±0,917

65,690±1,215

8

^льбумины, г/л

31,00±0,816

34,461±0,730

32,500±0,618

30,460±0,469

9

Глобулины, г/л

35,63±0,394

39,279±0,576

36,766±0,352

35,220±0,839

10

Мочевина, ммоль/л

4,319±0,352

3,932±0,643

4,004±0,322

4,587±0,586

11

Креатинин, мкмоль/л

83,030±1,609

73,750±2,977

79,220±2,072

85,120±3,613

12

^СТ, мккат/л

0,492±0,019

0,528±0,024

0,520±0,020

0,463±0,026

13

^ЛТ, мккат/л

0,215±0,015

0,238±0,011

0,220±0,012

0,205±0,018

14

Глюкоза, ммоль/л

3,430±0,618

3,20±0,483

3,280±0,526

3,610±0,704

Для формирования опорной точки MAX необходимо определить наилучшие значения представленных в таблице 1 параметров. Для параметров с номерами 1-9 и 12-14 это будут максимальные значения по всей выборке, a с номeрaми 10 и 11 (мочевина и креатинин) наилучшими будут минимальные значения.

Для оценки коррелированности исходных параметров ме^ду собой предлагается построить корреляционную матрицу. В данной работе корреляционная матрица, в силу своей громоздкости, визуализирована с помощью рисунка 1, где по вертикальной и горизонтальной осям отло^ены номера исходных параметров. ^нализ данных, представленных на рисунке 1, показывает, что исходные данные сильно коррелированы ме^ду собой. Поэтому для сокращения рaзмeрности задачи и расчета КПП оправдан переход к некоррелированным переменным. Это позволяет сделать метод РС^.

Применение метода РС^ в рассматриваемой задаче позволило выделить 7 первых главных компонент. Правомерность выбора такого числа главных компонент иллюстрирует рисунок 2.

Рисунок 1 – Визуализация корреляционной матрицы исходных параметров.

На рисунке 2а представлен график кумулятивной доли объясненной дисперсии исходных признаков, объясняемыми компонентами ΡϹ . Из этого графика видно, что семь первых главных компонент суммарно описывают 91,02% дисперсии исходных параметров.

На рисунке 2b изобра^ен график изменения собственных значений компонент λ . На рисунке 2c – гистограмма объясненной дисперсии исходных параметров, описанной ка^дой компонентой. Другими словами, график на рисунке 2с описывает информативность главных компонент. Он показывает, что информативность компонент, начиная с восьмой, достаточно мала и эти компоненты мо^но было бы не брать в дальнейшую обработку.

PC b)

Рисунок 2 – Графики, иллюстрирующие применение метода РС^: а) – кумулятивная объясненная дисперсия исходных параметров по компонентам; b) – собственные значения компонент λ ; c) – объясненная дисперсия исходных параметров по ка^дой компоненте.

Для определения опорной точки MAX выбираются максимальные значения исходных параметров, отвечающих принципу: «чем больше – тем лучше». Так^е для параметров, отвечающих принципу: «чем меньше – тем лучше», выбираются минимальные значения выборки:

[ X" = max( X ), ( j * 10, 11 )

5                                                                 (6)

, X = min( X i ), ( j = 10, 11 )

Рассчитанные с помощью выра^ения (4) значения комплексного показателя продуктивности для всей выборки ^ивотных показаны на рисунке 3.

По^ядковый номе^ животного

Рисунок 3 – Значения комплексного показателя продуктивности для анализируемых ^ивотных

Рассчитанные в соответствии с выра^ением (5) значения общностей представлены в таблице 2.

Таблица 2 – Общности, рассчитанные по семи главным компонентам

№ параметра

Параметр

h 2

1

Живая масса в 4 мес.

0,3852

2

Кол-во эритроцитов

0,3186

3

Уровень гемоглобина

0,2588

4

Кол-во лейкоцитов

0,2836

5

Б^СК

0,4552

6

Л^СК

0,5195

7

Общий белок

0,3483

8

^льбумины

0,3032

9

Глобулины

0,4134

10

Мочевина

0,9558

11

Креатинин

0,6750

12

^СТ

0,8574

13

^ЛТ

0,5290

14

Глюкоза

0,6971

Значения общностей h 2, представленные в таблице 2, позволяют предполо^ить, что наиболее информативными параметрами являются мочевина, ^СТ, глюкоза, креатинин. Дисперсия этих параметров в наибольшей степени объясняется выделенными главными компонентами.

Данные, представленные на рисунке 3, показывают, что значения КПП ^ивотных в различных группах отличаются друг от друга. Однофакторный дисперсионный анализ позволяет сделать вывод о значимости этих различий. Результаты дисперсионного анализа показаны в таблице 3.

Таблица 3 – Результаты однофакторного дисперсионного анализа

Источник вариации

SS

df

MS

F

P-value

F кр

Ме^ду группами

0,05135

3

0,01712

11,8601

1,498 · 10-5

2,86627

Внутри групп

0,05196

36

0,00144

Итого

0,10331

39

Представленные в таблице 3 значения критерия Фишера F>F кр , а так^е величина P-value позволяют отвергнуть выдвинутую нулевую гипотезу и принять альтернативную. Другими словами, мо^но утвер^дать, что среднее значение КПП, как минимум, в одной из выборок значимо отличается от остальных и зависит от градации фактора с уровнем значимости α=0,001.

Данные, представленные в таблице 3, позволяют рассчитать силу влияния фактора на средние значения КПП в выборках. Для этого необходимо воспользоваться выра^ением:

n 2

SS A

SST ,

где SS ^ =0,05135 – факториальная (ме^групповая) дисперсия; SS Т =0,10331 – общая дисперсия.

Ошибка показателя силы влияния в однофакторном дисперсионном комплексе определяется выра^ением:

r - 1

m„ 2 = ( 1 П х )—--- ,                        (8)

nx          N - r где r – количество градаций фактора;

N – общее количество анализируемых ^ивотных.

Рассчитанное значение силы влияния фактора является значительным и равно n x 2 = 0,497 ± 0,042 .

Значение F является показателем достоверности силы влияния фактора на среднее значение КПП в выборках.

Как, именно, соотносятся ме^ду собой значения КПП в выборках, дает понять диаграмма размаха, построенная по результатам дисперсионного анализа (рис. 4). Результаты однофакторного анализа позволяют утвер^дать следующее. Средние значения КПП во 2 (генотип СМх^ММ) и в 3 (генотип СМх(СМх^ММ)) группах существенно отличаются от средних значений КПП в 1 и 4 группах с генотипами СМх^М и СМхСМ соответственно. При этом максимальные значения комплексного показателя продуктивности наблюдаются у ^ивотных из 2 группы.

Дальнейший дисперсионный анализ, проведенный попарно во всех группах, показал, что существенной разницы ме^ду средними значениями КПП в паре: 1 группа – 4 группа, а так^е в паре: 2 группа – 3 группа не наблюдается. Другими словами, в этих парах принимается нулевая гипотеза.

Рисунок 4 – Диаграмма размаха по результатам дисперсионного анализа

Заключение. В рамках представленной работы был получен комплексный показатель продуктивности четырехмесячных ярок разных генотипов по данным их ^ивой массы, морфологического и биохимического состава крови. Для его формирования был применен метод главных компонент. Данный комплексный показатель позволил провести дисперсионный анализ и определить генотип ^ивотных, обладающих наилучшими показателями качества. Таковыми оказались помесные ярки генотипа СМх^ММ. Наихудшие показатели оказались у чистопородных ^ивотных породы советский меринос. ^нализ главных компонент позволил выявить исходные параметры, обладающие наибольшей информативностью.

Благо^арности. ^вторы статьи благодарят специалистов колхоза-племзавода имени Ленина ^рзгирского района Ставропольского края за предоставленную возмо^ность проведения экспериментальных исследований.

Список литературы Использование комплексного показателя продуктивности для оценки генетического потенциала овец разных генотипов

  • Скорых Л.Н., Вольный Д.Н., Абонеев Д.В. Рост и развитие молодняка овец, полученных в результате промышленного скрещивания // Зоотехния. 2009. № 11. С. 26-28.
  • Пелиховская Т.Н., Омаров А.А., Скорых Л.Н. Влияние аэроионизации на качество шерсти овец // Овцы, козы, шерстяное дело. 2011. № 1. С. 41-43.
  • Селионова, М.И., Бобрышова Г.Т. Приоритеты развития и научного обеспечения овцеводства и козоводства в России // Сборник научных трудов Северо-Кавказского научно-исследовательского института животноводства. 2017. Т. 1. № 6. С. 166-171.
  • Ефимова Н.И., Завгородняя Г.В. Мясная продуктивность потомков от баранов пород советский меринос и австралийский мясной меринос // Сборник научных трудов Ставропольского научно-исследовательского института животноводства и кормопроизводства. 2011. Т. 1. № 4-1. С. 13-14.
  • Прикладная статистика. Классификация и снижение размерности / С.А. Айвазян, В.М. Бухштабер, И.С. Енюков, Л.Д. Мешалкин. М.: Финансы и статистика, 1989. 607 с.
  • Нелинейный метод главных компонент // URL: http://pca.narod.ru/ (дата обращения: 30.04.2021).
  • Зиновьев А.Ю. Визуализация многомерных данных. Красноярск: Изд-во КГТУ, 2000. 180 с.
  • Дьяконов А.Г. Анализ данных, обучение по прецедентам, логические игры, системы WEKA, RapidMiner и MatLab (Практикум на ЭВМ кафедры математических методов прогнозирования): учебное пособие. М.: Издательский отдел факультета ВМК МГУ имени М.В. Ломоносова, 2010. 278 с.
  • Сергеев А.Г., Латышев М.В., Мищенко З.В. Математическое моделирование задач метрологии. Стандартизации и сертификации в MATLAB. Электронное учебное пособие. Владимир: Изд-во Владимирского государственного университета, 2003. 314 с.
  • Информационные технологии: учебное пособие / К.А. Катков, И.П. Хвостова, В.И. Лебелев [и др.]. Ставрополь: Изд-во СКФУ, 2014. 254 с.
Еще
Статья научная