Классификация сортов сои амурской селекции по биохимическим показателям методом кластеризации

Автор: Кодирова Галина Александровна, Кубанкова Галина Викторовна, Литвиненко Оксана Викторовна

Журнал: Вестник Красноярского государственного аграрного университета @vestnik-kgau

Рубрика: Агрономия

Статья в выпуске: 11, 2022 года.

Бесплатный доступ

Цель исследования - систематизация сортов сои амурской селекции по биохимическим показателям качества на основе кластерного анализа для рационального использования в производстве пищевых продуктов и добавок. Исследование проводили в 2018-2020 гг. в лаборатории переработки сельскохозяйственной продукции ФНЦ Всероссийского НИИ сои. Объекты исследования - 18 сортов сои селекции Всероссийского НИИ сои, выращенных в условиях Амурской области и включенных в Государственный реестр селекционных достижений Российской Федерации. В качестве признаков для кластерного анализа выбрано 13 показателей: белок, незаменимые аминокислоты (лизин, лейцин, изолейцин, валин, треонин, фенилаланин, метионин + цистеин), масло, полиненасыщенные жирные кислоты (олеиновая, линолевая, линоленовая) и активность ингибиторов трипсина. Применение методов кластерного анализа позволило сгруппировать сорта сои по критерию наибольшего сходства биохимических параметров и сформировать пять основных кластеров: 1 - Лебедушка, Журавушка, Пепелина, Золушка, Алена; 2 - Сентябринка, Интрига; 3 - Куханна, Невеста, Кружевница, Китросса, Статная, Умка; 4 - Персона, Бонус; 5 - Чародейка, Топаз, Нега 1. Основываясь на полученных результатах кластеризации, был проведен сравнительный анализ выделенных кластеров по средним значениям биохимических признаков. По белково-масличному составу выделенные кластеры сортов сои условно классифицированы на три группы: универсальные (с содержанием белка - не менее 38 %, масла - не менее 18 %), масличные (с содержанием белка - менее 38 %, масла - более 18 %) и высокобелковые (с содержанием белка - более 40 %, масла - менее 18 %).

Еще

Зерно сои, сорт, соевое сырье, биохимические показатели, белок, жир, аминокислотный состав, жирные кислоты, кластерный анализ

Короткий адрес: https://sciup.org/140296020

IDR: 140296020   |   DOI: 10.36718/1819-4036-2022-11-54-61

Текст научной статьи Классификация сортов сои амурской селекции по биохимическим показателям методом кластеризации

Введение. При выборе сырья в системе переработки сои на пищевые цели, как правило, возникает вопрос о качестве зерна, включающем различные его показатели, начиная от физических параметров, определяющих пригодность зерна сои к переработке, и заканчивая химическим составом, обуславливающим пищевую ценность того или иного продукта. Одними из важнейших критериев оценки пищевой ценности соевого зерна являются: общее содержание белка (36–48 %) и аминокислот, особенно незаменимых, таких как лизин, треонин, триптофан; масла (от 16 до 27 %) и жироподобных веществ, обеспечивающих выполнение в организме человека различных физиологических и биохимических функций [1–3]. Ценность соевого масла определяют входящие в его состав жирные кислоты, среди которых на линолевую кислоту приходится более 50 %; олеиновую – 20– 36; стеариновую – 4,5–7,0; линоленовую – 3–5; пальмитиновую – 2,5–6,0 %. Семена сои также содержат значительные количества фосфолипидов, витаминов (А, D, C, E, группы В), широкий спектр макро- и микроэлементов [4, 5].

Ввиду большого сортового разнообразия и широкого спектра изучаемых признаков для их анализа и систематизации актуальное значение имеет использование многомерных статистических методов, в частности кластерного анализа. Методы кластеризации применяются в различных научно-технических областях с целью решения задач сегментации для объединения объектов в группы со схожими характеристиками, а также сжатия большого объема информации и построения научно обоснованных классификаций [6–10].

Цель исследования – систематизация сортов сои амурской селекции по биохимическим показателям качества на основе кластерного анализа для рационального использования в производстве пищевых продуктов и добавок.

Задачи: провести кластерный анализ сортов сои по критерию наибольшего сходства биохимических признаков; дать сравнительную оценку выделенных кластеров по степени выраженности признаков; определить группы сортов с комплексом качественных показателей.

Объекты и методы. Исследование проводилось в 2018–2020 гг. в лаборатории переработки сельскохозяйственной продукции ФНЦ ВНИИ сои. В качестве объектов исследования были взяты 18 сортов сои селекции Всероссийского

НИИ сои, выращенных в условиях Амурской области и включенных в Государственный реестр селекционных достижений РФ: Персона, Бонус, Сентябринка, Интрига, Чародейка, Топаз, Нега 1, Куханна, Невеста, Кружевница, Китросса, Статная, Умка, Пепелина, Золушка, Алена, Лебедушка, Журавушка [11]. Образцы для исследования получены из коллекционных питомников опытного поля лаборатории селекции и генетики сои ФНЦ ВНИИ сои. Отбор проб исследуемых образцов проводили в фазу полной спелости зерна в соответствии с ГОСТ 13586.3-2015.

В ходе биохимических исследований зерна сои была сформирована база данных и определена совокупность основных признаков, характеризующих качество зерна, по которым осуществлялась группировка сортов. В качестве признаков для кластерного анализа было выбрано 13 показателей: белок, незаменимые аминокислоты (лизин, лейцин, изолейцин, валин, треонин, фенилаланин, метионин + цистеин), масло, жирные кислоты (олеиновая, линолевая, линоленовая), активность ингибиторов трипсина.

Содержание белка, масла, аминокислотный состав и жирные кислоты определяли методом диффузного отражения света в инфракрасной области спектра на ИК-сканере модели FOSS NIR Systems 5000 (Дания). Для определения белка и масла в зерне сои использовали стандартные калибровочные уравнения фирмы FOSS Analytical A/S в соответствии с ГОСТ 32749-2014.

Калибровочные уравнения для определения состава аминокислот и жирных кислот разрабатывались в 2009–2010 гг. в аналитической группе ВНИИ сои [5, 12]. Трипсинингибирующую активность (ТИА) измеряли с помощью спектрофотометра Cary 50 (VARIAN) в соответствии с ГОСТ 33427-2015.

Статистическую обработку данных проводили с использованием пакета программ MS Excel и STATISTICA 10, используя метод кластерного анализа [13]. В качестве алгоритма кластеризации использовали метод Варда (мера близости объектов – Манхэттенское расстояние) и метод k-средних (5 кластеров, 10 итераций). Показатели с различиями в размерных единицах были приведены в единую систему методом стандартизации средних значений каждого признака в диапазоне от –2,7 до +2,7 ед. При выборе числа кластеров уровень сходства 15 % считали оптимальным. Проверку различий между кластерами по каждому признаку рассчитывали методом параметрического дисперсионного анализа.

Результаты и их обсуждение. На основании средних стандартизированных значений биохимических признаков был проведен кластерный анализ методом Варда, результатом которого являлось построение дендрограммы в виде графической последовательности объединения и разделения сортов сои на кластеры (рис. 1).

Метод Варда

Манхэттенское расстояние

Расстояние объединения

Рис. 1. Дендрограмма сходства-различия сортов сои по комплексу биохимических признаков

Анализ дендрограммы позволил сгруппировать сорта сои по принципу минимального взаимодействия внутри группы и максимального – между кластерами и сформировать пять основных кластеров, наиболее схожих по комплексу изучаемых признаков:

1-й кластер – Лебедушка, Журавушка, Пепе-лина, Золушка, Алена;

2-й кластер – Сентябринка, Интрига;

3-й кластер – Куханна, Невеста, Кружевница, Китросса, Статная, Умка;

4-й кластер – Персона, Бонус;

5-й кластер – Чародейка, Топаз, Нега 1.

Результаты дисперсионного анализа кластеризации наблюдений по биохимическим признакам (при р = 0,05)

Таблица 1

Признак

Межгрупповая дисперсия

Число степеней свободы

Внутригрупповая дисперсия

Число степеней свободы

F

Уровень значимости p

Белок

13,70976

4

3,29024

13

13,54209

0,000144

Лизин

14,38596

4

2,61404

13

17,88583

0,000034

Лейцин

12,12472

4

4,87528

13

8,08269

0,001679

Изолейцин

13,56465

4

3,43535

13

12,83279

0,000189

Валин

13,84803

4

3,15197

13

14,27872

0,000110

Фенилаланин

14,40611

4

2,59389

13

18,05009

0,000032

Треонин

14,78626

4

2,21374

13

21,70775

0,000012

Метионин + цистеин

14,94572

4

2,05428

13

23,64504

0,000007

Масло

13,75742

4

3,24258

13

13,78889

0,000132

Олеиновая

13,48962

4

3,51038

13

12,48904

0,000217

Линолевая

15,44616

4

1,55384

13

32,30710

0,000001

Линоленовая

14,65846

4

2,34154

13

20,34562

0,000017

ТИА

13,65342

4

1,24658

13

20,49110

0,000152

Результаты дисперсионного анализа указывают на высокое качество разбиения 18 наблюдений на 5 кластеров по каждому показателю, поскольку признаком качественной классификации является минимум изменчивости внутри кластера и максимум между кластерами.

Для визуализации полученных результатов была реализована процедура построения усредненных графиков, демонстрирующих значимые отличия кластеров и степень выраженности биохимических признаков (рис. 2). Анализ графиков позволил провести градацию наблюдений в порядковой шкале стандартизированных значений,

Для получения более детальной информации о выделенных кластерах и оценки результатов биохимических параметров исследуемых сортов сои на следующем этапе исследований применяли метод k-средних. Оценку качества кластеризации наблюдений и проверку значимости различий кластеров по исследуемым характеристикам проводили посредством параметрического дисперсионного анализа, используя процедуру, сравнивающую внутрикластер-ные и межкластерные дисперсии по каждому признаку (табл. 1).

где в качестве уровня «средний +» – стандартизированный интервал (0,0; +0,7), «выше среднего» – (> +0,7), «средний –» – стандартизированный интервал (0,0; –0,7), «ниже среднего» – (< –0,7). Результаты, полученные методом k-средних, в полной мере соответствуют дендрограмме, построенной методом иерархической кластеризации.

Основываясь на полученных результатах кластеризации, проведен сравнительный анализ выделенных кластеров по средним значениям биохимических признаков (табл. 2).

Кластер 1

Кластер 2

Кластер 3

Кластер 4

Кластер 5

Рис. 2. Графики средних стандартизированных значений для каждого кластера

Сравнительный анализ биохимических признаков сортов сои амурской селекции по кластерам (M±A при р = 0,05)

Таблица 2

Признак

Среднее значение за три года, %

Кластер 1

Кластер 2

Кластер 3

Кластер 4

Кластер 5

Белок

37,21±0,66

38,10±0,48

39,11±0,38

41,10±0,19

36,83±0,37

Лизин

6,07±0,29

6,04±0,22

5,92±0,60

5,73±0,82

6,27±0,11

Лейцин

8,28±0,65

7,91±0,07

8,14±0,78

7,83±0,21

8,20±0,36

Изолейцин

5,69±0,51

5,67±0,31

5,81±0,55

6,01±0,84

5,34±0,21

Валин

7,14±0,66

6,78±0,25

6,72±0,38

6,16±0,36

7,48±0,34

Фенилаланин

4,27±0,56

4,27±0,66

4,33±0,17

4,39±0,66

4,20±0,09

Треонин

3,44±0,41

3,32±0,34

3,35±0,44

3,20±0,68

3,40±0,07

Метионин + цистеин

1,73±0,22

1,75±0,02

1,61±0,52

1,46±0,48

1,94±0,50

Масло

18,89±0,61

19,12±0,39

18,06±0,30

17,46±0,86

20,23±0,22

Олеиновая (ω9)

18,74±0,39

20,61±0,11

21,65±0,31

23,79±1,45

18,5±0,36

Линолевая (ω6)

50,83±0,36

50,91±0,01

50,36±0,33

50,05±0,49

51,46±0,34

Линоленовая (ω3)

6,58±0,49

7,23±0,32

8,01±0,33

9,85±1,71

5,41±0,12

ТИА, мг/г

22,84±0,62

23,57±1,11

23,17±1,16

23,14±0,93

24,29±1,07

Первый кластер представлен группой сортов сои, отличающихся средними показателями белка (37,2 %) и масла (18,9 %), высокой концентрацией незаменимых аминокислот (лейцина, треонина) и минимальным уровнем трипси-нигибирующей активности, являющимся одним из важных показателей в зерне сои пищевого направления.

Сорта второго и третьего кластеров по изучаемым признакам значимо не отличались друг от друга и характеризовались средними значениями по всем показателям. При этом третий кластер образуют сорта со значениями признаков выше среднего по содержанию фенилаланина (4,3 %) в белке и олеиновой кислоты (21,7 %) в масле, а также значениями ниже среднего по признакам содержания метиони-на+цистеина (1,6 %) в белке, масла (18,1 %) и линолевой кислоты (50,4 %).

Наибольшие различия по большинству признаков выявлены в четвертом и пятом кластерах. Сорта, сформировавшие четвертый кластер, отличались максимальными значениями признаков белка (41,1 %), изолейцина (6,0 %), фенилаланина (4,4 %), а также олеиновой и линоленовой кислот (соответственно 23,8 и 9,9 %). Помимо этого в сортах четвертого кластера отмечено наибольшее значение суммы полинена-сыщенных жирных кислот в масле – 83,8 %, доля данных кислот в сортах сои других кластеров составила 75,4–80,1 %.

Пятый кластер представлен высокомасличными сортами с повышенным содержанием линолевой (ω6) и минимальным – линоленовой (ω3) кислот, что делает эти сорта перспективными для производства масла на пищевые цели. Кроме того, представители этого кластера отличались наибольшим содержанием лизина, валина и метионина + цистеина. Поскольку сорта в этой группе являются высоколизиновыми, то их можно рекомендовать для использования в производстве лизина в качестве пищевой добавки.

Следует отметить, что, несмотря на межсортовые различия, представители всех кластеров имеют сбалансированный аминокислотный состав и оптимальное соотношение ω6 и ω3 жирных кислот (5,1–9,5:1), что соответствует нормам физиологической потребности взрослого человека [14].

По белково-масличному составу зерна выделенные кластеры сортов сои условно классифицированы на три группы: универсальные (с содержанием белка – не менее 38 %, масла – не менее 18 %), масличные (с содержанием белка – менее 38 %, масла – более 18 %), высокобелковые (с содержанием белка – более 40 %, масла – менее 18 %) [15].

Универсальную группу сформировали второй и третий кластеры, включающие сорта Сентяб-ринка, Интрига, Куханна, Невеста, Кружевница, Китросса, Статная, Умка, которые могут быть использованы как для производства масла, так и белковых продуктов. Масличная группа объединила первый и пятый кластеры, включающие сорта: Лебедушка, Журавушка, Пепелина, Золушка, Алена, Чародейка, Топаз, Нега 1, – соответственно их лучше использовать в маслоэкстракционном производстве. В высокобелковую группу вошли сорта четвертого кластера (Чародейка, Топаз, Нега 1), они наиболее пригодны для производства соевой муки, белковых концентратов, изолятов, текстуратов, соевого молока, пищевых добавок и т. д.

Заключение. Применение методов кластерного анализа позволило систематизировать сорта сои по степени выраженности биохимических параметров зерна, сформировать пять основных кластеров, наиболее схожих по комплексу изучаемых признаков, и провести их сравнительную оценку. Определены три группы сортов по критериям белково-масличного состава (универсальные, масличные, высокобелковые), что позволит обеспечить целенаправленный выбор сырья в производстве пищевых продуктов (добавок) и прогнозирование качества готовой продукции.

Список литературы Классификация сортов сои амурской селекции по биохимическим показателям методом кластеризации

  • Смагина А.В., Сытова М.В. Анализ использования соевого белка в пищевой промышленности // Научные труды Дальрыб-втуза. 2011. Т. 23. С. 73-78.
  • Петибская В.С., Кучеренко Л.А., Зеленцов С.В. Использование сортового разнообразия семян сои для увеличения арсенала пищевых и функциональных продуктов // Масличные культуры. Научно-технический бюллетень Всероссийского научно-исследовательского института масличных культур. 2006. № 2 (135). С. 115-121.
  • Могильный М.П. Биотехнологическая характеристика соевых продуктов // Естественные науки. 2007. № 6. С. 87-92.
  • Лысиков Ю.А. Аминокислоты в питании человека // Экспериментальная и клиническая гастроэнтерология. 2012. № 2. С. 88-105.
  • Низкий С.Е., Кодирова Г.А., Кубанкова Г.В. Оценка содержания ы-кислот в сортах сои амурской селекции // Достижения науки и техники АПК. 2020. Т. 34, № 8. С. 44-49. DOI: 10.24411 /0235-2451 -2020-10800.
  • Иванищев В.В. О возможности приложения метода кластерного анализа к результатам физиолого-биохимических исследований растений // Известия ТулГУ. Естественные науки. 2018. Вып. 1. С. 69-77.
  • Cluster analysis to select peanut drought tolerance lines / J.W. de Lima Pereira [et al.] // Aust. J. of Crop Sci. 2015. V. 9 (11). P. 10951105.
  • Physiological and biochemical parameters for evaluation and clustering of rice cultivars differing in salt stress at seedling stage / S. Chunthaburee [et al.] // Saudi J. Biol. Sci. 2016. V. 23(4). P. 467-477.
  • Klyuchko O.M. Cluster analysis in biotechnology // Biotechnologia Acta. 2017. V.10. No 5. P. 5-18.
  • Variability of Phytochemicals by Breeding Year, Usage and Seed Size of Korean Soybean (Glycine max (L.) Merrill) Varieties / Tae-Young Hwang [et al.] // Agriculture. 2020. V. 10. P. 100. DOI: 10.3390/agriculture10040100.
  • Каталог сортов сои / Е.М. Фокина [и др.]; под общ. ред. В.Т. Синеговской; ВНИИ сои. Благовещенск: ОДЕОН, 2021. 69 с.
  • Низкий С.Е., Кодирова Г.А., Кубанкова Г.В. Особенности калибровочных уравнений для ИК-сканеров при определении аминокислотного состава белков сои // Вестник ДВО РАН. 2020. № 4. С. 131-135. DOI: 10.37102/08697698.2020.212.4.021.
  • Буреева Н.Н. Многомерный статистический анализ с использованием ППП «STATISTICAL учеб.-метод. материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики». Н. Новгород, 2007. 112 с.
  • MP 2.3.1.0253-21. Нормы физиологических потребностей в энергии и пищевых веществах для различных групп населения Российской Федерации (утв. Федеральной службой по надзору в сфере защиты прав потребителей и благополучия человека 22 июля 2021 г.). URL: https://base.garant.ru/ 402816140.
  • Щелко Л.Г., Седова Т.С., Корнейчук В.А. Международный классификатор СЭВ рода Glycine Willd / Науч.-техн. совет стран -членов СЭВ по коллекциям диких культурных видов растений. Ленинград: Изд-во ВИР, 1990. 38 с.
Еще
Статья научная