Классификация сортов сои амурской селекции по биохимическим показателям методом кластеризации
Автор: Кодирова Галина Александровна, Кубанкова Галина Викторовна, Литвиненко Оксана Викторовна
Журнал: Вестник Красноярского государственного аграрного университета @vestnik-kgau
Рубрика: Агрономия
Статья в выпуске: 11, 2022 года.
Бесплатный доступ
Цель исследования - систематизация сортов сои амурской селекции по биохимическим показателям качества на основе кластерного анализа для рационального использования в производстве пищевых продуктов и добавок. Исследование проводили в 2018-2020 гг. в лаборатории переработки сельскохозяйственной продукции ФНЦ Всероссийского НИИ сои. Объекты исследования - 18 сортов сои селекции Всероссийского НИИ сои, выращенных в условиях Амурской области и включенных в Государственный реестр селекционных достижений Российской Федерации. В качестве признаков для кластерного анализа выбрано 13 показателей: белок, незаменимые аминокислоты (лизин, лейцин, изолейцин, валин, треонин, фенилаланин, метионин + цистеин), масло, полиненасыщенные жирные кислоты (олеиновая, линолевая, линоленовая) и активность ингибиторов трипсина. Применение методов кластерного анализа позволило сгруппировать сорта сои по критерию наибольшего сходства биохимических параметров и сформировать пять основных кластеров: 1 - Лебедушка, Журавушка, Пепелина, Золушка, Алена; 2 - Сентябринка, Интрига; 3 - Куханна, Невеста, Кружевница, Китросса, Статная, Умка; 4 - Персона, Бонус; 5 - Чародейка, Топаз, Нега 1. Основываясь на полученных результатах кластеризации, был проведен сравнительный анализ выделенных кластеров по средним значениям биохимических признаков. По белково-масличному составу выделенные кластеры сортов сои условно классифицированы на три группы: универсальные (с содержанием белка - не менее 38 %, масла - не менее 18 %), масличные (с содержанием белка - менее 38 %, масла - более 18 %) и высокобелковые (с содержанием белка - более 40 %, масла - менее 18 %).
Зерно сои, сорт, соевое сырье, биохимические показатели, белок, жир, аминокислотный состав, жирные кислоты, кластерный анализ
Короткий адрес: https://sciup.org/140296020
IDR: 140296020 | DOI: 10.36718/1819-4036-2022-11-54-61
Текст научной статьи Классификация сортов сои амурской селекции по биохимическим показателям методом кластеризации
Введение. При выборе сырья в системе переработки сои на пищевые цели, как правило, возникает вопрос о качестве зерна, включающем различные его показатели, начиная от физических параметров, определяющих пригодность зерна сои к переработке, и заканчивая химическим составом, обуславливающим пищевую ценность того или иного продукта. Одними из важнейших критериев оценки пищевой ценности соевого зерна являются: общее содержание белка (36–48 %) и аминокислот, особенно незаменимых, таких как лизин, треонин, триптофан; масла (от 16 до 27 %) и жироподобных веществ, обеспечивающих выполнение в организме человека различных физиологических и биохимических функций [1–3]. Ценность соевого масла определяют входящие в его состав жирные кислоты, среди которых на линолевую кислоту приходится более 50 %; олеиновую – 20– 36; стеариновую – 4,5–7,0; линоленовую – 3–5; пальмитиновую – 2,5–6,0 %. Семена сои также содержат значительные количества фосфолипидов, витаминов (А, D, C, E, группы В), широкий спектр макро- и микроэлементов [4, 5].
Ввиду большого сортового разнообразия и широкого спектра изучаемых признаков для их анализа и систематизации актуальное значение имеет использование многомерных статистических методов, в частности кластерного анализа. Методы кластеризации применяются в различных научно-технических областях с целью решения задач сегментации для объединения объектов в группы со схожими характеристиками, а также сжатия большого объема информации и построения научно обоснованных классификаций [6–10].
Цель исследования – систематизация сортов сои амурской селекции по биохимическим показателям качества на основе кластерного анализа для рационального использования в производстве пищевых продуктов и добавок.
Задачи: провести кластерный анализ сортов сои по критерию наибольшего сходства биохимических признаков; дать сравнительную оценку выделенных кластеров по степени выраженности признаков; определить группы сортов с комплексом качественных показателей.
Объекты и методы. Исследование проводилось в 2018–2020 гг. в лаборатории переработки сельскохозяйственной продукции ФНЦ ВНИИ сои. В качестве объектов исследования были взяты 18 сортов сои селекции Всероссийского
НИИ сои, выращенных в условиях Амурской области и включенных в Государственный реестр селекционных достижений РФ: Персона, Бонус, Сентябринка, Интрига, Чародейка, Топаз, Нега 1, Куханна, Невеста, Кружевница, Китросса, Статная, Умка, Пепелина, Золушка, Алена, Лебедушка, Журавушка [11]. Образцы для исследования получены из коллекционных питомников опытного поля лаборатории селекции и генетики сои ФНЦ ВНИИ сои. Отбор проб исследуемых образцов проводили в фазу полной спелости зерна в соответствии с ГОСТ 13586.3-2015.
В ходе биохимических исследований зерна сои была сформирована база данных и определена совокупность основных признаков, характеризующих качество зерна, по которым осуществлялась группировка сортов. В качестве признаков для кластерного анализа было выбрано 13 показателей: белок, незаменимые аминокислоты (лизин, лейцин, изолейцин, валин, треонин, фенилаланин, метионин + цистеин), масло, жирные кислоты (олеиновая, линолевая, линоленовая), активность ингибиторов трипсина.
Содержание белка, масла, аминокислотный состав и жирные кислоты определяли методом диффузного отражения света в инфракрасной области спектра на ИК-сканере модели FOSS NIR Systems 5000 (Дания). Для определения белка и масла в зерне сои использовали стандартные калибровочные уравнения фирмы FOSS Analytical A/S в соответствии с ГОСТ 32749-2014.
Калибровочные уравнения для определения состава аминокислот и жирных кислот разрабатывались в 2009–2010 гг. в аналитической группе ВНИИ сои [5, 12]. Трипсинингибирующую активность (ТИА) измеряли с помощью спектрофотометра Cary 50 (VARIAN) в соответствии с ГОСТ 33427-2015.
Статистическую обработку данных проводили с использованием пакета программ MS Excel и STATISTICA 10, используя метод кластерного анализа [13]. В качестве алгоритма кластеризации использовали метод Варда (мера близости объектов – Манхэттенское расстояние) и метод k-средних (5 кластеров, 10 итераций). Показатели с различиями в размерных единицах были приведены в единую систему методом стандартизации средних значений каждого признака в диапазоне от –2,7 до +2,7 ед. При выборе числа кластеров уровень сходства 15 % считали оптимальным. Проверку различий между кластерами по каждому признаку рассчитывали методом параметрического дисперсионного анализа.
Результаты и их обсуждение. На основании средних стандартизированных значений биохимических признаков был проведен кластерный анализ методом Варда, результатом которого являлось построение дендрограммы в виде графической последовательности объединения и разделения сортов сои на кластеры (рис. 1).
Метод Варда
Манхэттенское расстояние

Расстояние объединения
Рис. 1. Дендрограмма сходства-различия сортов сои по комплексу биохимических признаков
Анализ дендрограммы позволил сгруппировать сорта сои по принципу минимального взаимодействия внутри группы и максимального – между кластерами и сформировать пять основных кластеров, наиболее схожих по комплексу изучаемых признаков:
1-й кластер – Лебедушка, Журавушка, Пепе-лина, Золушка, Алена;
2-й кластер – Сентябринка, Интрига;
3-й кластер – Куханна, Невеста, Кружевница, Китросса, Статная, Умка;
4-й кластер – Персона, Бонус;
5-й кластер – Чародейка, Топаз, Нега 1.
Результаты дисперсионного анализа кластеризации наблюдений по биохимическим признакам (при р = 0,05)
Таблица 1
Признак |
Межгрупповая дисперсия |
Число степеней свободы |
Внутригрупповая дисперсия |
Число степеней свободы |
F |
Уровень значимости p |
Белок |
13,70976 |
4 |
3,29024 |
13 |
13,54209 |
0,000144 |
Лизин |
14,38596 |
4 |
2,61404 |
13 |
17,88583 |
0,000034 |
Лейцин |
12,12472 |
4 |
4,87528 |
13 |
8,08269 |
0,001679 |
Изолейцин |
13,56465 |
4 |
3,43535 |
13 |
12,83279 |
0,000189 |
Валин |
13,84803 |
4 |
3,15197 |
13 |
14,27872 |
0,000110 |
Фенилаланин |
14,40611 |
4 |
2,59389 |
13 |
18,05009 |
0,000032 |
Треонин |
14,78626 |
4 |
2,21374 |
13 |
21,70775 |
0,000012 |
Метионин + цистеин |
14,94572 |
4 |
2,05428 |
13 |
23,64504 |
0,000007 |
Масло |
13,75742 |
4 |
3,24258 |
13 |
13,78889 |
0,000132 |
Олеиновая |
13,48962 |
4 |
3,51038 |
13 |
12,48904 |
0,000217 |
Линолевая |
15,44616 |
4 |
1,55384 |
13 |
32,30710 |
0,000001 |
Линоленовая |
14,65846 |
4 |
2,34154 |
13 |
20,34562 |
0,000017 |
ТИА |
13,65342 |
4 |
1,24658 |
13 |
20,49110 |
0,000152 |
Результаты дисперсионного анализа указывают на высокое качество разбиения 18 наблюдений на 5 кластеров по каждому показателю, поскольку признаком качественной классификации является минимум изменчивости внутри кластера и максимум между кластерами.
Для визуализации полученных результатов была реализована процедура построения усредненных графиков, демонстрирующих значимые отличия кластеров и степень выраженности биохимических признаков (рис. 2). Анализ графиков позволил провести градацию наблюдений в порядковой шкале стандартизированных значений,
Для получения более детальной информации о выделенных кластерах и оценки результатов биохимических параметров исследуемых сортов сои на следующем этапе исследований применяли метод k-средних. Оценку качества кластеризации наблюдений и проверку значимости различий кластеров по исследуемым характеристикам проводили посредством параметрического дисперсионного анализа, используя процедуру, сравнивающую внутрикластер-ные и межкластерные дисперсии по каждому признаку (табл. 1).
где в качестве уровня «средний +» – стандартизированный интервал (0,0; +0,7), «выше среднего» – (> +0,7), «средний –» – стандартизированный интервал (0,0; –0,7), «ниже среднего» – (< –0,7). Результаты, полученные методом k-средних, в полной мере соответствуют дендрограмме, построенной методом иерархической кластеризации.
Основываясь на полученных результатах кластеризации, проведен сравнительный анализ выделенных кластеров по средним значениям биохимических признаков (табл. 2).

Кластер 1
Кластер 2
Кластер 3
Кластер 4
Кластер 5
Рис. 2. Графики средних стандартизированных значений для каждого кластера
Сравнительный анализ биохимических признаков сортов сои амурской селекции по кластерам (M±A при р = 0,05)
Таблица 2
Признак |
Среднее значение за три года, % |
||||
Кластер 1 |
Кластер 2 |
Кластер 3 |
Кластер 4 |
Кластер 5 |
|
Белок |
37,21±0,66 |
38,10±0,48 |
39,11±0,38 |
41,10±0,19 |
36,83±0,37 |
Лизин |
6,07±0,29 |
6,04±0,22 |
5,92±0,60 |
5,73±0,82 |
6,27±0,11 |
Лейцин |
8,28±0,65 |
7,91±0,07 |
8,14±0,78 |
7,83±0,21 |
8,20±0,36 |
Изолейцин |
5,69±0,51 |
5,67±0,31 |
5,81±0,55 |
6,01±0,84 |
5,34±0,21 |
Валин |
7,14±0,66 |
6,78±0,25 |
6,72±0,38 |
6,16±0,36 |
7,48±0,34 |
Фенилаланин |
4,27±0,56 |
4,27±0,66 |
4,33±0,17 |
4,39±0,66 |
4,20±0,09 |
Треонин |
3,44±0,41 |
3,32±0,34 |
3,35±0,44 |
3,20±0,68 |
3,40±0,07 |
Метионин + цистеин |
1,73±0,22 |
1,75±0,02 |
1,61±0,52 |
1,46±0,48 |
1,94±0,50 |
Масло |
18,89±0,61 |
19,12±0,39 |
18,06±0,30 |
17,46±0,86 |
20,23±0,22 |
Олеиновая (ω9) |
18,74±0,39 |
20,61±0,11 |
21,65±0,31 |
23,79±1,45 |
18,5±0,36 |
Линолевая (ω6) |
50,83±0,36 |
50,91±0,01 |
50,36±0,33 |
50,05±0,49 |
51,46±0,34 |
Линоленовая (ω3) |
6,58±0,49 |
7,23±0,32 |
8,01±0,33 |
9,85±1,71 |
5,41±0,12 |
ТИА, мг/г |
22,84±0,62 |
23,57±1,11 |
23,17±1,16 |
23,14±0,93 |
24,29±1,07 |
Первый кластер представлен группой сортов сои, отличающихся средними показателями белка (37,2 %) и масла (18,9 %), высокой концентрацией незаменимых аминокислот (лейцина, треонина) и минимальным уровнем трипси-нигибирующей активности, являющимся одним из важных показателей в зерне сои пищевого направления.
Сорта второго и третьего кластеров по изучаемым признакам значимо не отличались друг от друга и характеризовались средними значениями по всем показателям. При этом третий кластер образуют сорта со значениями признаков выше среднего по содержанию фенилаланина (4,3 %) в белке и олеиновой кислоты (21,7 %) в масле, а также значениями ниже среднего по признакам содержания метиони-на+цистеина (1,6 %) в белке, масла (18,1 %) и линолевой кислоты (50,4 %).
Наибольшие различия по большинству признаков выявлены в четвертом и пятом кластерах. Сорта, сформировавшие четвертый кластер, отличались максимальными значениями признаков белка (41,1 %), изолейцина (6,0 %), фенилаланина (4,4 %), а также олеиновой и линоленовой кислот (соответственно 23,8 и 9,9 %). Помимо этого в сортах четвертого кластера отмечено наибольшее значение суммы полинена-сыщенных жирных кислот в масле – 83,8 %, доля данных кислот в сортах сои других кластеров составила 75,4–80,1 %.
Пятый кластер представлен высокомасличными сортами с повышенным содержанием линолевой (ω6) и минимальным – линоленовой (ω3) кислот, что делает эти сорта перспективными для производства масла на пищевые цели. Кроме того, представители этого кластера отличались наибольшим содержанием лизина, валина и метионина + цистеина. Поскольку сорта в этой группе являются высоколизиновыми, то их можно рекомендовать для использования в производстве лизина в качестве пищевой добавки.
Следует отметить, что, несмотря на межсортовые различия, представители всех кластеров имеют сбалансированный аминокислотный состав и оптимальное соотношение ω6 и ω3 жирных кислот (5,1–9,5:1), что соответствует нормам физиологической потребности взрослого человека [14].
По белково-масличному составу зерна выделенные кластеры сортов сои условно классифицированы на три группы: универсальные (с содержанием белка – не менее 38 %, масла – не менее 18 %), масличные (с содержанием белка – менее 38 %, масла – более 18 %), высокобелковые (с содержанием белка – более 40 %, масла – менее 18 %) [15].
Универсальную группу сформировали второй и третий кластеры, включающие сорта Сентяб-ринка, Интрига, Куханна, Невеста, Кружевница, Китросса, Статная, Умка, которые могут быть использованы как для производства масла, так и белковых продуктов. Масличная группа объединила первый и пятый кластеры, включающие сорта: Лебедушка, Журавушка, Пепелина, Золушка, Алена, Чародейка, Топаз, Нега 1, – соответственно их лучше использовать в маслоэкстракционном производстве. В высокобелковую группу вошли сорта четвертого кластера (Чародейка, Топаз, Нега 1), они наиболее пригодны для производства соевой муки, белковых концентратов, изолятов, текстуратов, соевого молока, пищевых добавок и т. д.
Заключение. Применение методов кластерного анализа позволило систематизировать сорта сои по степени выраженности биохимических параметров зерна, сформировать пять основных кластеров, наиболее схожих по комплексу изучаемых признаков, и провести их сравнительную оценку. Определены три группы сортов по критериям белково-масличного состава (универсальные, масличные, высокобелковые), что позволит обеспечить целенаправленный выбор сырья в производстве пищевых продуктов (добавок) и прогнозирование качества готовой продукции.
Список литературы Классификация сортов сои амурской селекции по биохимическим показателям методом кластеризации
- Смагина А.В., Сытова М.В. Анализ использования соевого белка в пищевой промышленности // Научные труды Дальрыб-втуза. 2011. Т. 23. С. 73-78.
- Петибская В.С., Кучеренко Л.А., Зеленцов С.В. Использование сортового разнообразия семян сои для увеличения арсенала пищевых и функциональных продуктов // Масличные культуры. Научно-технический бюллетень Всероссийского научно-исследовательского института масличных культур. 2006. № 2 (135). С. 115-121.
- Могильный М.П. Биотехнологическая характеристика соевых продуктов // Естественные науки. 2007. № 6. С. 87-92.
- Лысиков Ю.А. Аминокислоты в питании человека // Экспериментальная и клиническая гастроэнтерология. 2012. № 2. С. 88-105.
- Низкий С.Е., Кодирова Г.А., Кубанкова Г.В. Оценка содержания ы-кислот в сортах сои амурской селекции // Достижения науки и техники АПК. 2020. Т. 34, № 8. С. 44-49. DOI: 10.24411 /0235-2451 -2020-10800.
- Иванищев В.В. О возможности приложения метода кластерного анализа к результатам физиолого-биохимических исследований растений // Известия ТулГУ. Естественные науки. 2018. Вып. 1. С. 69-77.
- Cluster analysis to select peanut drought tolerance lines / J.W. de Lima Pereira [et al.] // Aust. J. of Crop Sci. 2015. V. 9 (11). P. 10951105.
- Physiological and biochemical parameters for evaluation and clustering of rice cultivars differing in salt stress at seedling stage / S. Chunthaburee [et al.] // Saudi J. Biol. Sci. 2016. V. 23(4). P. 467-477.
- Klyuchko O.M. Cluster analysis in biotechnology // Biotechnologia Acta. 2017. V.10. No 5. P. 5-18.
- Variability of Phytochemicals by Breeding Year, Usage and Seed Size of Korean Soybean (Glycine max (L.) Merrill) Varieties / Tae-Young Hwang [et al.] // Agriculture. 2020. V. 10. P. 100. DOI: 10.3390/agriculture10040100.
- Каталог сортов сои / Е.М. Фокина [и др.]; под общ. ред. В.Т. Синеговской; ВНИИ сои. Благовещенск: ОДЕОН, 2021. 69 с.
- Низкий С.Е., Кодирова Г.А., Кубанкова Г.В. Особенности калибровочных уравнений для ИК-сканеров при определении аминокислотного состава белков сои // Вестник ДВО РАН. 2020. № 4. С. 131-135. DOI: 10.37102/08697698.2020.212.4.021.
- Буреева Н.Н. Многомерный статистический анализ с использованием ППП «STATISTICAL учеб.-метод. материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики». Н. Новгород, 2007. 112 с.
- MP 2.3.1.0253-21. Нормы физиологических потребностей в энергии и пищевых веществах для различных групп населения Российской Федерации (утв. Федеральной службой по надзору в сфере защиты прав потребителей и благополучия человека 22 июля 2021 г.). URL: https://base.garant.ru/ 402816140.
- Щелко Л.Г., Седова Т.С., Корнейчук В.А. Международный классификатор СЭВ рода Glycine Willd / Науч.-техн. совет стран -членов СЭВ по коллекциям диких культурных видов растений. Ленинград: Изд-во ВИР, 1990. 38 с.