Статистический анализ многолетних значений показателей валового сбора и урожайности сельскохозяйственных культур в Республике Казахстан
Автор: Коксеген А.Е., Мекеш О.
Журнал: Экономика и бизнес: теория и практика @economyandbusiness
Статья в выпуске: 8 (114), 2024 года.
Бесплатный доступ
В данной статье с использованием метода факторного анализа изучается статистическая взаимозависимость между показателями валового сбора сельскохозяйственных культур и их урожайностью в условиях Республики Казахстан. Выявляя наличие или отсутствие идентичности в природе общих дисперсий показателей валового сбора и урожайности, можно проверить выполнение или невыполнение очевидного утверждения "выращивается больше урожая, собирается больше урожая и наоборот». На основе тождественности общих дисперсий валового сбора и урожайности зерновых культур (на них значимо влияет один и тот же фактор), можно сделать вывод, что практически всегда был собран весь выращенный объем зерновых культур. Было установлено, что долгосрочные колебания значений валового сбора и урожайности хлопка, табака и сахарной свеклы сформировались под влиянием различных факторов. Это является подтверждением того факта, что для этих культур изменчивость ежегодных валовых сборов и их урожайность не соответствуют друг другу. То есть утверждение "выращивается больше урожая, собирается больше урожая и наоборот" несправедливо по отношению к этим культурам.
Факторный анализ, валовой сбор, урожайность, факторная нагрузка, дисперсия
Короткий адрес: https://sciup.org/170205943
IDR: 170205943 | DOI: 10.24412/2411-0450-2024-8-108-112
Текст научной статьи Статистический анализ многолетних значений показателей валового сбора и урожайности сельскохозяйственных культур в Республике Казахстан
При подготовке этой статьи мы проанализировали данные о годовом валовом сборе (в тысячах тонн) и показатели урожайности (в центнерах с гектара) следующих сельскохозяйственных культур: зерновые (включая рис) и бобовые; семена подсолнечника; хлопок; сахарная свекла; табак; картофель; овощи открытого грунта. Были обработаны многолетние данные о валовом сборе и урожайности вышеуказанных культур в Республике Казахстан за 33 года (с 1991 по 2023 год), взятые из открытого источника [1]. Факторный анализ проводился с использованием программного комплекса STATISTICA версии 10.
Как известно, факторный анализ используется для изучения скрытой части причинно-следственных связей между показателями [2]. При использовании этого метода наиболее узким местом является вопрос о количестве учитываемых факторов. Для рационального выбора количества факторов в большинстве случаев ис- пользуется критерий Кайзера [2]. Кратко изложим суть критерия Кайзера: если фактор не выделяет дисперсию, эквивалентную дисперсии хотя бы одного показателя, то его можно не рассматривать.
Из анализа литературы мы выяснили, что есть работа [3], которая посвящена теме нашего исследования. В данной статье анализируются показатели валового сбора основных сельскохозяйственных культур и их урожайности в сочетании с данными о ВВП аграрного сектора в целом и по отраслям растениеводства и животноводства (с использованием метода факторного анализа). Также была изучена взаимосвязь между валовым сбором сельскохозяйственных культур и их урожайностью с выявленными факторами, но названные группы данных не рассматривались в совокупности [3]. Поэтому возникает вопрос, какова статистическая взаимозависимость между показателями валового сбора сельскохозяйственных культур и их урожайно- стью. Другими словами, такое исследование дало бы ответ на вопрос "все, что было выращено, собрано или нет".
Результаты исследования . Компьютерная программа STATISTICA выводит матрицу факторных нагрузок, которая представляет собой матрицу коэффициентов корреляции между анализируемыми показателями и факторами, выявленными в ходе исследования. Для улучшения структуры факторных нагрузок мы использовали метод ортогонального вращения – varimax исходного пространства.
Если мы возведем в квадрат факторные нагрузки (коэффициенты корреляции), то получим матрицу общих дисперсий пока- зателей и факторов, другими словами, общность между показателями и факторами (в долях единицы). Для удобства анализа вклад каждого фактора и каждого показателя в общую дисперсию был представлен в процентах.
Согласно методики факторного анализа, вклад каждого фактора в общую дисперсию считается равным единице. Тогда общая дисперсия равна количеству показателей, в нашем случае 14-и единицам.
В таблице 1 приведены результаты факторного анализа, в котором учитываются 4 фактора (сумма общих дисперсий всех показателей от 5-го фактора меньше единицы).
Таблица 1. Результаты факторного анализа по схеме «все показатели + 4 фактора»
Показатели |
Общие дисперсии в долях единицы |
Сумма общих дисперсий показателя |
Вклад показателя в общую дисперсию, % |
|||
Фактор 1 |
Фактор 2 |
Фактор 3 |
Фактор 4 |
|||
Валовый сбор: |
||||||
зерновых культур |
0.05 |
0.01 |
0.82 |
0.10 |
0.98 |
7.01 |
семян подсолнечника |
0.90 |
0.03 |
0.02 |
0.00 |
0.95 |
6.77 |
хлопка |
0.17 |
0.70 |
0.03 |
0.00 |
0.90 |
6.42 |
свеклы сахарной |
0.01 |
0.00 |
0.02 |
0.95 |
0.98 |
6.99 |
табака |
0.14 |
0.77 |
0.01 |
0.01 |
0.92 |
6.58 |
картофеля |
0.83 |
0.02 |
0.11 |
0.00 |
0.96 |
6.88 |
овощей из открытого грунта |
0.92 |
0.00 |
0.04 |
0.02 |
0.99 |
7.04 |
Урожайность: |
||||||
зерновых культур |
0.13 |
0.03 |
0.79 |
0.01 |
0.96 |
6.83 |
семян подсолнечника |
0.92 |
0.00 |
0.01 |
0.01 |
0.94 |
6.69 |
хлопка |
0.70 |
0.00 |
0.03 |
0.02 |
0.76 |
5.43 |
свеклы сахарной |
0.86 |
0.02 |
0.04 |
0.00 |
0.92 |
6.57 |
табака |
0.88 |
0.00 |
0.03 |
0.01 |
0.92 |
6.58 |
картофеля |
0.85 |
0.00 |
0.11 |
0.02 |
0.98 |
7.01 |
овощей из открытого грунта |
0.82 |
0.01 |
0.08 |
0.06 |
0.96 |
6.89 |
Сумма общих дисперсий от фактора |
8.18 |
1.61 |
2.13 |
1.20 |
13.12 |
|
Вклад фактора в общую дисперсию, % |
58.45 |
11.48 |
15.22 |
8.54 |
93.69 |
Источник: Результаты факторного анализа, проведенного авторами статьи путем обработки первичной информации из [1] в компьютерной программе STATISTICA.
Выявляя наличие или отсутствие идентичности в природе общих дисперсий показателей валового сбора и урожайности, можно проверить выполнение или невыполнение очевидного утверждения "выращивается больше урожая, собирается больше урожая и наоборот».
Колебания многолетних значений валового сбора зерновых культур и их урожайности зависят практически от одних и тех же условий. Факторный анализ предполагает, что общая дисперсия каждого показателя равна единице, тогда 0,82 и 0,79 доли, или 82% и 79% единичных общих дисперсий валового сбора и урожайности зерновых культур, идентичны. На основе тождественности общих дисперсий валового сбора и урожайности зерновых культур (на них значимо влияет один и тот же фактор), можно сделать вывод, что практически всегда был собран весь выращенный объем зерновых культур. Фактор, регулирующий общую дисперсию показателей валового сбора и урожайности зерновых культур (фактор 3), вообще не связан с другими сельскохозяйственными культурами.
Общий характер различий между группами показателей "валовой сбор" и "урожайность" также был выявлен для следующих сельскохозяйственных культур: семена подсолнечника ( 0.90 и 0.92 долей единичных дисперсий), картофель ( 0.83 и 0.85 долей единичных дисперсий), овощи из открытого грунта ( 0.92 и 0.82 долей единичных дисперсий) «управляются» фактором 1.
Теперь о другом. Нет ничего общего (в статистическом смысле) в характере различий между группами показателей "валовой сбор" и "урожайность" по следующим культурам:
– хлопок, 0.70 доли единичной общей дисперсии валового сбора хлопка (или 70% ) "контролируется" фактором 2, в то время как та же часть ( 0.70 доли или 70% ) единичной общей дисперсии урожайности хлопка "зависит" от фактора 1;
– табак, 0.77 доли единичной общей дисперсии (или 77% ) валового сбора табака "контролируется" фактором 2, в то время как 0.88 доли (или 88% ) единичной общей дисперсии урожайности табака "зависит" от фактора 1;
– сахарная свекла, 0.95 доли единичной общей дисперсии (или 95% ) валового сбора сахарной свеклы "контролируется" фактором 4, в то время как 0.86 доли (или 86% ) единичной общей дисперсии урожайности сахарной свеклы "зависит" от фактора 1.
Таким образом, что долгосрочные колебания значений валового сбора и урожайности хлопка, табака и сахарной свеклы сформировались под влиянием различных факторов. Это является подтверждением того факта, что для этих культур изменчивость ежегодных валовых сборов и их урожайность не соответствуют друг другу. То есть утверждение "выращивается больше урожая, собирается больше урожая и наоборот" несправедливо по отношению к этим культурам.
Для получения полной картины каждая группа показателей (валовой сбор сельскохозяйственных культур и их урожайность) была проанализирована независимо друг от друга. В таблице 2 представлены результаты факторного анализа показателей валового сбора сельскохозяйственных культур в сочетании с 4-мя факторами. Таблица 3 состоит из результатов факторного анализа показателей урожайности сельскохозяйственных культур, в данной ситуации сделан вывод о статистической достаточности только 3-х факторов.
Таблица 2. Результаты факторного анализа по схеме «показатели валового сбора + 4 фактора»
Показатели валового сбора : |
Общие дисперсии в долях единицы |
Сумма общих дисперсий показателя |
Вклад показателя в общую дисперсию, % |
|||
Фактор 1 |
Фактор 2 |
Фактор 3 |
Фактор 4 |
|||
зерновых культур |
0.07 |
0.00 |
0.06 |
0.86 |
0.99 |
14.18 |
семян подсолнечника |
0.95 |
0.00 |
0.00 |
0.01 |
0.96 |
13.69 |
хлопка |
0.10 |
0.81 |
0.01 |
0.02 |
0.93 |
13.33 |
свеклы сахарной |
0.00 |
0.00 |
0.95 |
0.04 |
1.00 |
14.27 |
табака |
0.23 |
0.65 |
0.00 |
0.03 |
0.92 |
13.13 |
картофеля |
0.87 |
0.00 |
0.00 |
0.11 |
0.98 |
13.95 |
овощей из открытого грунта |
0.93 |
0.00 |
0.02 |
0.02 |
0.98 |
14.01 |
Сумма общих дисперсий от фактора |
3.16 |
1.48 |
1.04 |
1.09 |
6.76 |
|
Вклад фактора в общую дисперсию, % |
45.10 |
21.08 |
14.84 |
15.54 |
96.56 |
Источник: Результаты факторного анализа, проведенного авторами статьи путем обработки первичной информации из [1] в компьютерной программе STATISTICA.
Интерпретация содержимого таблицы 2. Колебания из года в год показателя валового сбора зерновых культур объясняются некоторыми закономерностями (фактор 4), которые характерны только для данной сельскохозяйственной культуры ( 0.86 доли или 86% единичной общей дисперсии показателя приходится на данный фактор).
Подобный вывод можно сделать и в отношении свеклы сахарной ( 0.95 доли или 95% единичной общей дисперсии показателя валового сбора сельскохозяйственной культуры приходится на фактор 3).
Колебания показателей валового сбора хлопка и табака взаимно идентичны ( 0.81 доли или 81% единичной общей дисперсии валового сбора хлопка и 0.65 доли или 65% единичной общей дисперсии валового сбора табака «объясняются» фактором 2).
Показателей валового сбора семян подсолнечника, картофеля и овощей из открытого грунта «объединяет» фактор 1, что подтверждаются соответствующими значениями единичных общих дисперсий ( 0.95 доли или 95% , 0.87 доли или 87% , 0.93 доли или 93% ).
Таблица 3. Результаты факторного анализа по схеме «показатели урожайности + 3 фак- тора»
Показатели урожайности : |
Общие дисперсии в долях единицы |
Сумма общих дисперсий показателя |
Вклад показателя в общую дисперсию, % |
||
Фактор 1 |
Фактор 2 |
Фактор 3 |
|||
зерновых культур |
0.07 |
0.90 |
0.02 |
0.99 |
14.21 |
семян подсолнечника |
0.72 |
0.04 |
0.18 |
0.93 |
13.29 |
хлопка |
0.20 |
0.03 |
0.76 |
1.00 |
14.25 |
свеклы сахарной |
0.74 |
0.08 |
0.12 |
0.94 |
13.46 |
табака |
0.80 |
0.07 |
0.10 |
0.96 |
13.73 |
картофеля |
0.61 |
0.15 |
0.20 |
0.96 |
13.78 |
овощей из открытого грунта |
0.66 |
0.12 |
0.14 |
0.92 |
13.20 |
Сумма общих дисперсий от фактора |
3.80 |
1.39 |
1.53 |
6.71 |
|
Вклад фактора в общую дисперсию, % |
54.23 |
19.84 |
21.85 |
95.91 |
Источник: Результаты факторного анализа, проведенного авторами статьи путем обработки первичной информации из [1] в компьютерной программе STATISTICA.
Что касается наличия статистической общности между показателями урожайности с/х культур, то здесь картина следующая.
Изменчивость урожайности зерновых культур уникальна (фактор 2), 0.90 доли или 90% единичной общей дисперсии показателя не связаны ничем, кроме данного фактора. Такой вывод можно сделать и в отношении урожайности хлопка: 0.76 доли или 76% единичной общей дисперсии показателя связаны только с фактором 3.
Показателей урожайности большинства сельскохозяйственных культур (семян подсолнечника, свеклы сахарной, табака, картофеля, овощей из открытого грунта) «объединяют» только фактор 1. Подтверждением вывода являются следующие значения: 0.72 доли или 72%, 0.74 доли или 74%, 0.80 доли или 80%, 0.61 доли или 61%, 0.66 доли или 66% единичных общих дисперсий перечисленных показателей.
Показатели урожайности большинства сельскохозяйственных культур (семена подсолнечника, сахарная свекла, табак, картофель, овощи из открытого грунта) "связаны" только с фактором 1. Следующие значения единичных общих дисперсий подтверждают этот вывод: 0.72 доли, или 72% , 0.74 доли, или 74% , 0.80 доли, или 80% , 0.61 доли, или 61% , 0.66 доли, или 66% .
Заключение .
Колебания многолетних значений валового сбора зерновых культур и их урожайности зависят практически от одних и тех же условий. Факторный анализ пока- зал, что до 82% и 79% единичных общих дисперсий валового сбора и урожайности зерновых культур, идентичны. На основе тождественности общих дисперсий валового сбора и урожайности зерновых культур (на них значимо влияет один и тот же фактор), можно сделать вывод, что практически всегда был собран весь выращенный объем зерновых культур. Фактор, регулирующий общую дисперсию показателей валового сбора и урожайности зерновых культур, вообще не связан с другими сельскохозяйственными культурами.
Было установлено, что долгосрочные колебания значений валового сбора и урожайности хлопка, табака и сахарной свеклы сформировались под влиянием различных факторов. Это является подтверждением того факта, что для этих культур изменчивость ежегодных валовых сборов и их урожайность не соответствуют друг другу. То есть утверждение "выращивается больше урожая, собирается больше урожая и наоборот" несправедливо по отношению к этим культурам.
Список литературы Статистический анализ многолетних значений показателей валового сбора и урожайности сельскохозяйственных культур в Республике Казахстан
- Основные социально-экономические показатели Республики Казахстан за 1991-2023 гг. Бюро национальной статистики Агентства по стратегическому планированию и реформам Республики Казахстан. - [Электронный ресурс]. - Режим доступа: https://stat.gov.kz/(дата обращения: 01.07.2024).
- Электронный учебник по статистике StatSoft. Главные компоненты и факторный анализ. - [Электронный ресурс]. - Режим доступа: http://www.statsoft.ru/home/textbook/modules/stfacan.html/ (дата обращения: 10.07.2024).
- Nurpeisova A.A., Niyazbekova Sh.U., Dagmirzaev O.A. and others. Statistical analysis of variability of data of the agrarian sector of Kazakhstan economy // Bulletin of National academy of sciences of the Republic of Kazakhstan. - 2020. - Vol. 4, № 386. - P. 165-172. - ISSN 1991-3494. EDN: BRJZTK