Результаты изучения закономерностей в массиве экономических данных методами многомерного статистического анализа
Автор: Айдаркызы Сания
Журнал: Экономика и бизнес: теория и практика @economyandbusiness
Статья в выпуске: 9 (91), 2022 года.
Бесплатный доступ
В статье представлены результаты изучения закономерностей в массиве экономических данных, полученных с помощью множественного регрессионного анализа и факторного анализа. Результаты множественного регрессионного анализа данных были взяты из ранее опубликованной статьи, которую мы выбрали среди множества подобных работ. Затем был проведен факторный анализ с использованием того же набора исходных данных, который был использован автором упомянутой статьи для проведения множественного корреляционного анализа. Выяснилось, что факторный анализ и множественный регрессионный анализ дают практически идентичные результаты практически по всем позициям. В статье отмечается, что в факторном анализе (в отличие от регрессионного анализа) отсутствует понятие "результирующий показатель", т.е. все переменные имеют одинаковый статус.
Факторный анализ, множественный регрессионный анализ, выделенные факторы, коэффициент корреляции, факторные нагрузки
Короткий адрес: https://sciup.org/170195430
IDR: 170195430 | DOI: 10.24412/2411-0450-2022-9-6-10
Текст научной статьи Результаты изучения закономерностей в массиве экономических данных методами многомерного статистического анализа
Установление факта наличия или отсутствия статистической общности между распределениями совокупности значений показателей является предметом исследования факторного анализа, который является одним из методов многомерного статистического анализа [1, 2].
Приступая к факторному анализу, необходимо исходить из того, что в исследуемой области существуют какие-то закономерности. Факторный анализ обладает способностью выявлять логическую структуру сложного явления с одновременным выявлением взаимозависимых и независимых признаков. Основное предположение факторного анализа состоит в том, что явления в определенной области исследований, несмотря на их неоднородность и изменчивость, могут быть описаны относительно небольшим числом параметров, называемых факторами.
Для того, чтобы успешно применять факторный анализ в исследованиях, мы должны обладать базовыми знаниями, прежде всего, по корреляционному и регрессионному анализу.
Проанализируем современный опыт использования факторного анализа для про- ведения исследований в области экономики (по данным научной электронной библиотеки eLIBRARY.RU). Статья [3] посвящена выявлению статистической общности между распределениями среднемноголетних региональных значений показателей экономики Казахстана. В другой работе [4] приводятся статистические взаимосвязи между распределениями многолетних значений экономических показателей страны, но без учета влияния регионов. В обоих случаях, в качестве основного метода исследования использовался факторный анализ.
Целью данной статьи является сравнение результатов факторного анализа и множественного регрессионного анализа, выполненных по отношению к одному и тому же массиву экономических данных. Работа проводилась в соответствии со следующей методологией:
-
а) выбор ранее опубликованной работы (статьи) с готовыми результатами, которые были получены с помощью множественного регрессионного анализа;
-
б) факторный анализ с использованием того же набора исходных данных, в отношении которого был проведен множе-
- ственный регрессионный анализ (в выбранной работе);
-
в) сравнительный анализ полученных результатов.
Из множества опубликованных работ с использованием множественного регрессионного анализа мы выбрали статью Еремичевой О.Ю. «Многофакторный анализ изменения трудовых ресурсов в условиях инновационного развития Самарского региона», опубликованную в коллективной монографии [5, с. 132-150].
Кратко проанализируем постановку задачи, сформулированную и решенную автором статьи [5]. Обоснована необходимость построения аналитической и прогнозной модели экономики Самарской области Российской Федерации с использованием многофакторного корреляционнорегрессионного анализа.
В работе для построения уравнения регрессии использовались следующие пере- менные: Y – среднегодовая численность занятых (результирующий показатель); Х1 – количество безработных с высшим образованием; Х2 – количество безработных с базовым общим образованием; Х3 – численность безработных со средним профессиональным образованием; Х4 – внутренний региональный продукт; Х5 – численность безработных; Х6 – среднемесячный денежный доход на душу населения; Х7 – численность занятых на предприятиях с государственной собственностью; Х8 – численность занятых на предприятиях с частной собственностью [5, с. 142].
Ниже приведена сводная матрица показателей (табл. 1), построенная на основе данных статистической отчетности Самарской области за период с 2003 года по 2012 год, т.е. за 10 лет [5, с. 143]. В матрице показателей значения всех показателей представлены в относительных единицах, т.е. в процентах к предыдущему году.
Таблица 1. Матрица исходных данных
Годы |
Y |
Х 1 |
Х 2 |
Х 3 |
Х 4 |
Х 5 |
Х 6 |
Х 7 |
Х 8 |
2003 |
104,5 |
90,8 |
108,6 |
57,5 |
104,8 |
92,4 |
135,3 |
100,5 |
102,8 |
2004 |
101,4 |
182,1 |
54,9 |
103,2 |
108,7 |
127,3 |
123,5 |
104,1 |
103,5 |
2005 |
100,7 |
96,5 |
187,1 |
81,3 |
101,7 |
89,8 |
129,8 |
93,4 |
101,5 |
2006 |
99,6 |
108,1 |
117,2 |
88,5 |
106,4 |
81,8 |
122,9 |
101,8 |
103,3 |
2007 |
100,8 |
49,3 |
105,9 |
131,7 |
108,1 |
110,7 |
121 |
102,3 |
100,7 |
2008 |
99,9 |
124,7 |
62,5 |
92,5 |
103,8 |
90,7 |
112,9 |
100,7 |
100,8 |
2009 |
95,8 |
245,1 |
70,0 |
141,8 |
80,4 |
243,1 |
115,8 |
99,0 |
95,1 |
2010 |
98,9 |
69,5 |
131,7 |
79,1 |
108,5 |
59,9 |
112,2 |
99,7 |
102,1 |
2011 |
99,7 |
109 |
62,7 |
14,5 |
105,9 |
70,1 |
107,6 |
98,9 |
100,8 |
2012 |
100,2 |
102,4 |
163,5 |
100,0 |
105,0 |
71,4 |
113,5 |
113,1 |
102,6 |
Методом пошагового анализа из рассмотрения исключены переменные, не являющиеся определяющими для результирующего показателя [5, с. 144]: Х 1 – численность безработных с высшим образованием; Х 4 – внутренний региональный продукт; Х 5 – численность безработных. Уравнение регрессии, предложенное в статье, имеет вид [5, с. 146]:
Y = 42,30031 - 0,00757X 2 - 0,02357X 3 + 0,178326X 6 + 0,122259X 7 + 0,267083X 8 .
Мы приводим в сокращенном виде результаты множественного регрессионного анализа [5, с. 146]:
-
1) существует небольшой спрос на работников, имеющих только базовое общее (школьное) образование;
-
2) существует устойчивый спрос на работников со средним профессиональным образованием;
-
3) увеличение среднемесячного денежного дохода на душу населения приводит к значительному увеличению числа занятых работников (на 17,8%).
-
4) увеличение численности занятых на предприятиях с государственной собственностью приведет к изменению средней численности занятых работников (на 12,2%);
-
5) увеличение численности занятых работников на предприятиях с частной собственностью приведет к увеличению средней численности занятых работников (на 26,7%).
Для проведения факторного анализа мы использовали данные, приведенные в таблице 1. Необходимые расчеты были выполнены с использованием пакета компьютерных программ STATISTICA 10 [6].
Компьютерная программа выводит матрицу факторных нагрузок, состоящую из коэффициентов корреляции между изучаемыми переменными и выбранными (учтенными) факторами. Наиболее узким местом такого типа статистического анализа является вопрос о количестве выбранных факторов. Многие исследователи рекомендуют использовать критерий Кайзера для рационального выбора количества факторов [7]: если фактор не выделяет дисперсию, эквивалентную хотя бы дисперсии одной переменной, то его нельзя рассматривать.
Мы следуем рекомендациям в соответствии с критерием Кайзера, т.е. количество выбранных факторов будет равно четырем. Для удобства анализа доли выбранных факторов в общей дисперсии пере- менных была показана в процентах. Для улучшения структуры факторных нагрузок использован метод ортогонального метода вращения, называемый «варимакс исходного пространства».
В таблице 2 приведены результаты проведенного факторного анализа. Важный момент: в факторном анализе (в отличие от регрессионного анализа) все переменные имеют одинаковый статус. Тем не менее, для удобства анализа были сохранены ранее использовавшиеся обозначения переменных (Y, X 1 , X 2 , X 3 , X 4 , X 5 , X 6 , X 7 , X 8 ).
Выбранные четыре фактора «ответственны» за 91,6% общей дисперсии всех девяти переменных. Первый фактор имеет максимальную долю в общей дисперсии переменных (44%). На второй фактор приходится около 19% общей дисперсии. Влияние третьего и четвертого факторов в структуре общей дисперсии переменных составляет около 14%.
Таблица 2. Результаты факторного анализа
Переменные |
Факторные нагрузки |
Итого |
|||
Фактор 1 |
Фактор 2 |
Фактор 3 |
Фактор 4 |
||
Y |
0,61 |
0,74 |
0,06 |
0,05 |
|
Х 1 |
-0,75 |
-0,06 |
0,04 |
0,51 |
|
Х 2 |
0,15 |
0,15 |
0,01 |
-0,94 |
|
Х 3 |
-0,74 |
0,08 |
0,49 |
-0,21 |
|
Х 4 |
0,92 |
0,15 |
0,21 |
-0,05 |
|
Х 5 |
-0,95 |
0,05 |
-0,01 |
0,27 |
|
Х 6 |
-0,05 |
0,97 |
-0,14 |
-0,18 |
|
Х 7 |
0,15 |
-0,12 |
0,94 |
0,03 |
|
Х 8 |
0,82 |
0,38 |
0,28 |
-0,09 |
|
Общая дисперсия |
3,97 |
1,70 |
1,27 |
1,31 |
8,25 |
Доля общей дисперсии, % |
44,06% |
18,91% |
14,11% |
14,56% |
91,6 |
Была сформирована таблица 3, которая содержит только выбранные факторы и переменные со значимыми коэффициентами корреляции.
Таблица 3. Результаты факторного анализа в сжатой форме
Фактор 1 |
Y (0,61) |
Х 1 (-0,75) |
Х 3 (-0,74) |
Х 4 (0,92) |
Х 5 (-0,95) |
Х 8 (0,82) |
Фактор 2 |
Y (0,74) |
Х 6 (0,97) |
||||
Фактор 3 |
Х 7 (0,94) |
|||||
Фактор 4 |
Х 2 (-0,94) |
Изменчивость переменной Y (среднегодовое число занятых работников) связана с двумя факторами: в меньшей степени с первым фактором (коэффициент корреля- ции R=0,61), в большей степени со вторым фактором (R=0,74).
Следующие переменные имеют тесную корреляцию с первым фактором: X 1 (число безработных с высшим образованием); X 3
(число безработных со средним профессиональным образованием); X 4 (внутренний региональный продукт); X 5 (число безработных); X 8 (число занятых на предприятиях с частной собственностью).
Что касается влияния второго фактора, то можно отметить (в дополнение к переменной Y с коэффициентом корреляции 0,74) переменную X 6 (среднемесячный денежный доход на душу населения).
Третий и четвертый факторы влияют на изменчивость только одной переменной: Х 7 (число занятых на государственных предприятиях) и Х 2 (число безработных со школьным образованием) соответственно.
Попробуем интерпретировать полученные результаты факторного анализа простым языком.
Первый фактор, влияющий на статистическую изменчивость многих переменных, может быть связан с экономической политикой по созданию новых рабочих мест. При создании новых рабочих мест число безработных с квалификацией (с высшим образованием и со средним профессиональным образованием) фактически сокращается. Причем, новые рабочие места преимущественно создаются на предприятиях с частной собственностью.
Второй фактор связан с изменчивостью денежных доходов населения. Создание новых рабочих мест существенно влияет,
Третий и четвертый факторы имеют значимые коэффициенты корреляции только с одной переменной в отдельности. Это означает, что нет статистической общности между изменчивостью этих двух переменных с аналогичными характеристиками всех других переменных. Т.е., экономическая политика по созданию новых рабочих мест за анализируемый период времени не была направлена на улучшение ситуации с занятостью в двух областях:
-
а) на государственных предприятиях;
-
б) с безработными людьми только со школьным образованием.
Выводы . Попробуем сравнить полученные результаты. Почти по всем позициям у факторного анализа и множественного регрессионного анализа одинаковые результаты. Например: а) на рынке труда региона существует спрос на работников с квалификацией (с высшим образованием и со средним специальным образованием); б) проблемы с трудоустройством для людей, имеющих только школьное образование; в) взаимосвязь между созданием новых рабочих мест и ростом денежного дохода на душу населения. Выводы об отсутствии зависимости показателя занятости на государственных предприятиях от других параметров рынка труда также идентичны.
прежде всего, на рост денежных доходов на душу населения (и наоборот).
Список литературы Результаты изучения закономерностей в массиве экономических данных методами многомерного статистического анализа
- Иберла К. Факторный анализ / Пер. с нем. В.М. Ивановой. - М.: "Статистика", 1980. - 398 с.
- Лоули Д., Максвелл А. Факторный анализ как статистический метод / Пер. с англ. Ю.Н. Благовещенского. - М.: "Мир", 1967. - 144 с.
- Дагмирзаев О.А. Статистический анализ изменчивости региональных показателей реального сектора экономики Казахстана // Экономика и предпринимательство. - 2022. - №1 (138). - С. 629-634.
- Дагмирзаев О.А. Эмпирическое исследование взаимосвязи показателей реального сектора экономики Казахстана // Экономика и бизнес: теория и практика. - 2022. - № 5-1 (87). - С. 208-214.
- Еремичева О.Ю. Многофакторный анализ изменения трудовых ресурсов в условиях инновационного развития Самарского региона // Коллективная монография "Реальный сектор экономики России: стратегии управления, инвестиции и инновации". - М.: Изд-во "Перо", 2016. - С. 132-150. 978-5-906871-33-6.
- ISBN: 978-5-906871-33-6 EDN: WPOISR
- Новые возможности STATISTICA. - [Электронный ресурс]. - Режим доступа: http://statsoft.ru/products/new-features/STATISTICA10.php (дата обращения: 10.09.2022).
- Kaiser, H.F. (1960). The application of electronic computers to Factor Analysis // Educational an Psychological Measurement. - 1960. - №20. - С. 141-151.