Применение методов data mining для оценки эффективности деятельности высших образовательных организаций Приволжского федерального округа
Автор: Мамилова А.М.
Журнал: Экономика и социум @ekonomika-socium
Рубрика: Социально-экономические аспекты развития современного государства
Статья в выпуске: 8 (63), 2019 года.
Бесплатный доступ
Оценка эффективности деятельности образовательных учреждений Приволжского федерального округа на основе методов data mining.
Факторный анализ, регрессионный анализ, кластерный анализ, приволжский федеральный округ, матрица компонентов
Короткий адрес: https://sciup.org/140242124
IDR: 140242124
Текст научной статьи Применение методов data mining для оценки эффективности деятельности высших образовательных организаций Приволжского федерального округа
Актуальность исследования в области глубинного анализа данных (data mining) заключается в том, что данная область одна из самых востребованных в мире. Data mining является своеобразной основой с помощью которой можно воздействовать и развивать различные сферы человеческой деятельности.
В своей работе я хотела бы исследовать применение методов Data Mining для оценки эффективности деятельности образовательных организаций высшего образования в субъекте Российской Федерации, на примере Приволжского федерального округа.
В ходе данного исследования, мною были проведены факторный, кластерный и регрессионный анализы.
Факторный анализ я провела с помощью статистической программы SPSS. В качестве вывода мы получили перевернутую матрицу компонентов. В каждой из строк данной матрицы имеется факторная нагрузка с абсолютным значением. На основе данного анализа данных было определено, к какой образовательной деятельности относится каждый из восьми полученных факторов.
Для проведения кластерного анализа мы использовали выделенные при факторном анализе компоненты, такие как: научно-образовательная деятельность, финансовая деятельность, деятельность по формированию творческого потенциала, учебно-методическая деятельность, деятельность по формированию контингента иностранных обучающихся, деятельность по формированию базы кадров высшей квалификации, деятельность по формированию контингента целевых обучающихся, направления «Инженерное дело, технологии и технические науки», «Здравоохранение и мед.науки», «Образование и пед.науки», доход от научной деятельности.
Результатом стала диаграмма конечных центров, которую я рассмотрела ниже:
Диаграмма конечных центров

^^^^^^ Конечные центры кластеров ^^^мКонечные центры кластеров
« ■■■ мам»Конечные центры кластеров Конечные центры кластеров
« ■■ ммв» Конечные центры кластеров ^^^^^мКонечные центры кластеров
Самым важным является первый кластер, куда вошел Казанский (Приволжский) Федеральный университет. В данном ВУЗе наибольшее значение имеет научно-исследовательская деятельность. Значение данного показателя равно 619,07, при установленном пороговом значении 70,1. Это означает, что КФУ делает большой акцент на данную отрасль. Большое значение также имеет международная деятельность, которая заключается в формировании и привлечении иностранного контингента. Данный ВУЗ является флагманом в образовательной деятельности Приволжского Федерального округа.
Далее мною был проведен регрессионный анализ, для реализации которого я проверила распределение значений исследуемых факторов на нормальной закон. Исследовать значения на соответствие нормальному закону можно с помощью теста Колмогорова-Смирнова, который так же проводится с помощью статистической программы SPSS.
Итоги по проверке гипотезы |
||||
Нулевая гипотеза |
Критерий |
Знач. |
Решен И' |
|
1 |
Распределение REGR factor score 1 for analysis 1 является рааюмерным с минимумом равным -0 10505 и максимином равным 0.442. |
Одновыборочный критерий Колмогорова- Смирнова |
и12 |
Нулевая гипотеза отклоняете? |
2 |
Распределение REGR factor score 2 for analysis 1 является рааюмерным с минимумом равным 0.00629 и максимумом равным 1.016. |
Одновыборочный критерий Колмогорова- Смирнова |
.20 О’2 |
Нулевая гипотеза принимаете |
3 |
Распределение REGR factor score 3 for analysis 1 является рааюмерным с минимумом равным -0 09345 и максимумом равным 0.346. |
Одновыборочный фитерий Колмогорова- Смирнова |
О12 |
Нулевая гипотеза отклоняете? |
4 |
Распределение REGR factor score 4 for analysis 1 является рааюмерным с минимумом равным -0.00037 и максимумом равным 1.013. |
Одновыборочный фитерий Колмогорова- Смирнова |
о12 |
Нулевая гипотеза отклоняете? |
5 |
Распределение REGR factor score 5 for analysis 1 является рааюмерным с минимумом равным 0.01631 и максимумом равным 1.013. |
Одновыборочный фитерий Колмогорова- Смирнова |
о12 |
Нулевая гипотеза отклоняете? |
6 |
Распределение REGR factor score 6 for analysis 1 является рааюмерным с минимумом равным 0.09390 и максимумом равным 0.472. |
Одновыборочный фитерий Колмогорова- Смирнова |
о12 |
Нулевая гипотеза отклоняете? |
7 |
Распределение REGR factor score 7 for analysis 1 является рааюмерным с минимумом равным 0.01230 и максимумом равным 1.012. |
Одновыборочный фитерий Колмогорова- Смирнова |
о12 |
Нулевая гипотеза отклоняете? |
В 1 |
Распределение REGR factor score 8 for analysis 1 является рааюмерным с минимумом равным -0.00431 и максимумом равным 1.017. |
Одновыборочный фитерий Колмогорова- Смирнова |
о12 |
Нулевая гипотеза отклоняете? ■ |
Выводятся асимптотические значимости. Уровень значимости равен .05. |
||||
1 Исправленная Лиллиефорса |
||||
2Это нижняя граница истинной значимости. |
Как видно из таблицы полученной в ходе расчетов в статистической программе SPSS, мы видим, фактор 2 имеет значение р = 0,2 (>0.05), но данная вероятность ошибки не является значимой; поэтому значения переменной достаточно хорошо подчиняются нормальному распределению и можно применять параметрические тесты и множественный корреляционнорегрессионный анализ.
На основе проведенного анализа был выбран значимый показатель (Доходы вуза от всех источников), а также незначимые показатели, которые включают в себя остальные компоненты.
Коэффициенты'1
При увеличении 3 компоненты (Деятельность по формированию контингента целевых обучающихся., направления «Инженерное дело, технологии и технические науки», «Здравоохранение и мед.науки», «Образование и пед.науки») на 1% (доходы вуза от всех источников) уменьшится на 0,35, так как студенты обучающиеся по договорам оплаты являются одним из главных источников дохода университета. Следовательно, чем больше целевых обучающихся, тем меньше дохода для вуза.
При увеличении 6 компоненты (финансовая деятельность) на 1% (Доходы вуза от всех источников) увеличится на 0,25.
При увеличении 2 компоненты (Деятельность по формированию контингента иностранных обучающихся) на 1 % (Доходы вуза от всех источников) уменьшится на 0,24.
Главной деятельность вуза является научно-методическая работа. Но при увеличении образовательной деятельности в вузах, преподавателям сложно заниматься наукой и публикационной деятельностью. Это ведет к сокращению различных научных исследований, что негативно влияет на образование всего округа в целом.
Из всего вышесказанного можно сделать вывод, что доходы вуза увеличиваются, когда увеличивается финансовая деятельность, в свою очередь данные доходы уменьшаются с увеличением количества бюджетных мест в вузе.
Список литературы Применение методов data mining для оценки эффективности деятельности высших образовательных организаций Приволжского федерального округа
- Мхитарян, С. В. SPSS в маркетинговых проектах [Электронный ресурс] : учебное пособие / С. В. Мхитарян. - Электрон. текстовые данные. - М. : Евразийский открытый институт, 2011. - 174 c. - 978-5-374-00315-4. - Режим доступа: http://www.iprbookshop.ru/11054.html
- Чубукова, И. А. Data Mining [Электронный ресурс] / И. А. Чубукова. - Электрон. текстовые данные. - М. : Интернет-Университет Информационных Технологий (ИНТУИТ), 2016. - 470 c. - 978-5-94774-819-2. - Режим доступа: http://www.iprbookshop.ru/56315.html