Построение хранилища данных для последующего интеллектуального анализа данных
Автор: Чухаев Константин Александрович
Рубрика: Информатика и вычислительная техника
Статья в выпуске: 3, 2016 года.
Бесплатный доступ
В статье рассмотрены перечень данных, пригодных для анализа успеваемости студентов, а также выбранные таблицы на примере внутренней базы данных университета; выполнены построение запроса на основе выбранных таблиц, проверка полученного результата и анализ полученных результатов. Впоследствии полученные результаты будут использованы для построения хранилища данных и интеллектуального анализа.
Хранилища данных (хд), интеллектуальный анализ данных (иад), урис, балльно-рейтинговая система, универсальная рейтинговая информационная система, оценка качества образования вуза, оценка эффективности пары преподаватель - студент, экспериментальный образец универсальной информационной рейтинговой системы
Короткий адрес: https://sciup.org/148160338
IDR: 148160338
Текст научной статьи Построение хранилища данных для последующего интеллектуального анализа данных
2. |
Наименование факультета |
3. |
Наименование группы |
4. |
Регион вуза |
5. |
ФО вуза |
6. |
ФИО студента |
7. |
Год рождения студента |
8. |
Пол студента |
9. |
Наименование дисциплины |
10. |
Семестр изучения дисциплины |
11. |
Тип аттестации по дисциплине |
12. |
Общее время изучения дисциплины |
13. |
Общее время обучения по специальности в рамках учебного плана |
14. |
Количество часов всего по дисциплине |
15. |
Оценка по дисциплине |
ВЕСТНИК 2016
В качестве базы данных будет использована внутренняя база данных (далее – ВБД).
Задачи:
-
- поиск таблиц в ВБД, согласно перечню, перечисленному в таблице 1;
-
- создание запроса, формирующего необходимый перечень данных;
-
- проверка полученного результата.
ВБД состоит из 240 таблиц, описания струк- - tblScholasticPlan;
туры хранения и атрибутного состава не дано. - tblResult;
Было проведено исследование всех таблиц на - tblGoods;
наличие интересующих нас атрибутов. Описан- - tblExamination;
ный выше перечень данных был обнаружен в - tblCheckingType.
следующих таблицах:
-
- tblScholasticPlanResult; Пример взаимосвязи таблиц изображен на
-
- tblOrderGoodsStudent; рис. 1.
-
- tblStudent;
ВЕСТНИК 2016
Рис. 1. Взаимосвязи таблиц, необходимых для получения данных
TBLSCHOLASTICPLANRESULT – в данной таблице содержится информация об учебных планах. Перечень данных, необходимый для создания вышеописанного набора данных (далее – набор данных), перечислен в табл. 2.
TBLSTUDENT – содержит данные о студенте. Перечень данных, используемых в наборе данных, перечислен в таблице 3.
TBLGOODS – содержится информация об оценках. Перечень данных, используемых в наборе данных, перечислен в таблице 4.
Таблица 2
Перечень необходимых данных из таблицы tblScholasticPlanResult
№ п/п |
Наименование столбца |
Тип данных |
Наименование |
1. |
Hour |
INT |
Общее время по учебному плану |
2. |
Date |
DATETIME |
Дата сдачи предмета |
3. |
Semester |
INT |
Семестр изучения дисциплины |
Таблица 3
Перечень необходимых данных из таблицы tblStudent
№ п/п |
Наименование столбца |
Тип данных |
Наименование |
1. |
First Name_RU |
VAR-CHAR(50) |
Имя студента |
2. |
Middle Name_RU |
VAR-CHAR(50) |
Отчество студента |
3. |
Last Name_RU |
VAR-CHAR(50) |
Фамилия студента |
4. |
Birthday |
DATETIME |
Дата рождения |
5. |
Sex |
INT |
Пол |
Таблица 4
Перечень необходимых данных из таблицы tblGoods
№ п/п |
Наименование столбца |
Тип данных |
Наименование |
1. |
Name_RU |
VAR-CHAR(150) |
Название предмета |
TBLORDERGOODSSTUDENT – содержит информацию о зачисленных студентах, будет применяться в дальнейшем для сокращения объема выборки с улучшением ее качества.
TBLRESULT – словарь результатов. Перечень данных, используемых в наборе данных/за-просе, перечислен в таблице 5.
Таблица 5
Перечень необходимых данных из таблицы tblResult
№ п/п |
Наименование столбца |
Тип данных |
Наименование |
1. |
Value_RU |
VAR-CHAR(50) |
Оценка по предмету (словарь) |
2. |
Sign_RU |
VAR-CHAR(10) |
Сокращение оценки по предмету (словарь) |
TBLCHECKINGTYPE – словарь испытаний по предмету. Перечень данных, используемых в наборе данных, перечислен в таблице 6.
TBLEXAMINATION – содержит информацию об испытаниях по предмету, будет применяться в дальнейшем для сокращения объема выборки с улучшением ее качества.
Таблица 6
Перечень необходимых данных из таблицы tblCheckingType
№ п/п |
Наименование столбца |
Тип данных |
Наименование |
1. |
Name_RU |
VAR-CHAR(100) |
Название испытания по предмету |
TBLSCHOLASTICPLAN – содержит информацию об общем времени на обучение. Перечень данных, используемых в наборе данных, перечислен в таблице 7.
Таблица 7
Перечень необходимых данных из таблицы tblScholasticPla
№ п/п |
Наименование столбца |
Тип данных |
Наименование |
1. |
TotalHours |
INT |
Количество часов всего по дисциплине, в заданном семестре |
2. |
ClassHours |
INT |
Количество аудиторных часов |
3. |
HomeHour |
INT |
Количество часов для домашнего изучения |
ВЕСТНИК 2016
Итоговый набор данных, сопоставленный с найденными данными, перечислен в таблице 8.
Таблица 8
Итоговый набор данных
№ п/п |
Наименование столбца |
Тип хранения |
Место хранения |
1. |
Наименование вуза |
Расчетное |
– |
2. |
Наименование факультета |
Хранимое |
tblOrder-GoodsStu-dent |
3. |
Наименование группы |
Хранимое |
tblOrder-GoodsStu-dent |
4. |
Регион вуза |
Расчетное |
– |
5. |
ФО вуза |
Расчетное |
– |
6. |
ФИО студента |
Хранимое |
tblStudent |
7. |
Год рождения студента |
Хранимое |
tblStudent |
Пол студента |
Хранимое |
tblStudent |
|
Наименование дисциплины |
Хранимое |
tblGoods |
|
Семестр изучения дисциплины |
Хранимое |
tblScholas-ticPlanRe-sult |
|
Тип аттестации по дисциплине |
Хранимое |
tblChecking Type |
|
Общее время изучения дисциплины |
Расчетное |
tblScholas-ticPlan |
Общее время обучения по специальности в рамках учебного плана |
Расчетное |
tblScholas-ticPlan |
|
Количество часов всего по дисциплине |
Расчетное |
tblScholas-ticPlan |
|
Оценка по дисциплине |
Хранимое |
tblResult |
Визуальный результат созданного запроса изображен на рис. 2.
ВЕСТНИК 2016
Ю_Сутдента |
Фамилия |
Имя |
Отчество |
Часы |
Дата |
Рейтинг |
Предмет |
|
► |
21821 |
Волков |
Антон |
Игоревич |
90 |
2005-09-15 00:00:00.000 |
1 |
Отечественнс |
23934 |
Бурцев |
Виктор |
Леонидович |
90 |
2005-06-14 00:00:00.000 |
1 |
Менеджмент |
|
24033 |
Симонов |
Виктор |
Алексеевич |
90 |
2005-06-14 00:00:00.000 |
1 |
Менеджмент |
|
24052 |
Степанько |
Илья |
Анатольевич |
90 |
2005-06-14 00:00:00.000 |
1 |
Менеджмент |
|
24432 |
Аллямшина |
Альфия |
Хаммятовна |
90 |
2005-01-2100:00:00.000 |
1 |
Отечественнс |
|
24436 |
Гл аду ш |
Ирина |
Олеговна |
90 |
2005-01-21 00:00:00.000 |
1 |
Отечественнс |
|
24440 |
Душин |
Кирилл |
Владимирович |
90 |
2005-01-21 00:00:00.000 |
1 |
Отечественнс |
|
24444 |
Бушуев |
Данила |
Юрьевич |
90 |
2005-01-21 00:00:00.000 |
1 |
Отечественнс |
|
24447 |
Голденкова |
Дарья |
Игоревна |
90 |
2005-01-21 00:00:00.000 |
1 |
Отечественнс |
|
24456 |
Иванова |
Екатерина |
Александровна |
90 |
2005-01-21 00:00:00.000 |
1 |
Отечественнс |
|
24459 |
Лида ков |
Павел |
Александрович |
90 |
2005-01-21 00:00:00.000 |
1 |
Отечественнс |
|
24461 |
Замуреева |
Алина |
Сергеевна |
90 |
2005-01-21 00:00:00.000 |
1 |
Отечественнс |
|
24464 |
Захарова |
Ольга |
Сергеевна |
90 |
2005-01-2100:00:00.000 |
1 |
Отечественнс |
|
24467 |
Куликова |
Ольга |
Павловна |
90 |
2005-01-21 00:00:00.000 |
1 |
Отечественнс |
|
24471 |
Мещеряков |
Анатолий |
Викторович |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24473 |
Макунин |
Александр |
Николаевич |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24478 |
Нестерюк |
Сергей |
Валентинович |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24485 |
Намоконов |
Евгений |
Сергеевич |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24493 |
Ракова |
Наталья |
Игоревна |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24499 |
Спиридонова |
Инна |
Андреевна |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24503 |
Тыщенко |
Алла |
Николаевна |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24507 |
Ховренко |
Екатерина |
Андреевна |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24511 |
Хаустов |
Артем |
Сергеевич |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24515 |
Шкарупа |
Алексей |
Витальевич |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественнс |
|
24518 |
Щедурских |
Дмитрий |
Александрович |
90 |
2005-01-Л 00:00:00.000 |
1 |
Отечественн; |
Рис. 2. Результат работы запроса
Результат запроса будет использован для дальнейшего построения хранилища данных. При работе с полученными данными определено более 700 000 записей по 22 000 субъектов исследования.
Выводы
В статье предложена реализация ненормализованного хранилища данных для последующего интеллектуального анализа данных. В основу хранилища легла ВБД, содержащая порядка 700 000 записей по 22 000 субъектов. Полнота данных достаточна для дальнейшего изучения и применения методов кластеризации и классифи- кации и иных методов интеллектуального анализа данных.
Список литературы Построение хранилища данных для последующего интеллектуального анализа данных
- Собетов К.О. Хранилище данных универсальной рейтинговой информационной системы//T-Comm: Телекоммуникации и транспорт. -2015. -Т. 9. -№ 2. -С. 74-78.
- Собетов К.О., Брюсова В.О. Анализ студенческой успеваемости на примере кафедры информационных технологий и естественно-научных дисциплин//Решение -2014: материалы Третьей Всероссийской научно-практической конференции школьников и студентов. -Пермь: Березниковский филиал Пермского национального исследовательского политехнического университета, 2014. -С. 101-103.
- Широков О.Н. Актуальные направления развития научной и образовательной деятельности//сб. науч. тр. (Чебоксары, 22 апр. 2014 г.). -Чебоксары: ЦНС «Интерактив плюс», 2014. -295 с.
- Степанов А.Г., Бабенков А.Н., Блюм В.С. и др. Информационные технологии в работе кафедры. -СПб., 2014.
- Крылова А.Г. Успеваемость студентов экономических специальностей и статистическая оценка факторов, на нее влияющих//Современные научные исследования и инновации. -2012. -№ 6 . -режим доступа: http://web.snauka.ru/issues/2012/06/14688.