Построение хранилища данных для последующего интеллектуального анализа данных

Бесплатный доступ

В статье рассмотрены перечень данных, пригодных для анализа успеваемости студентов, а также выбранные таблицы на примере внутренней базы данных университета; выполнены построение запроса на основе выбранных таблиц, проверка полученного результата и анализ полученных результатов. Впоследствии полученные результаты будут использованы для построения хранилища данных и интеллектуального анализа.

Хранилища данных (хд), интеллектуальный анализ данных (иад), урис, балльно-рейтинговая система, универсальная рейтинговая информационная система, оценка качества образования вуза, оценка эффективности пары преподаватель - студент, экспериментальный образец универсальной информационной рейтинговой системы

Еще

Короткий адрес: https://sciup.org/148160338

IDR: 148160338

Текст научной статьи Построение хранилища данных для последующего интеллектуального анализа данных

2.

Наименование факультета

3.

Наименование группы

4.

Регион вуза

5.

ФО вуза

6.

ФИО студента

7.

Год рождения студента

8.

Пол студента

9.

Наименование дисциплины

10.

Семестр изучения дисциплины

11.

Тип аттестации по дисциплине

12.

Общее время изучения дисциплины

13.

Общее время обучения по специальности в рамках учебного плана

14.

Количество часов всего по дисциплине

15.

Оценка по дисциплине

ВЕСТНИК 2016

В качестве базы данных будет использована внутренняя база данных (далее – ВБД).

Задачи:

  • -    поиск таблиц в ВБД, согласно перечню, перечисленному в таблице 1;

  • -    создание запроса, формирующего необходимый перечень данных;

  • -    проверка полученного результата.

ВБД состоит из 240 таблиц, описания струк-       -   tblScholasticPlan;

туры хранения и атрибутного состава не дано.       -   tblResult;

Было проведено исследование всех таблиц на       -   tblGoods;

наличие интересующих нас атрибутов. Описан-       -   tblExamination;

ный выше перечень данных был обнаружен в       -   tblCheckingType.

следующих таблицах:

  • -    tblScholasticPlanResult;                       Пример взаимосвязи таблиц изображен на

  • -    tblOrderGoodsStudent;                       рис. 1.

  • -    tblStudent;

    ВЕСТНИК 2016


    Рис. 1. Взаимосвязи таблиц, необходимых для получения данных


TBLSCHOLASTICPLANRESULT в данной таблице содержится информация об учебных планах. Перечень данных, необходимый для создания вышеописанного набора данных (далее – набор данных), перечислен в табл. 2.

TBLSTUDENT – содержит данные о студенте. Перечень данных, используемых в наборе данных, перечислен в таблице 3.

TBLGOODS содержится информация об оценках. Перечень данных, используемых в наборе данных, перечислен в таблице 4.

Таблица 2

Перечень необходимых данных из таблицы tblScholasticPlanResult

№ п/п

Наименование столбца

Тип данных

Наименование

1.

Hour

INT

Общее время по учебному плану

2.

Date

DATETIME

Дата сдачи предмета

3.

Semester

INT

Семестр изучения дисциплины

Таблица 3

Перечень необходимых данных из таблицы tblStudent

№ п/п

Наименование столбца

Тип данных

Наименование

1.

First

Name_RU

VAR-CHAR(50)

Имя студента

2.

Middle

Name_RU

VAR-CHAR(50)

Отчество студента

3.

Last

Name_RU

VAR-CHAR(50)

Фамилия студента

4.

Birthday

DATETIME

Дата рождения

5.

Sex

INT

Пол

Таблица 4

Перечень необходимых данных из таблицы tblGoods

№ п/п

Наименование столбца

Тип данных

Наименование

1.

Name_RU

VAR-CHAR(150)

Название предмета

TBLORDERGOODSSTUDENT содержит информацию о зачисленных студентах, будет применяться в дальнейшем для сокращения объема выборки с улучшением ее качества.

TBLRESULT словарь результатов. Перечень данных, используемых в наборе данных/за-просе, перечислен в таблице 5.

Таблица 5

Перечень необходимых данных из таблицы tblResult

№ п/п

Наименование столбца

Тип данных

Наименование

1.

Value_RU

VAR-CHAR(50)

Оценка по предмету (словарь)

2.

Sign_RU

VAR-CHAR(10)

Сокращение оценки по предмету (словарь)

TBLCHECKINGTYPE словарь испытаний по предмету. Перечень данных, используемых в наборе данных, перечислен в таблице 6.

TBLEXAMINATION содержит информацию об испытаниях по предмету, будет применяться в дальнейшем для сокращения объема выборки с улучшением ее качества.

Таблица 6

Перечень необходимых данных из таблицы tblCheckingType

№ п/п

Наименование столбца

Тип данных

Наименование

1.

Name_RU

VAR-CHAR(100)

Название испытания по предмету

TBLSCHOLASTICPLAN содержит информацию об общем времени на обучение. Перечень данных, используемых в наборе данных, перечислен в таблице 7.

Таблица 7

Перечень необходимых данных из таблицы tblScholasticPla

№ п/п

Наименование столбца

Тип данных

Наименование

1.

TotalHours

INT

Количество часов всего по дисциплине, в заданном семестре

2.

ClassHours

INT

Количество аудиторных часов

3.

HomeHour

INT

Количество часов для домашнего изучения

ВЕСТНИК 2016

Итоговый набор данных, сопоставленный с найденными данными, перечислен в таблице 8.

Таблица 8

Итоговый набор данных

№ п/п

Наименование столбца

Тип хранения

Место хранения

1.

Наименование вуза

Расчетное

2.

Наименование факультета

Хранимое

tblOrder-GoodsStu-dent

3.

Наименование группы

Хранимое

tblOrder-GoodsStu-dent

4.

Регион вуза

Расчетное

5.

ФО вуза

Расчетное

6.

ФИО студента

Хранимое

tblStudent

7.

Год рождения студента

Хранимое

tblStudent

Пол студента

Хранимое

tblStudent

Наименование дисциплины

Хранимое

tblGoods

Семестр изучения дисциплины

Хранимое

tblScholas-ticPlanRe-sult

Тип аттестации по дисциплине

Хранимое

tblChecking Type

Общее время изучения дисциплины

Расчетное

tblScholas-ticPlan

Общее время обучения по специальности в рамках учебного плана

Расчетное

tblScholas-ticPlan

Количество часов всего по дисциплине

Расчетное

tblScholas-ticPlan

Оценка по дисциплине

Хранимое

tblResult

Визуальный результат созданного запроса изображен на рис. 2.

ВЕСТНИК 2016

Ю_Сутдента

Фамилия

Имя

Отчество

Часы

Дата

Рейтинг

Предмет

21821

Волков

Антон

Игоревич

90

2005-09-15 00:00:00.000

1

Отечественнс

23934

Бурцев

Виктор

Леонидович

90

2005-06-14 00:00:00.000

1

Менеджмент

24033

Симонов

Виктор

Алексеевич

90

2005-06-14 00:00:00.000

1

Менеджмент

24052

Степанько

Илья

Анатольевич

90

2005-06-14 00:00:00.000

1

Менеджмент

24432

Аллямшина

Альфия

Хаммятовна

90

2005-01-2100:00:00.000

1

Отечественнс

24436

Гл аду ш

Ирина

Олеговна

90

2005-01-21 00:00:00.000

1

Отечественнс

24440

Душин

Кирилл

Владимирович

90

2005-01-21 00:00:00.000

1

Отечественнс

24444

Бушуев

Данила

Юрьевич

90

2005-01-21 00:00:00.000

1

Отечественнс

24447

Голденкова

Дарья

Игоревна

90

2005-01-21 00:00:00.000

1

Отечественнс

24456

Иванова

Екатерина

Александровна

90

2005-01-21 00:00:00.000

1

Отечественнс

24459

Лида ков

Павел

Александрович

90

2005-01-21 00:00:00.000

1

Отечественнс

24461

Замуреева

Алина

Сергеевна

90

2005-01-21 00:00:00.000

1

Отечественнс

24464

Захарова

Ольга

Сергеевна

90

2005-01-2100:00:00.000

1

Отечественнс

24467

Куликова

Ольга

Павловна

90

2005-01-21 00:00:00.000

1

Отечественнс

24471

Мещеряков

Анатолий

Викторович

90

2005-01-Л 00:00:00.000

1

Отечественнс

24473

Макунин

Александр

Николаевич

90

2005-01-Л 00:00:00.000

1

Отечественнс

24478

Нестерюк

Сергей

Валентинович

90

2005-01-Л 00:00:00.000

1

Отечественнс

24485

Намоконов

Евгений

Сергеевич

90

2005-01-Л 00:00:00.000

1

Отечественнс

24493

Ракова

Наталья

Игоревна

90

2005-01-Л 00:00:00.000

1

Отечественнс

24499

Спиридонова

Инна

Андреевна

90

2005-01-Л 00:00:00.000

1

Отечественнс

24503

Тыщенко

Алла

Николаевна

90

2005-01-Л 00:00:00.000

1

Отечественнс

24507

Ховренко

Екатерина

Андреевна

90

2005-01-Л 00:00:00.000

1

Отечественнс

24511

Хаустов

Артем

Сергеевич

90

2005-01-Л 00:00:00.000

1

Отечественнс

24515

Шкарупа

Алексей

Витальевич

90

2005-01-Л 00:00:00.000

1

Отечественнс

24518

Щедурских

Дмитрий

Александрович

90

2005-01-Л 00:00:00.000

1

Отечественн;

Рис. 2. Результат работы запроса

Результат запроса будет использован для дальнейшего построения хранилища данных. При работе с полученными данными определено более 700 000 записей по 22 000 субъектов исследования.

Выводы

В статье предложена реализация ненормализованного хранилища данных для последующего интеллектуального анализа данных. В основу хранилища легла ВБД, содержащая порядка 700 000 записей по 22 000 субъектов. Полнота данных достаточна для дальнейшего изучения и применения методов кластеризации и классифи- кации и иных методов интеллектуального анализа данных.

Список литературы Построение хранилища данных для последующего интеллектуального анализа данных

  • Собетов К.О. Хранилище данных универсальной рейтинговой информационной системы//T-Comm: Телекоммуникации и транспорт. -2015. -Т. 9. -№ 2. -С. 74-78.
  • Собетов К.О., Брюсова В.О. Анализ студенческой успеваемости на примере кафедры информационных технологий и естественно-научных дисциплин//Решение -2014: материалы Третьей Всероссийской научно-практической конференции школьников и студентов. -Пермь: Березниковский филиал Пермского национального исследовательского политехнического университета, 2014. -С. 101-103.
  • Широков О.Н. Актуальные направления развития научной и образовательной деятельности//сб. науч. тр. (Чебоксары, 22 апр. 2014 г.). -Чебоксары: ЦНС «Интерактив плюс», 2014. -295 с.
  • Степанов А.Г., Бабенков А.Н., Блюм В.С. и др. Информационные технологии в работе кафедры. -СПб., 2014.
  • Крылова А.Г. Успеваемость студентов экономических специальностей и статистическая оценка факторов, на нее влияющих//Современные научные исследования и инновации. -2012. -№ 6 . -режим доступа: http://web.snauka.ru/issues/2012/06/14688.
Статья научная