Методология обработки информации для системы автоматизированной аналитики электронных образовательных ресурсов образовательной организации

Автор: Гришан Игорь Александрович

Журнал: Образовательные технологии и общество @journal-ifets

Статья в выпуске: 2 т.21, 2018 года.

Бесплатный доступ

Настоящая статья посвящена вопросам методологии обработки информации об электронных образовательных ресурсах в целях разработки системы автоматизированной аналитики электронных образовательных ресурсов образовательных организаций по материалам Объединенного фонда электронных ресурсов «Наука и образование».

Автоматизация, агрегированная информация, аналитика, валидация, информация, образовательные организации, стандартизация, структурирование, унификация, электронные образовательные ресурсы

Короткий адрес: https://sciup.org/140224578

IDR: 140224578

Текст научной статьи Методология обработки информации для системы автоматизированной аналитики электронных образовательных ресурсов образовательной организации

В соответствии с Приказом Минобрнауки России №1399 от 09.11.2016 "О внесении изменений в показатели мониторинга системы образования" образовательных организаций внесен показатель "Наличие собственных электронных образовательных и информационных ресурсов" . База Данных Объединенного фонда электронных ресурсов «Науки и образования» (ОФЭРНиО) содержит информацию об электронных и информационных ресурсах, разработанных 745 учреждениями и организациями, среди которых 672 вуза страны. В соответствии с проектом №27.9383.2017/БЧ разрабатывается автоматизированная аналитическая система электронных образовательных ресурсов (ЭОР) образовательных организаций (ОО), разработанных пользователями ОФЭРНиО – университетами, колледжами, школами страны, что позволит органам управления образования использовать данные ОФЭРНиО для мониторинга образовательных организаций по данному показателю. Основой автоматизированной аналитической системы является агрегированная информация, полученная в результате обработки информации об электронных образовательных и информационных ресурсах.

Проблемам обработки информации в целях ее агрегирования и посвящена настоящая статья.

Нормативно-правовое обеспечение данного вопроса

Формирование информационно-образовательной среды на основе внедрения информационно-коммуникационных технологий и электронных образовательных ресурсов является одним из приоритетных направлений развития российских университетов. В контексте данной статьи важными представляются следующие нововведения:

  •    Государственное задание на проект «Нормативно-правовое регулирование отношений в сфере образования и отраслевая регистрация произведений науки», во второй части «Отраслевая регистрация произведений науки»;

  •    Приказ Минобрнауки № 1399 от 09.11.2016 "О внесении изменений в показатели мониторинга системы образования", в соответствии с которым в мониторинг образовательных учреждений внесен новый показатель «наличие собственных образовательных электронных и информационных ресурсов»;

  •    Постановление Правительства Российской Федерации № 376 от 31 марта 2017 года, в соответствие с которым в структуру государственной программы «Развитие образования» интегрируется ряд приоритетных проектов по направлению стратегического развития «Образование», в том числе проект «Современная цифровая образовательная среда в Российской Федерации»;

Объект исследования: образовательные организации страны.

Предмет исследования: произведения науки в форме электронных образовательных ресурсов (рис. 1)

Методы исследования : унификация, стандартизация, верификация, валидация, статистический, контент-аналитический

Цель исследования: совершенствование методологии обработки слабоструктурированной информации об электронных образовательных ресурсов в целях получения агрегированной аналитической информации по показателям деятельности образовательных организаций, в части создаваемых ими электронных образовательных ресурсов в различных срезах, с учётом временного фактора, позволяющей оценить динамику создания электронных ресурсов (Рис. 1).

Рис.1. Разновидности результатов интеллектуальной деятельности и форм представления произведений науки

Автоматизация обработки и преобразования исходной информации об электронных образовательных ресурсах по показателям деятельности образовательных организаций, позволяет оценивать динамику создания электронных ресурсов (Рис. 2)

Рис. 2 Блок-схема автоматизированной аналитической системы электронных образовательных ресурсов образовательных организаций

Сегодня информационно-программное обеспечение Объединенного фонда электронных ресурсов «Наука и образование» - это 29784 файлов, 1 сайт. Главным информационным ресурсом ОФЭРНиО является База Данных.

База Данных ОФЭРНиО содержит 29 взаимосвязанных таблиц, содержащих 66 объектов информации об электронных образовательных ресурсах, в частности:

В целях структурирования, унификации, стандартизации входной информации об электронных образовательных ресурсах разработана free software RegOFERNiO [4] - программа автоматизированной разработки комплекта документов для регистрации электронных образовательных ресурсов. Полученная исходная информация, содержащая 66 объектов, автоматизировано пополняет Базу Данных ОФЭРНиО, подвергаясь обработке программой black_list_maker_v_1 [5], позволяющей:

  •    отсеять повторные записи для очистки массива исходных записей Базы Данных;

  •    удалить из текстовых полей Базы Данных невидимых, не читаемых символов: наподобие табуляции, перевода строки возврата каретки, букв русского и английского языков одинакового написания - очистка данных (Рис. 3, шаг 3).

В настоящее время эта программа используется для формирования Базы Данных ОФЭРНиО; формирования «черных списков» - списков допущенных к регистрации, но незарегистрированных авторами ЭОР; для организации семантического поиска информации в Базе Данных ОФЭРНиО.

1 шаг

• АВТОМАТИЗИРОВАННАЯ ГЕНЕРАЦИЯ ДОКУМЕНТОВ В ЦЕЛЯХ СТРУКТУРИРОВАНИЯ, УНИФИКАЦИИ, СТАНДАРТИЗАЦИИ ИНФОРМАЦИИ

2 ШАГ

• ЗАГРУЗКА ДАННЫХ ИЗ ИСТОЧНИКОВ

3 шаг

•ОЧИСТКА ДАННЫХ ОТ ОШИБОК

4 шаг

•МАННИНГ СО СПРАВОЧНИКАМИ ЦЕЛЕВОЙ СИСТЕМЫ

5 шаг

• ВЫГРУЗКА В ЦЕЛЕВУЮ СИСТЕМУ

6 шаг

•ПРЕДСТАВЛЕНИЕ ДАННЫХ ИЗ ЦЕЛЕВОЙ СИСТЕМЫ

Рис. 4 Алгоритм обработки информации целевой системы для автоматизированной аналитической системы ЭОР ОО

Полученная на выходе процесса обработки исходной информации агрегированная информация подлежит обработке программой collector_stat [6], позволяющей осуществить статистическую обработку Базы Данных ОФЭРНиО в целях анализа электронных образовательных ресурсов образовательной организации по 46 показателям.

В рамках разработки автоматизированной аналитической системы выделены следующие функциональные подсистемы, которые в соответствии с совершенствованием методологии обработки данных о ЭОР образовательных организаций подлежат процессу модернизации (Табл. 1):

Таблица 1.

Состав автоматизированной аналитической системы ЭОР образовательных организаций

ПОДСИСТЕМА

ЗАДАЧИ

Подсистема сбора, формирования исходных данных, прохождение первого уровня валидации

Разработка и модернизация программы автоматизированной подготовки документов к регистрации RegOFERNiO, разработка автоматизированного функционала защиты и валидации данных на первом уровне проверки Разработка/доработка необходимого функционала формирования данных для достижения целей автоматизированной аналитической системы ЭОР ОО

Подсистема сбора, обработки и валидации данных на 2-ом уровне после загрузки из первичных источников для загрузки в централизованное хранилище данных

Автоматизация процедур сбора данных из систем источников, загрузка данных в область временного, хранения

Обработка и преобразование и автоматизация валидации извлечённых данных, выявление некорректных записей, для дальнейшей корректировки несоответствий.

Разработка/доработка/модернизация программного обеспечения collector_stat. для достижения целей системы онлайн-мониторинга ОУ

Разработка программного обеспечения collector_stat с добавлением функционала формирования и преобразования исходных данных в шаблоны формата HTML, для формирования контента аналитико-динамических витрин, агрегированных данных

Подсистема обеспечения доступа к контенту аналитикодинамических витрин автоматизированной аналитической системы ЭОР ОО на стороне сервера

Разработка серверных подсистем контейнеров для приёма, хранения, обеспечения доступа и визуализации данных системы онлайн-мониторинга ОУ

Подсистема загрузки/выгрузки данных в/из централизованного хранилища, обеспечение валидации на 3-ем уровне

Разработка механизмов для выявления некорректных записей в централизованном хранилище на стороне сервера. Корректировка и приведение данных на стороне сервера в централизованном хранилище в корректное состояние

Разработка программного обеспечения выгрузки данных со стороны сервера

Доработка и модернизация программного обеспечения механизмов валидации данных при загрузке данных на сервер

В рамках проекта, в 2017 году, был разработан исследовательский прототип автоматизированной аналитической системы ЭОР ОО на примере Омского государственного технического университета, который позволил уточнить многие позиции обработки исходной информации, включая визуализацию результатов работы системы. Ниже представлены скриншоты web-страниц портала с исследовательским

Рис. 6 Первый динамический экран визуализации результатов работы системы автоматизированной аналитики ЭОР ОО

прототипом ААС ЭОР ОО

Рис. 5 Исследовательский прототип автоматизированной аналитической системы электронных образовательных ресурсов образовательной организации, размещенный на портале ОФЭРНиО (главная страница)

Заключение

Резюмируя все вышесказанное, формируются следующие выводы:

  • 1.    С 2016 года электронные образовательные ресурсы являются показателями мониторинга образовательных организаций.

  • 2.    Электронные образовательные ресурсы регистрируются в ОФЭРНиО на основании комплекта документов, описывающих их.

  • 3.    Информация в документах на регистрацию ЭОР является слабоструктурированной, что потребовало разработки программного обеспечения, осуществляющего структурирование, унификацию, стандартизацию, очистку, маппирование, валидацию, агрегирование информации для статистической и динамической ее обработки в целях мониторинга образовательных организаций по ЭОР по 46 срезам Базы Данных ОФЭРНиО в режиме реального времени.

Список литературы Методология обработки информации для системы автоматизированной аналитики электронных образовательных ресурсов образовательной организации

  • Приказ Министерства образования и науки Российской Федерации от 09.11.2016 г. № 1399 "О внесении изменений в показатели мониторинга системы образования‚ утвержденный приказом Министерства образования и науки Российской Федерации от 15 января 2014 г. № 14"
  • Постановление Правительства Российской Федерации № 376 от 31 марта 2017 года
  • Постановление от 25 августа 2017 года №1007.
  • Галкина А.И., Гришан И.А. Программа RegOFERNiO/М.: ЦИТИС -№ 50201000683 от 30.04.2010
  • Галкина А.И., Гришан И.А. Программа black_list_maker v. 1.0/М.: ЦИТИС -№ АААА-А17-117041810029-2 от 30.01.2018
  • Галкина А.И., Гришан И.А. Программа collector_stat v. 1.0/М.: ЦИТИС -№ АААА-А17-117041810029-2 от 23.10.2017
Статья научная