Экспертная оценка программных продуктов для восстановления пропусков в массивах данных
Автор: Рыбанов А.А., Глазунов А.Д.
Журнал: Форум молодых ученых @forum-nauka
Статья в выпуске: 4 (8), 2017 года.
Бесплатный доступ
В статье рассмотрены понятия и представлены результаты сравнительного анализа по методу Саати программных продуктов для восстановления пропусков в массиве данных.
Пропуски в массиве данных, метод саати
Короткий адрес: https://sciup.org/140278206
IDR: 140278206
Текст научной статьи Экспертная оценка программных продуктов для восстановления пропусков в массивах данных
Причинами появления пропусков в массивах данных являются невозможность получения или обработки, искажение или сокрытие информации. Для восстановления пропущенных значений в массиве данных используются различные программные средства, позволяющие производить импутирование их различными алгоритмами.
В данной статье проведен анализ программных продуктов (DeductorStudio, SPSS Statistics, MS Excel, Stata, SAS/ETS Software) позволяющих восстанавливать пропущенные значения, и определенны их весовые коэффициенты критериев качества методом Саати [1,4].
Основываясь на потребностях пользователей по отношению к программным средствам, позволяющим производить импутирование, были выбраны следующие показатели в качестве критериев для сравнительного анализа аналогов программ:
-
1. A1 - Набор алгоритмов восстановления
-
2. A2 - Точность восстановления данных
-
3. A3 - Скорость восстановления данных
-
4. A4 - Формат входных данных
-
5. A5 - Простота работы с ПО
Используя аналитическую иерархическую процедуру Саати, определим вес каждого критерия качества [3,6,7]. Правила заполнения матрицы парных сравнений представлены в таблице 1.
Таблица 1. Значения коэффициентов матрицы парных сравнений
X ij |
Значение |
1 |
i -ый и j -ый критерий примерно равноценны |
3 |
i -ый критерий немного предпочтительнее j -го |
5 |
i -ый критерий предпочтительнее j -го |
7 |
i -ый критерий значительно предпочтительнее j -го |
9 |
i -ый критерий явно предпочтительнее j -го |
Матрица парных сравнений, средние геометрические и веса критериев представлены в таблице 2.
Таблица 2. Матрица парных сравнений, средние геометрические и веса критериев.
A1 |
A2 |
A3 |
A4 |
A5 |
Среднее геометрическое |
Веса критериев |
|
A1 |
1 |
3 |
5 |
7 |
9 |
3,94 |
0,50 |
A2 |
1/3 |
1 |
5 |
5 |
7 |
2,26 |
0,29 |
A3 |
1/5 |
1/5 |
1 |
3 |
5 |
0,90 |
0,11 |
A4 |
1/7 |
1/5 |
1/3 |
1 |
7 |
0,58 |
0,07 |
A5 |
1/9 |
1/7 |
1/5 |
1/7 |
1 |
0,21 |
0,03 |
Сумма |
7,89 |
1,00 |
Диаграмма весовых коэффициентов для критериев A1, A2, A3, A4,
A5 представлена на рисунке 1.

Весовые коэффициенты критериев качества
■ Простота работы с ПО
■ Скорость восстановления данных ■ Форматвходных данных
Набор алгоритмов восстановления ■ Точность восстановления данных
Рисунок 1. Весовые коэффициенты критериев качества
Проведем проверку матрицы парных сравнений на непротиворечивость. Суммы столбцов матрицы парных сравнений: R 1 =1,79; R 2 = 4,54; R 3 = 11,53; R 4 = 16,14; R 5 =29.
Рассчитаем вспомогательную величину L, просуммировав произведения сумм столбцов матрицы и весовые коэффициенты: L = 5,48. Индекс согласованности ИС = (L-N)/(N-1) = 0,12.
Величина случайной согласованности для размерности матрицы парных сравнений: СлС = 1,12. Отношение согласованности ОС=ИС/СлС = 0,11. не превышает 0.2, поэтому уточнение матрицы парных сравнений не требуется.
Используя полученные коэффициенты, определим интегральный показатель качества для следующих программных продуктов, направленных на восстановление пропусков в данных:
-
1. DeductorStudio;
-
2. SPSS Statistics;
-
3. MS Excel;
-
4. Stata;
-
5. SAS/ETS Software.
Выберем категориальную шкалу от 0 до 7 (где 0 – качество не удовлетворительно, 7 – предельно достижимый уровень качества) для функциональных возможностей выбранных программ [4,8].
Значения весовых коэффициентов ai, соответствующие функциональным возможностям аналогов программ:
-
1. Набор алгоритмов восстановления: a 1 = 0,50;
-
2. Точность восстановления данных: a2 = 0,29;
-
3. Скорость восстановления данных: a 3 = 0,11;
-
4. Формат входных данных: a4 = 0.07;
-
5. Простота работы с ПО: a 5 = 0.03;
где ∑a i = 1.
По выбранной шкале определим количественные значения функциональных возможностей X ij (таблица 3) и вычислим интегральные показатели качества для выбранных программ.
Критерии |
Весовые коэффициенты |
Программные продукты |
Базовые значения |
||||
DeductorStudio |
SPSS Statistics |
MS Excel |
Stata |
SAS/ETS Software |
|||
Наборалгоритмов восстановления |
0,50 |
7 |
7 |
1 |
5 |
5 |
5,00 |
Точность восстановления данных |
0,29 |
6 |
6 |
3 |
4 |
5 |
4,80 |
Скорость восстановления данных |
0,11 |
6 |
7 |
4 |
4 |
5 |
5,20 |
Формат входных данных |
0,07 |
6 |
6 |
2 |
5 |
4 |
4,60 |
Простота работы с ПО |
0,03 |
5 |
5 |
6 |
4 |
4 |
4,80 |
Интегральные показатель качества Q |
6,47 |
6,58 |
2,13 |
4,57 |
4,90 |
4,93 |
Таблица 3. Интегральные показатели качества.
где Q j = ∑a i * X ij – интегральный показатель качества для j -го программного продукта.
Построим лепестковую диаграмму интегрального показателя качества каждого программного продукта (рисунок 2).

Рисунок 2. Лепестковая диаграмма интегральных показателей качества программ
Значения характеристик функциональных возможностей (критериев) представлены в виде лепестковой диаграммы на рисунке 3.

Рисунок 3. Лепестковая диаграмма значений функциональных характеристик
Сравнительный анализ программных продуктов для восстановления пропусков в массиве данных показал, что из всех программных аналогов только DeductorStudio и SPSS Statistics имеют значение интегрального показателя качества, превышающий базовое значение, а у остальных программных аналогов оно оказалось ниже. Так же анализ показал, что DeductorStudio и SPSS Statistics надо улучшать показатели по таким критериям как: «Точность восстановления данных» и «Формат входных данных».
Предлагаемая методика экспертной оценки программных продуктов позволила количественно оценить их качество с точки зрения уровня реализуемых функций и выявила функции, которые не удовлетворительно реализованы в некоторых рассматриваемых программных продуктах.
Список литературы Экспертная оценка программных продуктов для восстановления пропусков в массивах данных
- Богушенков А.С., Рыбанов А.А. Разработка и исследование алгоритмов автоматизированной системы учета и поиска информации по пакетам труб на основе технологии QR-кода // Молодой ученый. 2015. № 4 (84). С. 47-52.
- Кондрацкий Д.Е., Рыбанов А.А. Исследование методов и алгоритмов автоматизированной системы оценки альтернативных вариантов методом Т.Саати // NovaInfo.Ru. 2016. Т. 3. № 46. С. 107-116.
- Рыбанов А. Определение весовых коэффициентов сложности тем учебного курса на основе алгоритма Cаати // Педагогические измерения. 2014. № 4. С. 21-28.
- Рыбанов А.А., Макушкина Л.А. Технология определения весовых коэффициентов сложности тем дистанционного курса на основе алгоритма Саати // Открытое и дистанционное образование. 2016. № 1 (61). С. 69-79.
- Сова Е. В., Рыбанов А. А. Сравнительный анализ библиотек генерации отчётов в веб-ориентированных информационных системах // Международный журнал прикладных и фундаментальных исследований. -2012. -№ 7. -C. 167.
- Рыбанов А.А., Усмонов М.С.О., Попов Ф.А., Ануфриева Н.Ю., Бубарева О.А. Информационные системы и технологии // Научный редактор: И. А. Рудакова/ Центр научной мысли (г. Таганрог). Москва, 2013. Том Часть 4 Информационные системы и технологии.
- Морозов А.О., Рыбанов А.А. Экспертная оценка программных продуктов для расчета метрических характеристик физической схемы базы данных // Современные научные исследования и инновации. 2015. № 1-1 (45). С. 97-102.
- Rybanov A.A. Set of criteria for efficiency of the process forming the answers to multiple-choice test items. Turkish Online Journal of Distance Education. 2013. Vol. 14, No. 1, 75-84