Разработка программного обеспечения на основе машинного обучения для студентов вузов

Автор: Пальмов С.В.

Журнал: Форум молодых ученых @forum-nauka

Статья в выпуске: 3 (79), 2023 года.

Бесплатный доступ

В настоящее время достаточно остро стоит вопрос импортозамещения в IT. Вузы, реализующие образовательные программы в указанной сфере, вынуждены искать замену привычным продуктам. Одно из решений данной проблемы - самостоятельная разработка. Целью работы являлось создание программного обеспечения, которое может быть использовано для проведения лабораторных работ по дисциплинам, связанным с изучением алгоритмов машинного обучения. Использовались методы стохастического градиентного спуска, высокоуровневого программирования и сравнительного анализа. Заявленное программное обеспечение было разработано и протестировано; получены положительные результаты, подтверждающие возможность его практического использования.

Еще

Стохастический градиентный спуск, искусственный интеллект, машинное обучение, классификация

Короткий адрес: https://sciup.org/140297454

IDR: 140297454

Текст научной статьи Разработка программного обеспечения на основе машинного обучения для студентов вузов

В настоящее время в РФ реализуются мероприятия по импортозамещению. Одним из важных направлений является сфера информационных технологий. Вузы, которые готовят специалистов в данной области, также вынуждены вносить изменения в пул используемых программных средств. Одним из способов выхода из сложившейся ситуации является разработка необходимых решений силами образовательной организации. Следовательно, можно утверждать, что статья, посвященная рассмотрению вопроса самостоятельного создания приложения для обучения студентов, будет актуальной.

Цель работы была сформулирована так: создание программного обеспечения, которое может быть использовано для проведения лабораторных работ по дисциплинам, связанным с изучением алгоритмов машинного обучения.

Методы и исследование

В работе были использованы следующие методы.

Стохастический градиентный спуск (Stochastic Gradient Descent) [1] – это метод оптимизации, который применяется в ситуациях, когда градиентный спуск может функционировать медленно или неэффективно. В отличие от обычной версии алгоритма, работающей на всем наборе данных, рассматриваемый вариант оперирует случайно выбранными небольшими подмножествами, называемых пакетами (или мини-пакетами). Поэтому, обучение выполняется быстрее, так как каждый пакет содержит только часть данных, что уменьшает количество вычислений и заметно сокращает время, затрачиваемое на построение модели.

Язык высокоуровневого программирования Python. С его помощью было  реализовано   заявленное   программное обеспечение   (ПО)

Сравнительный анализ применялся для оценки качества работы ПО.

«Градиентный спуск» предоставляется следующие возможности:

  •    Построение классификатора (математической модели) на основе стохастического градиентного спуска

  •    Сохранение созданного / загрузка существующего классификатора

  •    Классификация новых данных с сохранением результатов в текстовый файл

  •    Режим тестирования классификатора (оценка качества работы на основе наборов данных с известными значениями целевого показателя)

    / Классификатор "Градиентный спуск’

Главное меню

Настройка модели Задание режима работы

Выводить подробную статистику: О

Рис. 1. Интерфейс ПО. Настройка модели

/ Классификатор "Градиентный спуск"                                             —     □ X

Главное меню

Настройка модели Задание режима работы

Г Протестировать модель на наборе с известными значениями зависимой переменной

Рис. 2. Интерфейс ПО. Задание режима работы

Рис. 3. Интерфейс ПО. Главное меню

Результаты исследования

Для демонстрации возможностей ПО был проведен эксперимент. Исходными данными послужил набор «Голосование депутатов конгресса»

Использовалась перекрестная проверка с k , равным трем; метрика оценки качества – вероятность ( P ).

Было выполнено девять прогонов ПО (по числу значений параметра Ф

у

н к Таблица 1. Результаты эксперимента

ц        Функция потерь

P

и

я

п

о

т

е

р

ь

табл. 1.

Заключение

Как видно из представленных результатов, классификаторы, созданные с использованием первых пяти функций, показали лучшее качество, заметно отличающееся от остальных. Следовательно, последняя четверка значений не является предпочтительной для обработки указанного набора данных. Таким образом, представленное ПО позволяет реализовывать изучение возможностей определенного класса алгоримов машинного обучения. Это обстоятельство указывает на то, что цель работы достигнута.

Список литературы Разработка программного обеспечения на основе машинного обучения для студентов вузов

  • Никулин, В. Н. Алгоритмы на основе метода стохастического градиентного спуска для рекомендательных систем / В. Н. Никулин, М. Г. Петик // Общество, наука, инновации (НПК - 2015): Всероссийская ежегодная научно-практическая конференция: Сборник материалов: Общеуниверситетская секция, БФ, ХФ, ФСА, ФАМ, ЭТФ, ФАВТ, ФПМТ, ФЭМ, ФГСН, ЮФ, Киров, 13-24 апреля 2015 года / ФГБОУ ВПО "Вятский государственный университет". - Киров: Вятский государственный университет, 2015. - С. 2033-2034.
  • Пальмов, С. В. Сравнение классификационных возможностей алгоритмов С4.5 и С5.0 / С. В. Пальмов, А. А. Мифтахова // Инфокоммуникационные технологии. - 2015. - Т. 13, № 4. - С. 467-471.
  • Сивак, М. А. Построение робастных нейронных сетей с различными функциями потерь / М. А. Сивак, В. С. Тимофеев // Системы анализа и обработки данных. - 2021. - № 2(82). - С. 67-82.
Статья научная