Применение нейронных сетей

Автор: Макаров Д.А., Шибанова А.Д.

Журнал: Теория и практика современной науки @modern-j

Рубрика: Математика, информатика и инженерия

Статья в выпуске: 1 (43), 2019 года.

Бесплатный доступ

В данной статье рассмотрена технология применения нейронных сетей. Проведен анализ процессов сбора данных для обучения нейронной сети, включая случай, когда данные недостоверны. Указана область применения каждого из них. Сделан вывод об актуальности технологии нейронных сетей, описаны плюсы ее применения.

Данные, нейронная сеть, наблюдение, статистический анализ

Короткий адрес: https://sciup.org/140273970

IDR: 140273970

Текст научной статьи Применение нейронных сетей

Процесс работы и обучения нейронной сети влияет на то, для решения каких задач она может применяться. Сеть можно применять в ситуации, когда на основе каких-то исходных данных необходимо получить нужную информацию. Вот некоторые примеры таких задач: прогноз ситуации на фондовом рынке, оценивание кредитной истории, управление роботом по изображению с камер и т.д. Обычно нейронная сеть используется в случае, когда связь между входными и выходными сигнала неочевидна, эту связь нейросеть будет обнаруживать в ходе процесса обучения. Для обучения нейронных сетей используются 2 алгоритма: обучение с учителем и без него. Чаще всего применяется первая разновидность обучения [1].

Для обучения с учителем необходимы готовые данные, которые представляют собой примеры входных данных и выходов, которые им соответствуют. Благодаря им сеть учится находить связь между входным и выходным сигналом. Обычно обучающие данные берутся из исторических сведений. Это могут быть стоимости акций, значения фондового рынка, правильные реакции робота на ситуации и т.д. Обучение нейросети происходит за счет использования алгоритма обучения (наиболее известным из них является метод обратного распространения), при котором веса нейронов изменяются в зависимости от размера ошибки, то есть отклонения выходного сигнала от истинных значений. После обучения сеть получает способность прогнозировать результат, основываясь на имеющихся данных.

Возможности нейронных сетей ограничиваются диапазоном данных. Если у данных нестандартный масштаб, есть пропущенные значения или данные нечисловые. В таких случаях данные необходимо масштабировать, пропущенные значения заменять на средние значения [2].

Если данные имеют нечисловой характер, то они обычно бывают представлены в виде номинальных переменных типа Пол = { Муж , Жен } и т.д. Такие переменные реально представить в числовом виде, однако, нейронные сети не дают хороших результатов при работе с номинальными переменными, которые могут принимать много разных значений.

Пусть перед нами стоит задача оценивания стоимости недвижимости . В первую очередь стоимость недвижимости зависит от района города, в котором она расположена. Районов в городе может быть более десяти, и кажется разумным использовать для их обозначения номинальные значения. Однако, это негативно скажется на обучении нейронной сети, и лучше, и лучше использовать рейтинг районов, основанный на экспертных оценках. Таким образом, нечисловые данные иных типов необходимо преобразовать в числовой вид, либо отбросить.

Проблема определения количества данных для обучения сети достаточно сложна. Известно правило, которое связывает количество данных с размером сети, в простейшем случае число наблюдений должно быть в де- сять раз больше числа связей в сети. Так же количество наблюдений для обучения зависит от сложности данных, подаваемых на вход (например, распознавание цифр требует меньше данных для обучения, чем распознавание предметов) [3]. Однако с ростом количества переменных возникает "проклятие размерности": количество требуемых наблюдений растет нелинейно, так что уже при довольно небольшом (например, пятьдесят) числе переменных может потребоваться огромное число наблюдений.

Обычно, для реальных задач достаточно нескольких сотен или тысяч наблюдений. Для сложных задач количество обучающих данных увеличивается, однако, даже для простых задач необходимо более чем сто наблюдений. Если данных меньше, чем здесь сказано, то на самом деле у Вас недостаточно информации для обучения сети, и лучшее, что Вы можете сделать - это попробовать подогнать к данным некоторую линейную модель.

В реальных задачах данные не всегда достоверны. Значения некоторых переменных могут быть искажены, или даже отсутствовать. Однако, нейронные сети в целом устойчивы к шумам [4]. Но у этой устойчивости есть предел. К примеру, значения, которые сильно превышают средние значения для данного набора данных (выбросы), могут исказить результат обучения. В таких случаях лучше всего постараться обнаружить и удалить эти выбросы (либо удалив соответствующие наблюдения, либо преобразовав их). После этого исправленные данные можно подавать на вход нейронной сети для ее обучения.

Нейронные сети используются независимо или в качестве дополнения к традиционным методам статистического анализа. Данный способ одинаково подходит как для линейных, так и для сложных нелинейных зависимостей. Его эффективность особенно проявляется в ситуации, когда необходимо выяснить, имеются ли зависимость между данными. При этом они могут быть разного качества (неполными, противоречивыми и т.д.). Если между данными есть какая-то зависимость, которую не обнаружили корреляционные методы, то нейронная сеть способна ее обнаружить. Современные возможности нейронных сетей позволяют: оценивать сравнительную важность различных видов входной информации, уменьшать ее объем без потери существенных данных, распознавать симптомы приближения критических ситуаций и т.д. Применение нейронных сетей возможно в любых областях деятельности человека. Они обеспечивают значительное повышение уровня автоматизации, и тем самым обеспечивается их растущая популярность.

Список литературы Применение нейронных сетей

  • С. Николенко, А. Кадурин, Е. В. Архангельская. Глубокое обучение. Погружение в мир нейронных сетей - Санкт-Петербург: Питер, 2018. - 481 с.
  • С. Хайкин. Нейронные сети. Полный курс. - Москва: Вильямс, 2018. - 1104 с.
  • Основы ИНС. [Электронный ресурс]. Режим доступа: https://neuralnet.info/chapter/основы-инс/ (дата обращения 03.01.2019).
  • Нейронные сети - математический аппарат. [Электронный ресурс]. Режим доступа: https://basegroup.ru/community/articles/math (дата обращения 03.01.2019).
Статья научная