Внедрение и использование нейронных сетей в повседневной жизни
Автор: Котиков Д.С., Зайцева Т.В.
Журнал: Теория и практика современной науки @modern-j
Рубрика: Основной раздел
Статья в выпуске: 12 (114), 2024 года.
Бесплатный доступ
В данной статье рассматриваются принципы построения и обучения нейронных сетей, а также алгоритмы работы и ключевые особенности наиболее популярных и многообещающих нейронные сети, используемых людьми на данный момент.
Нейронная сеть, искусственный интеллект, поисковые системы
Короткий адрес: https://sciup.org/140308916
IDR: 140308916
Текст научной статьи Внедрение и использование нейронных сетей в повседневной жизни
На сегодняшний день искусственный интеллект активно используется в различных аспектах повседневной жизни, способствуя решению множества задач в самых разнообразных областях. Одной из наиболее перспективных технологий в области искусственного интеллекта являются нейронные сети – математические модели, построенные по принципу организации и функционирования биологических нейронных сетей, то есть сетей нервных клеток живых организмов. Нейронные сети уже нашли широкое применение в маркетинге, обеспечении безопасности, индустрии развлечений и многих других сферах. Наиболее продвинутые компании, такие как Google, Яндекс и
Microsoft, активно проводят исследования в этой области, способствуя развитию технологий и открытию новых горизонтов.
Принципы построения искусственных нейронных сетей схожи с биологическими: в их основу заложены естественные механизмы работы мозга, адаптированные с учётом технических допущений. Искусственные нейронные сети состоят из множества взаимосвязанных простых элементов и могут обучаться аналогично человеческому мозгу. Под обучением понимается процесс настройки архитектуры сети (структуры связей между нейронами) и весов этих связей для решения конкретной задачи. Обычно обучение осуществляется на основе выборки данных, называемой обучающим примером. Существуют два типа алгоритмов обучения нейронных сетей: с учителем и без учителя.
-
1. Обучение с учителем предполагает, что нейронная сеть получает обучающую выборку, где каждому входному примеру соответствует желаемый результат. Сначала данные подаются на вход сети, проходят обработку внутри её структуры, а затем результат сравнивается с целевым значением. На основе разницы между результатом и целью корректируются веса связей. Этот процесс повторяется до достижения минимального уровня ошибки (рис. 1).
-
2. Обучение без учителя работает с выборкой, содержащей только входные данные. Алгоритм настраивает веса так, чтобы схожие входные данные выдавали похожие выходы. В процессе обучения данные группируются по статистическим признакам, формируя классы. При подаче нового входного вектора из определённого класса сеть выдаёт соответствующий результат (рис. 2).

Рис 1. Схема процесса обучения нейронной сети с учителем

Рис 2. Схема процесса обучения нейронной сети без учителя
Одним из ярких примеров нейронных сетей является ChatGPT, чат-бот, разработанный компанией OpenAI. Его ключевая особенность – способность работать в режиме диалога, решая разнообразные задачи пользователя, от написания эссе для школьников до создания программного кода. ChatGPT активно используется программистами, интегрирующими его функционал в свои проекты через интерфейсы ботов.
В основе работы ChatGPT лежит метод автогенерации текста, позволяющий предсказывать наиболее вероятное следующее слово в последовательности на основе предыдущих. Это стало возможным благодаря архитектуре трансформера, разработанной Google Research. В отличие от рекуррентных нейронных сетей, трансформеры обрабатывают данные параллельно, что значительно ускоряет выполнение задач. Ещё одной важной особенностью является механизм долговременной памяти, обеспечивающий сохранение контекста для создания связного текста.
Наряду с языковыми моделями нейронные сети находят применение в компьютерном зрении. Например, YOLO (You Only Look Once) – это свёрточная нейронная сеть, которая позволяет быстро обрабатывать изображения и распознавать объекты. Её алгоритм работает следующим образом: изображение преобразуется в матрицу, состоящую из фрагментов, после чего выделяются bounding boxes (рамки объектов), и для каждого объекта вычисляются параметры, такие как координаты и вероятность обнаружения.
Ещё одним примером языковой модели является YaLM (Yet another Language Model), разработанная Яндексом. Эта нейронная сеть обучена на огромных объёмах текстов и учитывает нормы русского и английского языков. Она используется в более чем 20 проектах Яндекса, таких как голосовой помощник Алиса и поисковые системы. YaLM создаёт связный и грамматически правильный текст благодаря использованию архитектуры трансформера и способности предсказывать каждое следующее слово.
Нейронные сети не только облегчают выполнение множества задач, но и способствуют развитию технологий в целом. Инвестиции в эту сферу значительно выросли за последние годы, а количество стартапов, работающих с нейросетями, продолжает увеличиваться, открывая новые перспективы.
Благодаря этим достижениям нейронные сети становятся важным инструментом улучшения качества жизни и решения сложных задач в различных сферах.
Список литературы Внедрение и использование нейронных сетей в повседневной жизни
- Vadinsky, O. An overview of approaches evaluating intelligence of artificial systems [Электронный ресурс]// Acta informatica pragensia. 2018. No. 7-1. pp. 74-103. - URL: item.asp?id=35423152 (дата обращения: 16.12.2024). EDN: XWDKXJ
- Isakov, Yu. Artificial intelligence [Электронный ресурс]// ModernScience. 2018. No. 6-1. pp. 25-27. - URL: item.asp?id=35277490 (дата обращения: 16.12.2024). EDN: RVEVVF
- Бердышев, А. В. Искусственный интеллект как технологическая основа развития банков [Электронный ресурс]// Вестник университета. - 2018. - № 5. - С. 91-94. - URL: https://vestnik.guu.ru/jour/article/view/1031 (дата обращения: 17.12.2024). EDN: XQWRLV
- Богомолова, А. И. Искусственный интеллект и экспертные системы в мобильной медицине / А. И. Богомолов, В. П. Невежин, Г. А. Жданов. - [Электронный ресурс]// Хроноэкономика. - 2018. - № 3. - С. 17-28. - URL: item.asp?id=35353718 (дата обращения: 17.12.2024). EDN: XUXVFB
- Маршалко, Г. Игры искусственного разума: безопасность систем машинного обучения [Электронный ресурс]// Информационная безопасность. - 2018. - № 4. - С. 6-7. - URL: https://cs.groteck.ru/IB_4_2018/4/(дата обращения: 18.12.2024).
- Москвин В. А. Станет ли искусственный интеллект умнее человека [Электронный ресурс]// Инвестиции. - 2018. - № 7 (282). - С. 29-40 - URL: https://elibrary.ru/item.asp?id=35250314 (дата обращения: 19.12.2024).