Обзор современных генеративных нейросетей: отечественная и зарубежная практика

Бесплатный доступ

В настоящее время все больше внимания уделяется развитию искусственного интеллекта в мире во всех сферах экономики. Поэтому важно иметь множество подходов по их развитию в различных отраслях и применению. Одним из ключевых вопросов при этом является подготовка кадров способных разрабатывать и усовершенствовать программы, а также их обслуживать. Автор статьи систематизирует информацию о генеративных нейросетях, а также классифицирует их в соответствии с функциональной принадлежностью.

Генеративные нейросети, искусственный интеллект, классификация, систематизация, отечественная практика, зарубежная практика

Короткий адрес: https://sciup.org/170203156

IDR: 170203156   |   DOI: 10.24412/2500-1000-2024-1-2-168-171

Текст научной статьи Обзор современных генеративных нейросетей: отечественная и зарубежная практика

Современное общество развивается крайне быстрыми темпами. Совсем недавно понятие «генеративная нейросеть» было абсолютной диковинкой, а об их использовании в качестве рабочего инструмента не было и речи. Однако все значительно изменилось, и человечество стало использовать ИИ в повседневной жизни. Появилось множество генеративных нейросетей, которые обладают определенными возможностями и различным функционалом.

Благодаря этому формируется актуальность исследования – активное развитие искусственного интеллекта в Российской Федерации стало предпосылкой для появления множества инструментов, которые следует классифицировать и систематизировать. Так, в ряде вакансий на сайте HeadHunter на текущий момент можно увидеть новые обязанности сотрудников, связанных с владением генеративными нейросетями ChatGPT, Midjourney, DALLE и так далее.

Целью данного исследования является классификация и систематизация современных генеративных нейросетей как отечественного, так и зарубежного производства.

Задачи исследования:

  • 1.    Определение исторических предпосылок появления генеративных нейросетей;

  • 2.    Исследование сущности генеративных нейросетей;

  • 3.    Организация классификации генеративных нейросетей.

Объект исследования – генеративные нейросети.

Предмет исследования – развитие искусственного интеллекта в Российской Федерации и зарубежом.

Методы исследования, которые используются автором работы: сравнение, индукция, дедукция, синтез, анализ и прочие.

  • 1.    Результаты исследования

    • 1.1.    История появления генеративных нейросетей, их сущность

      Генеративные нейросети – это неотъемлемая часть новой реальности. Следует понимать, что нейросеть – это вид искусственного интеллекта, а не он сам в прямом его понимании. То есть, это лишь его частица. Так, Барщевский Е.Г. в своей научной статье отмечает, что в 1956 году было дано определение понятию «искусственный интеллект» (ИИ). В соответствии с ним, искусственный интеллект – это возможность осуществления творческих задач как программными, так и техническими системами.

Также данный ученый определяет, что на текущий момент принято выделять всего три вида искусственного интеллекта. Он классифицируется в зависимости от задач, которые он должен выполнять. Видами ИИ являются [1]:

  • 1.    Общий искусственный интеллект. Это такой вид ИИ, который способен выполнять множество различных задач как человек. Примером данного ИИ являются различные суперкомпьютеры, к которым относится и K Computer от японской компании Fujitsu. Данное устройство является «суперкомпьютером общего назначения», призванным выполнять широкий спектр задач [2].

  • 2.    Ограниченный искусственный интеллект. Вид ИИ, который специализируется на конкретной задаче. Например, нейросеть DALL-E, которая может генерировать изображения по текстовому запросу (также именуется как prompt).

  • 3.    Искусственный сверхинтеллект. Вид ИИ, которого на текущий момент не существует. Являясь высокопотенциальным проектом будущего, данный ИИ может превзойти человека или группу людей, включая всё человечество.

Генеративные нейросети относятся к ограниченному виду ИИ, поскольку они могут решать только конкретные задачи и на настоящее время не способны соперничать с человеческим разумом.

Наиболее известным примером ограниченного искусственного интеллекта, получившим активное развитие в текущее время, является GAN. Само понятие Generative adversarial network (или сокращённо GAN) появилось не так давно. Оно переводится как «генеративно-состязательная сеть». Это специализированный алгоритм машинного обучения, который основан на комбинации двух нейросетей: G и D. Нейросеть G – это модель, которая генерирует данные, а D – это дискриминативная модель, которая определяет сгенерирован ли образец данных нейросетью G или нет. Данная технология была сформирована в 2014 году Ианом Гудфеллоу [3].

Нейросеть ChatGPT является примером функционирования GAN. Так, ChatGPT использует набор готовых текстов, а также может создавать абсолютно новые, которые схожи с реальными. В результате этого формируются такие тексты, которые максимально подходят под пользовательские запросы, а также выглядят привычным образом.

Именно благодаря данной технологии настоящее изменилось. Так, Егорычев Д.Н. и Егорычев А.Д. в своей научной статье рассматривают основные направления, которые затронут генеративные нейросети в современном мире: увеличение количества инвестиций в искусственный интеллект и генеративные нейросети, изменение привычных профессий или их исчезновение, появление инновационных продуктов и проектов, связанных с ИИ и генеративными нейросетями, изменение привычного функционала управленческих профессий, рост процента автоматизации процессов, связанных с продажами и производством, изменения в области интеллектуальной собственности [5]. С авторами данного исследования легко согласиться, поскольку уже сейчас генеративные нейросети активно влияют на мир: поменялись требования к некоторым рабочим профессиям (программисты и дизайнеры), система «Антиплагиат» ввела проверку на сгенерированный текст, а представители малого и среднего бизнеса оптимизируют затраты с помощью ChatGPT и DALL-E.

  • 1. 2. Классификация генеративных нейросетей

Динамичной развивающийся мир предоставляет множество инноваций: компания Яндекс внедряет голосового помощника Алису (со встроенным YandexGPT) в портативные колонки, Сбер выпускает телевизоры совместно с собственной нейросетью – GigaChat. Недавно появившиеся генеративные нейросети, разнообразие их функционала, вариативность их применения – всё это требует проведения систематизации и классификации.

Поэтому рассмотрим современные наиболее популярные нейросети, которые активно применяются множеством людей в современном мире [4]:

  • 1.    ChatGPT. Зарубежная универсальная генеративная нейросеть, которая может создавать тексты, вести диалог, в соответ-

  • ствии с запросами, которые пользователь ей предоставит.
  • 2.    Dall-E. Специализированная нейросеть, которая способна генерировать изображения, исходя из текстового запроса пользователей. Является зарубежной генеративной нейросетью.

  • 3.    Character AI. Специализированная платформа, которая может создать имитацию многих современных медийных личностей, популярных персонажей и так далее. Например, данная нейросеть может вести диалог от лица Илона Маска. Разработана иностранной компанией.

  • 4.    YandexGPT. Универсальная нейросеть, разработанная компанией из Российской Федерации. Может генерировать текст, вести диалог, а также связана с голосовым помощником – Алисой.

  • 5.    Bing AI. Это зарубежная генеративная нейросеть, отличающейся тем, что она связана с поисковой системой, что подтверждает достоверность информации в ответе пользователю.

  • 6.    GigaChat. Отечественная универсальная нейросеть, которая может создавать текст в ответ на запросы пользователя, генерировать изображения, а также вести диалоги.

  • 7.    Bing Image Creator. Нейросеть, которая может создавать изображения, исходя из текстового запроса пользователей. Разработана иностранной компанией.

  • 8.    Kandinsky. Нейросеть, разработанная в Российской Федерации, которая способна генерировать изображения и короткие анимационные ролики. Отличие данного сервиса от зарубежных аналогов в том, что она поддерживает русский язык и обладает «фотореализмом».

  • 9.    Шедеврум. Отечественная нейросеть, основанная на модели YandexGPT. Облада-

  • ет возможностью генерировать картинки по текстовому описанию.
  • 10.    Runway Gen-2. Зарубежная нейросеть, которая работает с готовыми видеороликами, а также может генерировать видео по текстовому описанию.

  • 11.    Nvidia Eye Contact. Специализированная иностранная нейросеть, которая позволяет «удерживать взгляд пользователя в камере» в том случае, если пользователь ответ глаза.

  • 12.    Adobe Enhance. Специализированная нейросеть, которая способствует устранению шума на аудиозаписях. Разработана зарубежом.

  • 13.    Voice.AI. Специализированная иностранная нейросеть, которая выступает в качестве генератора голоса.

  • 14.    DeepL. Зарубежная нейросеть в виде онлайн-переводчика, позволяющая быстро переводить текста различного объема.

  • 15.    Any Summary. Зарубежная уникальная нейросеть, которая может проанализировать текст любого объема и сократить его, сохранив при этом основной смысл.

  • 16.    Grammarly. Зарубежная нейросеть, которая основана на использовании искусственного интеллекта при использовании английского языка.

  • 17.    RoomGPT. Нейросеть, которая позволяет создать дизайн в комнатах. Она использует искусственный интеллект для создания различных вариаций. Является зарубежной.

  • 18.    Outfits AI. Иностранная нейросеть, которая позволяет изменять одежду на фотографии.

В рамках данного исследования предлагается разбить нейросети на подвиды по их функционалу. В результате представим таблицу с распределением наиболее популярных нейросетей по их функционалу (таблица).

Таблица. Классификация нейросетей по их функционалу

Функционал нейросети

Наименование нейросети

Генерация текста

CharacterAI, Bing AI

Создание изображений

Dall-E, Kandinsky, Шедеврум

Монтаж видео

Runway Gen-2, Nvidia Eye Contact

Работа со звуком

Adobe Enhance, Voice.AI

Производительность

DeepL, Any Summary, Grammarly

Развлечения

RoomGPT, Outfits AI.

Универсальные

ChatGPT, YandexGPT, GigaChat

Таким образом, следует разделять современные нейросети по следующим функциональным категориям: генерация текста, создание изображений, монтаж видео, работа со звуком, производительность, развлечения и универсальный формат.

Заключение

В рамках данной статьи проведено комплексное исследование, которое позволяет систематизировать информацию о генера- тивных нейросетях – они классифицируются в качестве ограниченного искусственного интеллекта. Также нами разработана собственная классификация генеративных нейросетей по их функциональной принадлежности: универсальные, для генерации текста, для работы со звуком, для работы с видео, для создания изображений, производительности, развлечений.

Список литературы Обзор современных генеративных нейросетей: отечественная и зарубежная практика

  • Барщевский Е.Г. Использование искусственного интеллекта // Восточно-Европейский научный журнал. - 2023. - № 3-2 (88). - C. 56-58. DOI: 10.31618/ESSA.2782-1994.2023.2.88.348 EDN: NCEYDM
  • Японский суперкомпьютер "K Computer". ABOUTDC.RU: системы вентиляции. - [Электронный ресурс]. - Режим доступа: https://www.aboutdc.ru/page/849.php (дата обращения: 12.01.2024).
  • Что такое GAN? AWS.AMAZON.COM. - [Электронный ресурс]. - Режим доступа: https://aws.amazon.com/ru/what-is/gan/(дата обращения: 12.01.2024).
  • Бесплатные нейросети. JOURNAL.TIKNOFF.RU: Тинькофф Журнал: журнал про ваши деньги. 2023. 31 авг. - [Электронный ресурс]. - Режим доступа: https://journal.tinkoff.ru/short/ai-for-all/#six (дата обращения: 12.01.2024).
  • Егорычев Д.Н., Егорычев А.Д. Направления влияния нейросетей на экономику, бизнес и образование // ЭСГИ. - 2023. - №2 (38). EDN: CWAITF
Статья научная