Обзор современных генеративных нейросетей: отечественная и зарубежная практика
Автор: Малышев И.О.
Журнал: Международный журнал гуманитарных и естественных наук @intjournal
Рубрика: Технические науки
Статья в выпуске: 1-2 (88), 2024 года.
Бесплатный доступ
В настоящее время все больше внимания уделяется развитию искусственного интеллекта в мире во всех сферах экономики. Поэтому важно иметь множество подходов по их развитию в различных отраслях и применению. Одним из ключевых вопросов при этом является подготовка кадров способных разрабатывать и усовершенствовать программы, а также их обслуживать. Автор статьи систематизирует информацию о генеративных нейросетях, а также классифицирует их в соответствии с функциональной принадлежностью.
Генеративные нейросети, искусственный интеллект, классификация, систематизация, отечественная практика, зарубежная практика
Короткий адрес: https://sciup.org/170203156
IDR: 170203156 | DOI: 10.24412/2500-1000-2024-1-2-168-171
Текст научной статьи Обзор современных генеративных нейросетей: отечественная и зарубежная практика
Современное общество развивается крайне быстрыми темпами. Совсем недавно понятие «генеративная нейросеть» было абсолютной диковинкой, а об их использовании в качестве рабочего инструмента не было и речи. Однако все значительно изменилось, и человечество стало использовать ИИ в повседневной жизни. Появилось множество генеративных нейросетей, которые обладают определенными возможностями и различным функционалом.
Благодаря этому формируется актуальность исследования – активное развитие искусственного интеллекта в Российской Федерации стало предпосылкой для появления множества инструментов, которые следует классифицировать и систематизировать. Так, в ряде вакансий на сайте HeadHunter на текущий момент можно увидеть новые обязанности сотрудников, связанных с владением генеративными нейросетями ChatGPT, Midjourney, DALLE и так далее.
Целью данного исследования является классификация и систематизация современных генеративных нейросетей как отечественного, так и зарубежного производства.
Задачи исследования:
-
1. Определение исторических предпосылок появления генеративных нейросетей;
-
2. Исследование сущности генеративных нейросетей;
-
3. Организация классификации генеративных нейросетей.
Объект исследования – генеративные нейросети.
Предмет исследования – развитие искусственного интеллекта в Российской Федерации и зарубежом.
Методы исследования, которые используются автором работы: сравнение, индукция, дедукция, синтез, анализ и прочие.
-
1. Результаты исследования
-
1.1. История появления генеративных нейросетей, их сущность
Генеративные нейросети – это неотъемлемая часть новой реальности. Следует понимать, что нейросеть – это вид искусственного интеллекта, а не он сам в прямом его понимании. То есть, это лишь его частица. Так, Барщевский Е.Г. в своей научной статье отмечает, что в 1956 году было дано определение понятию «искусственный интеллект» (ИИ). В соответствии с ним, искусственный интеллект – это возможность осуществления творческих задач как программными, так и техническими системами.
-
Также данный ученый определяет, что на текущий момент принято выделять всего три вида искусственного интеллекта. Он классифицируется в зависимости от задач, которые он должен выполнять. Видами ИИ являются [1]:
-
1. Общий искусственный интеллект. Это такой вид ИИ, который способен выполнять множество различных задач как человек. Примером данного ИИ являются различные суперкомпьютеры, к которым относится и K Computer от японской компании Fujitsu. Данное устройство является «суперкомпьютером общего назначения», призванным выполнять широкий спектр задач [2].
-
2. Ограниченный искусственный интеллект. Вид ИИ, который специализируется на конкретной задаче. Например, нейросеть DALL-E, которая может генерировать изображения по текстовому запросу (также именуется как prompt).
-
3. Искусственный сверхинтеллект. Вид ИИ, которого на текущий момент не существует. Являясь высокопотенциальным проектом будущего, данный ИИ может превзойти человека или группу людей, включая всё человечество.
Генеративные нейросети относятся к ограниченному виду ИИ, поскольку они могут решать только конкретные задачи и на настоящее время не способны соперничать с человеческим разумом.
Наиболее известным примером ограниченного искусственного интеллекта, получившим активное развитие в текущее время, является GAN. Само понятие Generative adversarial network (или сокращённо GAN) появилось не так давно. Оно переводится как «генеративно-состязательная сеть». Это специализированный алгоритм машинного обучения, который основан на комбинации двух нейросетей: G и D. Нейросеть G – это модель, которая генерирует данные, а D – это дискриминативная модель, которая определяет сгенерирован ли образец данных нейросетью G или нет. Данная технология была сформирована в 2014 году Ианом Гудфеллоу [3].
Нейросеть ChatGPT является примером функционирования GAN. Так, ChatGPT использует набор готовых текстов, а также может создавать абсолютно новые, которые схожи с реальными. В результате этого формируются такие тексты, которые максимально подходят под пользовательские запросы, а также выглядят привычным образом.
Именно благодаря данной технологии настоящее изменилось. Так, Егорычев Д.Н. и Егорычев А.Д. в своей научной статье рассматривают основные направления, которые затронут генеративные нейросети в современном мире: увеличение количества инвестиций в искусственный интеллект и генеративные нейросети, изменение привычных профессий или их исчезновение, появление инновационных продуктов и проектов, связанных с ИИ и генеративными нейросетями, изменение привычного функционала управленческих профессий, рост процента автоматизации процессов, связанных с продажами и производством, изменения в области интеллектуальной собственности [5]. С авторами данного исследования легко согласиться, поскольку уже сейчас генеративные нейросети активно влияют на мир: поменялись требования к некоторым рабочим профессиям (программисты и дизайнеры), система «Антиплагиат» ввела проверку на сгенерированный текст, а представители малого и среднего бизнеса оптимизируют затраты с помощью ChatGPT и DALL-E.
-
1. 2. Классификация генеративных нейросетей
Динамичной развивающийся мир предоставляет множество инноваций: компания Яндекс внедряет голосового помощника Алису (со встроенным YandexGPT) в портативные колонки, Сбер выпускает телевизоры совместно с собственной нейросетью – GigaChat. Недавно появившиеся генеративные нейросети, разнообразие их функционала, вариативность их применения – всё это требует проведения систематизации и классификации.
Поэтому рассмотрим современные наиболее популярные нейросети, которые активно применяются множеством людей в современном мире [4]:
-
1. ChatGPT. Зарубежная универсальная генеративная нейросеть, которая может создавать тексты, вести диалог, в соответ-
- ствии с запросами, которые пользователь ей предоставит.
-
2. Dall-E. Специализированная нейросеть, которая способна генерировать изображения, исходя из текстового запроса пользователей. Является зарубежной генеративной нейросетью.
-
3. Character AI. Специализированная платформа, которая может создать имитацию многих современных медийных личностей, популярных персонажей и так далее. Например, данная нейросеть может вести диалог от лица Илона Маска. Разработана иностранной компанией.
-
4. YandexGPT. Универсальная нейросеть, разработанная компанией из Российской Федерации. Может генерировать текст, вести диалог, а также связана с голосовым помощником – Алисой.
-
5. Bing AI. Это зарубежная генеративная нейросеть, отличающейся тем, что она связана с поисковой системой, что подтверждает достоверность информации в ответе пользователю.
-
6. GigaChat. Отечественная универсальная нейросеть, которая может создавать текст в ответ на запросы пользователя, генерировать изображения, а также вести диалоги.
-
7. Bing Image Creator. Нейросеть, которая может создавать изображения, исходя из текстового запроса пользователей. Разработана иностранной компанией.
-
8. Kandinsky. Нейросеть, разработанная в Российской Федерации, которая способна генерировать изображения и короткие анимационные ролики. Отличие данного сервиса от зарубежных аналогов в том, что она поддерживает русский язык и обладает «фотореализмом».
-
9. Шедеврум. Отечественная нейросеть, основанная на модели YandexGPT. Облада-
- ет возможностью генерировать картинки по текстовому описанию.
-
10. Runway Gen-2. Зарубежная нейросеть, которая работает с готовыми видеороликами, а также может генерировать видео по текстовому описанию.
-
11. Nvidia Eye Contact. Специализированная иностранная нейросеть, которая позволяет «удерживать взгляд пользователя в камере» в том случае, если пользователь ответ глаза.
-
12. Adobe Enhance. Специализированная нейросеть, которая способствует устранению шума на аудиозаписях. Разработана зарубежом.
-
13. Voice.AI. Специализированная иностранная нейросеть, которая выступает в качестве генератора голоса.
-
14. DeepL. Зарубежная нейросеть в виде онлайн-переводчика, позволяющая быстро переводить текста различного объема.
-
15. Any Summary. Зарубежная уникальная нейросеть, которая может проанализировать текст любого объема и сократить его, сохранив при этом основной смысл.
-
16. Grammarly. Зарубежная нейросеть, которая основана на использовании искусственного интеллекта при использовании английского языка.
-
17. RoomGPT. Нейросеть, которая позволяет создать дизайн в комнатах. Она использует искусственный интеллект для создания различных вариаций. Является зарубежной.
-
18. Outfits AI. Иностранная нейросеть, которая позволяет изменять одежду на фотографии.
В рамках данного исследования предлагается разбить нейросети на подвиды по их функционалу. В результате представим таблицу с распределением наиболее популярных нейросетей по их функционалу (таблица).
Таблица. Классификация нейросетей по их функционалу
Функционал нейросети |
Наименование нейросети |
Генерация текста |
CharacterAI, Bing AI |
Создание изображений |
Dall-E, Kandinsky, Шедеврум |
Монтаж видео |
Runway Gen-2, Nvidia Eye Contact |
Работа со звуком |
Adobe Enhance, Voice.AI |
Производительность |
DeepL, Any Summary, Grammarly |
Развлечения |
RoomGPT, Outfits AI. |
Универсальные |
ChatGPT, YandexGPT, GigaChat |
Таким образом, следует разделять современные нейросети по следующим функциональным категориям: генерация текста, создание изображений, монтаж видео, работа со звуком, производительность, развлечения и универсальный формат.
Заключение
В рамках данной статьи проведено комплексное исследование, которое позволяет систематизировать информацию о генера- тивных нейросетях – они классифицируются в качестве ограниченного искусственного интеллекта. Также нами разработана собственная классификация генеративных нейросетей по их функциональной принадлежности: универсальные, для генерации текста, для работы со звуком, для работы с видео, для создания изображений, производительности, развлечений.
Список литературы Обзор современных генеративных нейросетей: отечественная и зарубежная практика
- Барщевский Е.Г. Использование искусственного интеллекта // Восточно-Европейский научный журнал. - 2023. - № 3-2 (88). - C. 56-58. DOI: 10.31618/ESSA.2782-1994.2023.2.88.348 EDN: NCEYDM
- Японский суперкомпьютер "K Computer". ABOUTDC.RU: системы вентиляции. - [Электронный ресурс]. - Режим доступа: https://www.aboutdc.ru/page/849.php (дата обращения: 12.01.2024).
- Что такое GAN? AWS.AMAZON.COM. - [Электронный ресурс]. - Режим доступа: https://aws.amazon.com/ru/what-is/gan/(дата обращения: 12.01.2024).
- Бесплатные нейросети. JOURNAL.TIKNOFF.RU: Тинькофф Журнал: журнал про ваши деньги. 2023. 31 авг. - [Электронный ресурс]. - Режим доступа: https://journal.tinkoff.ru/short/ai-for-all/#six (дата обращения: 12.01.2024).
- Егорычев Д.Н., Егорычев А.Д. Направления влияния нейросетей на экономику, бизнес и образование // ЭСГИ. - 2023. - №2 (38). EDN: CWAITF