Семиотика, искусственный интеллект и сохранение культурной идентичности
Автор: Рыбак К.Е., Избачков Ю.С.
Журнал: Культурологический журнал @cr-journal
Рубрика: Теоретическая культурология
Статья в выпуске: 4 (62), 2025 года.
Бесплатный доступ
Статья посвящена проблемам задействования разработчиками искусственного интеллекта наборов данных, связанных с локальными культурами, их обработкой и использованием в дальнейшем для обучения новых поколений нейросетей. Отмечается, что нейросети могут стать орудием, с помощью которого можно табуировать (диффамировать) культурные коды и элементы традиционных культур. Эта новая реальность диктует новые требования к репрезентации (популяризации) локальных культур миру, чтобы таковые не были забыты, проигнорированы или искажены. В связи с чем следует тщательно относиться к материалам, которые отражают локальные культуры и увеличивать объемы их представления в сети Интернет с подробным описанием изображений, отражающих элементы национальных культур.
Семиотика, символ, нейросеть, отмена культуры, инструмент культурного доминирования, искусственный интеллект
Короткий адрес: https://sciup.org/170211153
IDR: 170211153 | DOI: 10.34685/HI.2025.72.34.010
Текст научной статьи Семиотика, искусственный интеллект и сохранение культурной идентичности
В эпоху цифровых технологий обсуждение модели символа получает новый импульс.
Снова заявляет о себе необходимость выделения случая как отдельного элемента в схеме, связывающего означающее и означаемое. С появлением искусственного интеллекта (ИИ) появляется возможность отделения этой связи от сознания человека. Связь между означающим и означаемым – случай – становится внешней по отношению к творческой деятельности человека. Человеческая культура замещается культурой искусственного интеллекта.
Это можно наглядно продемонстрировать на примере генерации изображений нейронными сетями (нейросетями).
Нейросети ‒ это математические алгоритмы, параметры (коэффициенты) которых зависят от данных, которые эти алгоритмы обрабатывают. Создание нейросети предполагает выбор ее архитектуры, то есть общих правил, как данные внутри нее будут обрабатываться. На практике это означает, в какой последовательности соединены между собой блоки сложного алгоритма, что определяет последовательность прохождения обучающих данных.
Обучающие данные в частном случае генерации изображений схематично можно представить как набор большого числа пар: изображение ‒ описание, что на нем изображено. В процессе обучения нейросети эти пары (весь массив обучающих данных или его часть) многократно пропускаются через алгоритм. После каждого прогона оценивается, насколько текущие коэффициенты алгоритма позволяют преобразовывать исходные данные ‒ описание изображения в собственно изображение. Распознавание образов и оценка может осуществляться как человеком, так и автоматически.
Проверка происходит таким образом: на вход подается описание, итоговый результат ‒ изображение. Если изображение соответствует описанию, результат положительный, если нет ‒ отрицательный. Результат проверки является исходными данными для так называемого «алгоритма обратного распространения ошибки» ‒ набора формул, с помощью которых корректируются коэффициенты алгоритма. Образно это можно представить собой как волну, которая проходит алгоритм с начала до конца, а потом обратно, изменяя параметры алгоритма.
Обучение нейросети как разновидности искусственного интеллекта заключается в многократном повторении описанной процедуры. Количество итераций зависит от объема данных и заданных требований к качеству нейросети и на практике может доходить до миллионов. По времени это может занимать несколько месяцев непрерывной работы самых современных компьютеров.
После того как волна многократно пройдет через алгоритм, каждый раз уточняя коэффициенты нейросети, они оказываются подобранными таким образом, что текстовое описание, поданное на вход алгоритма, преобразуется во вполне пригодный для восприятия человеком визуальный результат ‒ сгенерированное изображение, которое можно использовать сразу или с небольшой корректировкой дизайнера, например, в качестве иллюстраций на сайтах или в книгах.
Здесь существует множество сложных юридических и экономических проблем об авторстве полученных изображений и переносе издержек по обучению нейросети в конечную стоимость услуг и капитализацию компаний.
Но за юридическими и экономическими аспектами незаметны культурологические проблемы. Нейросети могут стать орудием, с помощью которого можно табуировать (диффамировать) культурные коды и элементы традиционных культур.
Для конечного пользователя нейронной сети не особо важно, какой результат он получит. Администратора сайта в конечном итоге устроит изображение, которое сгенерировала нейросеть, лишь бы оно более-менее отвечало представлениям его целевой аудитории. Для него самое главное, чтобы это было дешево или бесплатно: не нужно покупать соответствующее изображение у стороннего живого художника-оформителя, а штатный дизайнер должен получить от нейросети необходимый результат в минимальный срок. Экономическая составляющая ‒ удешевление производства ‒ является основным стимулом развития нейросетей.
Ключевым фактором, определяющим результат, выдаваемый нейросетями, ‒ это обучающие данные и их подбор. Значение второго фактора ‒ участие человека в форме оценки результата, всё больше уменьшается.
Если для обучения нейросети были предоставлены данные, например, соответствующие определенному направлению в живописи, то результат будет создан в соответствии с образцами этого направления. Нейросеть будет создавать изображения в этой же стилистике, случайным образом модифицируя изображение. Так, если все изображения женщин в обучающем наборе данных будут взяты с картин Энди Уорхола, то на сгенерированных изображениях все женщины будут похожи на эти изображения.
Опасность таит навязывание символов определенной культуры и игнорирование элементов других культур вкупе с глобализацией, когда существует небольшое количество используемых нейросетей. что определятся большими затратами на их обучение.
Особенно это касается культуры небольших народов. Например, если образцы культуры аварцев или даргинцев не будут даны нейросетям для обучения, то они останутся незамеченными, проигнорируются.
В современном нам мире нейросети (и как более широкая категория ‒ искусственный интеллект) играют ту же унифицирующую роль, как в свое время – появление централизованной власти, книгопечатания или центрального телевидения.
Возможность отчуждения связи (случая) между означающим и означаемым от человека к искусственному интеллекту корреспондирует с теорией «горячих» и «холодных» источников информации (концепция канадского культуролога Маршалла Маклюэна [1]). Образы в современном мире становится все более «горячими» медиа, то есть информация чаще всего предоставляется человеку в законченном виде, не предусматривающем ее додумывания и обдумывания.
Вместе с тем реальность, в которой искусственный интеллект будет играть всё большую роль в создании культуры (точнее, переработке культуры и ее доведению по человека), нужно осознать, принять и приспособиться к ней.
Главной проблемой обучения искусственного интеллекта в настоящее время является недостаток качественных обучающих материалов.
Небольшое отступление. Пример набора данных в сети Интернет, содержащих сведения о материальных культурных ценностях, который мог быть использован в качестве обучающего материала для нейростей – Государственный каталог Музейного фонда Российской Федерации [2]. Каждый предмет, включенный в состав Музейного фонда, на сайте Государственного каталога сопровожден учетными реквизитами (инвентарем), описанием и изображением предмета. Вместе с тем, описания музейного предмета, зачастую не раскрывают существенные стороны предмета и его достоинства, обосновывающие его историко-культурную, художественную и иную ценность. Тем самым ставится под вопрос качество обучения нейросетей на основе данных Государственного каталога.
Итак, нейросети как класс алгоритмов были впервые описаны в 1943 году. Но из-за необходимости использования больших вычислительных мощностей их использование стало возможно только в XXI веке. Прорывных идей, касающихся архитектуры и проектирования искусственного интеллекта не так много. Материалы для обучения становятся самым ценным ресурсом. Особенно те, которые созданы человеком.
Человеческий труд остается самым дорогим ресурсом в сравнении со стоимостью «машинного времени», тем более, когда требуется много человеко-часов. Наборы данных, созданные с участием человека ‒ это качественный, но дорогой ресурс. Технологическая необходимость и конкуренция вынуждает крупных разработчиков искусственного интеллекта искать пути удешевления своих разработок. Речь идет о создании искусственного интеллекта, который сам собирает материалы для обучения другого искусственного интеллекта. Программы-роботы просматривают материалы, собранные программами-роботами поисковых систем, и формируют обучающие наборы данных (следующий шаг в развитии ‒ это когда искусственный интеллект сам непосредственно будет обучать другой искусственный интеллект, а затем ‒ сам обучать себя).
Применительно к генерации графических образов это означает, что найденное в сети изображение будет сопоставлено с имеющимся описанием, будет создана пара изображение ‒ описание, которая будет включена в обучающий набор (их называют «дата-фрейм» или «фрейм данных»).
Поскольку новая реальность диктует новые требования к репрезентации (популяризации) локальных культур миру, чтобы таковые не были забыты, проигнорированы или искажены следует более тщательно относиться к материалам, которые отражают локальные культуры. Необходимо не только увеличивать объемы представления их в сети Интернет, но также подробно описывать изображения. Тогда возрастает вероятность, что робот отберет это изображение и поместит его в качественный дата-фрейм.
В идеале делать дата-фреймы с большей долей человеческого труда. Например, крупная коллекция изображений, имеющих отношение к культуре адыгов (костюмы, музыкальные инструменты, церемонии, быт) с описанием, которое адаптировано под восприятие искусственной интеллекта, поможет не затеряться в информационном потоке генерируемого контента.
Это дорого, но в существующих реалиях идет речь о сохранении культурной идентичности. В условиях ограниченности ресурсов государственной поддержки культуры это напрямую связано с расстановкой приоритетов. Чем шире представлена культура того или иного народа, тем о ней больше знают, тем больше считаются с ней. Сделать дата-фрейм для обучения искусственного интеллекта или организовать выставочный проект или гастроли национального театра? Полагаем, что искусственный интеллект сейчас более приоритетный вариант. По причине развития технологий искусственного интеллекта, который рискует зайти в мертвый цикл: нейросети будут все более часто использоваться для генерации контента, который потом будет отбираться из сети программами-роботами и представляться для обучения новому поколению нейросетей.
Вмешательство в этот процесс человека, в первую очередь специалиста по культуре ‒ этот круг разрывает. А за счет более качественного подбора обучающих данных, созданных человеком, таки наборы станут основой, «золотым фондом» обучения искусственного интеллекта. И делать это нужно сейчас. Потом будет поздно.