Применение современных технологий искусственного интеллекта в индустрии моды
Автор: М. Д. Демидова, Е. С. Рыкова
Журнал: Материалы и технологии @mat-tech
Рубрика: Техническая эстетика и дизайн
Статья в выпуске: 2 (14), 2024 года.
Бесплатный доступ
Искусственный интеллект на современном этапе развития ставит перед производителями в области лёгкой промышленности и моды ряд вызовов – решение этих сложностей поможет предприятиям получить конкурентное преимущество и развивать отрасль своей страны, что определяет актуальность исследований в этой области. Целью исследования является анализ возможностей искусственного интеллекта в сфере модной индустрии, специфики машинного и глубокого обучения, а также концепций «слабого» и «сильного» ИИ. Задачей работы является определение возможностей применения технологии, в частности генеративных моделей, в различных областях моды и лёгкой промышленности: маркетинге, разработке стратегий, логистике, системе рекомендаций, а также в создании дизайн-проектов одежды, обуви и аксессуаров. В работе упомянуто применение свёрточных нейронных сетей в фешен-сфере, подробно изложены принципы работы генераторов изображений (генеративно-состязательных сетей GAN и диффузионных моделей), проанализированы этапы деятельности дизайнеров моды с точки зрения интеграции ИИ-инструментов. При ряде преимуществ ИИ может допускать значительные погрешности и в определенных условиях работать некорректно – уделено внимание рекомендациям по работе с генераторами изображений во избежание создания нежелательного контента.
Лёгкая промышленность, мода, искусственный интеллект, генеративный искусственный интеллект, нейросети, дизайн костюма
Короткий адрес: https://sciup.org/142243345
IDR: 142243345 | DOI: 10.24412/2617-149X-2024-2-61-67
Текст статьи Применение современных технологий искусственного интеллекта в индустрии моды
Цифровизация принесла миру ряд разработок, которые успешно интегрировались в модную индустрию: неразменные токены (NFT), цифровые идентификаторы, дополненная и виртуальная реальности (AR- и VR-технологии, воплощаемые, например, в цифровых примерках на реальных и виртуальных людях), метавселенная (metaverse – виртуальный мир, существующий параллельно с реальным и взаимодействующий с ним) [1]. Ещё недавно на волне популярности была цифровая мода: разработка аватаров и образов для них. Созданием дигитальной одежды занимались такие бренды, как Burberry, Gucci, BVLGARU и др. [2]. Но сегодня самый большой ажиотаж вызывают искусственный интеллект (ИИ или AI – artificialintelligence) и развитие нейросетей. До сих пор ИИ привлекал внимание инженеров, IT-специалистов и аналитиков, но в настоящее время он стал выходить за рамки своих привычных областей применения, оставляя всё более заметный след в других областях [3].
Целью исследования является анализ возможностей искусственного интеллекта в сфере модной индустрии, специфики машинного и глубокого обучения, а также концепций «слабого» и «сильного» ИИ. Задачей работы является определение возможностей применения технологии, в частности генеративных моделей, в различных областях моды и лёгкой промышленности: маркетинге, разработке стратегий, логистике, системе рекомендаций, а также в создании дизайн-проектов одежды, обуви и аксессуаров.
Методологическим ориентиром исследования являются проблемно-логический метод и индуктивно-аналитический метод, позволившие обобщить изучаемый материал и представить его в логической последовательности, сформулировать основные теоретические выводы.
В исследовании представлены примеры российских и мировых фешен-брендов, которые экспериментально сотрудничали с генеративными моделями для создания коллекций и в других дизайн-процес-сах. Особое внимание уделено инновационному событию – серии конкурсных показов AI FashionWeek. Также рассмотрены научные эксперименты зарубежных коллег, применяющих в своих исследованиях GAN (StyleGAN 2), а также популярный сервис Midjourney: выявлены достоинства и недостатки подходов, а также особенности работы, которые необходимо учитывать для достижения оптимальных результатов.
ИИ представляет собой междисциплинарную область знаний, которая изучает методы создания компьютерных программ и систем, проявляющих интеллектуальное поведение. Нейросетями (нейронными сетями) в свою очередь называют математиче- ские модели, имитирующие работу биологических нейронных систем. Несмотря на то, что вне научного дискурса эти понятия используются как синонимичные, нейросети являются подмножеством ИИ и используются для обработки данных.
ОСНОВНАЯ ЧАСТЬ
Быстрое развитие ИИ в последние годы стало возможным благодаря совершенствованию когнитивных механизмов и данных [3]. Само понятие было введено в 1956 г. американским учёным Джоном Маккарти, однако ранее представления об ИИ были также предложены математиком-теоретиком Аланом Тьюрингом в 1930–1940-х гг. в его концепции «имитационной игры». В честь этого исследователя был назван тест, проверяющий способность машины демонстрировать интеллектуальное поведение.
Так сложилось понимание, что может появиться ИИ, аналогичный человеческому интеллекту по возможностям (в том числе эмоциональным) и способный с ним соперничать. Его назвали «искусственным общим интеллектом» (AGI – artificialgeneralintelligence), также используется понятие «сильный ИИ». Сроки его появления не определены, но современные модели уже способны создавать высококачественный контент. Условно считается, что ИИ сможет конкурировать с человеком, когда он пройдёт упомянутый тест Тьюринга и будет соответствовать своему сопернику по восьми аспектам: ИИ должен иметь идентичное человеку визуальное и звуковое восприятие, мелкую моторику, способность обрабатывать естественный язык, навигацию, креативность, социальную и эмоциональную вовлеченность, а также он должен уметь решать различные проблемы. Сегодня этот подход пересматривается: если ранее утверждалось, что абсолютная человекоподобность и есть проявление сильного ИИ, то сегодня ставится под вопрос интеллектуальность каждого человеческого действия. В свою очередь, «узким» ИИ (narrowAI) называют модели, выполняющие чётко определённые функции: к ним и относится генеративный ИИ, который решает конкретные, ограниченные задачи (например, создание изображений).
ИИ способен значительно оптимизировать биз-нес-процессы: в виду способности нейросетей обрабатывать беспрецедентный объем данных, машинное обучение (ML – machinelearning) может использоваться для эффективной работы конкретных процессов и предприятий в целом. Так называют область ИИ, которая адаптируется к различной входной информации, включая большие наборы данных и инструкций. Алгоритмы ML могут обнаруживать закономерности, учиться делать прогнозы и давать рекомендации через обработку данных и опыта. В обучении нередко задействован человек, который первоначально размечает определенный объем данных, с которыми и работают алгоритмы.
Глубокое обучение (DL – deeplearning) – более продвинутый подход в ML, позволяющий обрабатывать широкий спектр информационных ресурсов (текст, неструктурированные данные – изображения), которыми не нужно управлять вручную [3]. В глубоком обучении используются нейросети, работающие как нейроны в человеческом мозге, принимая и обрабатывая данные через нейронные слои и распознавая их сложные характеристики.
Большую роль в работе с мультимодальными нейросетями (text-to-text и text-to-image моделями) играет обработка естественного языка (NLP – naturallanguageprocessing), направленная на распознавание письменной речи. Многолетние исследования позволили обработать значительные объёмы текстовых выборок, которые выступают как источники контекста, словарного запаса, синтаксиса и семантического значения [3].
ИИ сегодня активно внедряется, например, в области маркетинга и продаж, разработки продуктов и услуг, стратегиях и корпоративных финансах. Но последним трендом стала его интеграция в области дизайна и моды. Так, например, он может применяться на этапе создания продукта (элемента костюма): ИИ может помочь в преобразовании эскизов в высококачественные дизайны, обогатить идеи через генерацию креативных вариантов, адаптировать с учётом потребностей отдельных потребителей [4]. Так, например, возможно внедрение эскизов, тканей, цветовых палитр и узоров на платформу, работающую на базе GAI, для автоматизации создания дизайна модной продукции [1].
Отдельно стоит обратить внимание на цифровые примерки одежды, которые реализуются не только с помощью AR- и VR-технологий, но и ИИ. Задача виртуальной примерки – перенести одежду на исходное изображение человека. Этот процесс сопряжен с трудностями получения реалистичного результата: из-за различий между людьми на изображениях и образов моделей появляется проблема согласования двух тел. Бесшовный синтез желаемой одежды и модели в целевом изображении также является фактором, влияющим на успех процесса виртуальной примерки [1].
Также в системе рекомендаций цифрового шопинга используются свёрточные нейросети (CNN – convolutional neuralnetwork) и технологии компьютерного зрения. Они применяются для извлечения визуальных характеристик предметов [1] и при поиске одежды, которая была сфотографирована в реальной жизни. Благодаря значительным возможностям извлечения признаков, методы глубокого обучения стали наиболее распространённым решением проблемы поиска модной одежды. Для моделирования сходства предметов костюма используется глубокая сеть, которая применяется для определения, является ли одежда на двух изображениях одинаковой на основе набора разработанных правил [1]. Образцы с совпадающими метками рассматриваются как положительные пары, с несовпадающими – как отрицательные. Такой поиск помогает клиентам выбрать подходящие товары из огромного набора данных [1].
Но в контексте дизайн-деятельности наиболее интересен генеративный ИИ (genAI или GAI) – технология, создающая контент (аудио, видео: код, текст, изображения) в соответствии с поступающим запросом. Вместо того, чтобы просто идентифицировать или классифицировать информацию, генеративный ИИ создаёт новые данные, используя DL.
После прорывного 2023 г. генеративный ИИ стал интегрироваться и в индустрию моды. По результатам исследования BoF-McKinsey, 73 % респондентов заявили, что создание ИИ станет важным приоритетом для бизнеса в 2024 г., однако в регулярные процессы GAI внедрили только 4 % руководителей модных брендов. Крупные компании предпочитают действовать осторожно, постепенно интегрируя новые технологии. Одним из наиболее востребованных подходов становится использование в дизайне и разработке продукта [4].
Генеративный ИИ, по мнению Harreis H., Koullias T., Roberts R. и Te K., способен повлиять на всю экосистему моды: его можно применять для создания продаваемых дизайнов, снижения затрат на маркетинг, в целях персонализации, для оптимизации логистических процессов [1]. Достижения в этой области позволили эффективнее анализировать данные, прогнозировать тренды, совершенствовать рабочие процессы дизайнеров моды. Их самостоятельная деятельность состоит из основных пяти этапов.
-
1. Анализ внутренних и внешних данных. Обычно разработка дизайна одежды реализуется за полгода или год до начала сезона продаж. Внутренними данными при этом называют результаты реализации прошлых коллекций, информацию о наиболее востребованных товарах. В итоге определяются ключевые тенденции, которые поспособствовали прибыльности. Также анализируются мировые тенденции моды на основе разработок ведущих брендов – внешние данные. Подиумные коллекции являются одним из наиболее значимых и весомых факторов в создании модных изделий.
-
2. Определение концепции в качестве направления сезона. Дизайнерами определяется общая
-
3. Создание дизайна одежды в соответствии с концепцией сезона. Концепция позволяет сохранять единообразие коллекции и включает различные модификации костюмов. На оценку разработок влияет мнение не только дизайнеров, но и менеджеров магазинов и мерчендайзеров.
-
4. Модификация вновь созданного дизайна необходима для переработки успешного опыта и фирменного стиля бренда, который узнают постоянные покупатели.
-
5. Доработка дизайна одежды [5] – этот процесс исследователи рекомендуют реализовывать дизайнерам вручную.
тема и настроение дизайнов одежды.
Согласно анализу McKinsey, генеративный ИИ в области моды может применяться в разработке продукта на стадиях написания брифа, создания мудбордов, визуальных образов и творческого вдохновения, а также в преобразовании эскизов в реалистичные визуализации [4]. Пока создание 3D-моделей –не самая развитая способность генеративного ИИ, однако потенциально он может справиться с этой задачей.
Исследователи рассматривают различные пути работы с изображениями с помощью ИИ: наибольшее внимание привлекают диффузионные модели (diffusion-modeling-basedAI или diffusionmodels) и генеративно-состязательные сети (generativeadversarialnetwork – GAN). Они произвели революцию в способах создания, изменения и улучшения изображений, обеспечив беспрецедентный уровень реализма и креативности [6].
Модель GAN – это неконтролируемый метод глубокого обучения, который генерирует или редактирует новые поддельные изображения. Принцип её работы основывается на взаимодействии генератора и дискриминатора [6]. Они конкурируют друг с другом за улучшение качества генераций [5]: сеть генератора создает картинки, в то время как сеть дискриминатора различает реальные и сгенерированные изображения. Например, GAN может использоваться для управления текстурами: так была разработана нейросетьTextureGAN, с помощью которой можно размещать текстурный патч на эскизе в произвольных местах и масштабах. Другая модель, FashionGAN, также работает и с эскизами одежды, помимо рисунков тканей. Система устанавливает взаимосвязь между тканью и скрытым вектором, чтобы она вела себя наиболее реалистичным образом [6].
Вероятностная модель шумоподавляющей диффузии (DDPM – denoisingdiffusionprobabilisticmo del) представляет другой подход к генеративному моделированию, основанный на диффузных процессах. DDPM итеративно обновляет условную плот- ность, используя случайный шум, для постепенной генерации реалистичных выборок [6].
Как отмечают Guo Z., Zhu Z., Li Y., Cao S., Chen H. и Wang G., методы, основанные на GAN, могутиспользоваться в дизайне одежды для создания новых моделей, но им не хватает контроля над внешним видом и формой изделий при переходе от изображений, не относящимся к области моды [6]. Несмотря на то, что сегодня существует меньше программ, работающих на диффузионных моделях, они успешно справляются с семантической генерацией новой одежды из представленных и эталонных изображений.
Применение ИИ сегодня – одна из самых востребованных исследовательских тем в области моды, учёные ищут свои подходы в разработке дизайнов изделий. Так, например, в своей статье Choi W., Jang S., Kim H.Y., Lee S., Lee H. и Park S. представили разработку автоматизированного проектирования с использованием ИИ, которая состоит из четырёх модулей: первый и второй включают сбор и анализ внутренних и внешних данных соответственно, третий функционирует как база данных источников дизайна, служа хранилищем, а четвертый создает дизайны одежды и изменяет их [5] – он реализован на базе модели StyleGAN 2 [5], которая используется для генерации лиц людей.
В своём исследовании Zhang Y. и Liu C. рассмотрели возможность применения сервиса Midjourney в разработке коллекции одежды. Midjourney – это ИИ-генератор преобразования текста в изображение на основе диффузионного моделирования, как и аналогичные DiscoDiffusion, StableDiffusion и DALL-E 2 (на сегодняшний день наиболее эффективна третья версия ИИ), а также российские YandexART и Kandinsky 3.1. В общем механизм диффузионного моделирования в системах генерации изображений с ИИ включает три этапа:
-
– использование подсказок ввода (ключевых слов и текстовых описаний – промптов) для извлечения соответствующих изображений;
– наложение случайного (Гауссовского) шума, чтобы скрыть выбранную информацию об изображении, создавая вариации;
– рассеивание шума для создания изображения, соответствующего текстовым подсказкам.
Примечательно, что использование идентичных подсказок не приведёт к одинаковым результатам [7], поэтому особую важность приобретает корректировка подсказок для достижения наилучших результатов. Таким образом, подход множественных итераций так же может принести свои плоды, как и редактирование промпта.
В работе с генеративным ИИ могут возникнуть проблемы, связанные с обработкой и уточнением подсказок ввода. Поэтому авторы отмечают важность ручного редактирования концепций, созданных с помощью ИИ: необходимо учитывать силуэт, конструкцию, ткань, эстетические свойства будущего изделия [7].
Исследователи выявили, что, при ряде преимуществ, всё ещё сложной задачей остаётся достижение сходства между изображениями, генерация разных ракурсов, а также Midjourney не всегда может отредактировать детали выходных изображений, что приводит к необходимости ручного вмешательства [7]. В свою очередь, несмотря на меньшую виртуозность в создании художественных изображений, Kandinsky 3.1 всё же позволяет корректировать изображения: менять объекты и задавать промпт для конкретных редактируемых участков. Zhang Y. и Liu C подчёркивают, что внедрять ИИ можно как в разработке физических, так и цифровых коллекций [7], однако в случае с первыми ИИ стоит использовать на начальных этапах проектирования, полагаясь на опыт и активное участие дизайнеров.
На сегодняшний день уже представлены опыты практического применения генеративного ИИ: CollinaStrada и HeliotEmil уже использовали эту технологию в коллекции SS 2024. Оба бренда применяли в качестве инструмента базу данных из прошлых коллекций и усовершенствовали генерацию языковыми подсказками.
Позитивный опыт интеграции ИИ демонстрирует и американский бренд Levi’s – в 2021 г. он запустил учебный лагерь по машинному обучению. В результате значительно улучшилась коммуникация с сотрудниками-технарями. Дизайнеры и инженеры стали лучше понимать друг друга, а обучение сыграло удерживающую роль: для сотрудников оно стало мотивацией к продолжению деятельности в компании [1]. Так развитие профессиональной грамотности благоприятно отражается на предприятиях и на самих участниках рабочих процессов.
Также и российские бренды используют генеративные модели: например, летом 2023 г. GloriaJeans продемонстрировали коллекцию, созданную в содружестве с ИИ, а дизайнер Алёна Ахмадуллина представила лукбук весна–лето 2023, с использованием сгенерированных иллюстраций.
Отдельно стоит отметить, что ИИ расширил горизонты развития моды в цифровой реальности: так с 2023 г. проходят конкурсные показы AIFashionWeek – инновационного мероприятия, в ходе которого объединяются и конкурируют дизайнеры, использующие генеративные модели в своей деятельности. Такие события стимулируют интерес к ИИ среди профессионалов – это может благоприятно отразиться на развитии моды в целом, укреплении позиций модного бизнеса и лёгкой промышленности, а также на разработке новаторских дизайн-подходов.
Несмотря на то, что использование ИИ потенциально стимулирует развитие лёгкой промышленности и моды, его применение сопряжено с определёнными рисками. Например, убедительность результатов генераций не всегда свидетельствует о правильности результатов, так как модели обучаются на информации, в которой содержится доля человеческой предвзятости (гендерной, расовой и т. д.). Остро встают вопросы конфиденциальности, безопасности, надёжности, организационного, социального и экологического воздействия, а также интеллектуальной собственности [8]. Поэтому приоритетным становится ответственное использование генеративного ИИ, предпринимаются попытки снижения различных рисков, связанных с его применением:
– специалистам необходимо реализовывать тщательный отбор исходных данных во избежание ошибок и этических промахов;
– организациям стоит использовать небольшие специально разработанные модели, обученные на специальных источниках, так как использование GAI без собственных данных не даёт глубокого понимания процессов [9];
– если компания не имеет ресурсов для обучения ИИ с нуля, можно настраивать сторонние базовые модели или альтернативы с открытым исходным кодом [4];
– полученную информацию необходимо перепроверять – регулярный фактчекинг должен стать частью рутины человека;
– нельзя поручать ИИ принятие важных решений.
С развитием ИИ модная индустрия будет сталкиваться с необходимостью решения ряда сложностей, таких как:
– отбор качественных и многообразных данных, включающих в себя различные стили и культурные особенности, инклюзивный подход и т. д.;
– возможность качественного и эффективного синтеза моды в реальном времени, который оптимизирует деятельность дизайнера;
– мультимодальная интеграция – реализация полноценного бесшовного взаимодействия между текстом, изображениями и другими формами контента для более эффективного выражения мысли дизайнера;
– возможность интерпретации и понимания поведения ИИ [6].
Однако именно решение этих проблем позволит предприятиям актуализироваться и стать более востребованными в контексте современности.
Использование генеративного ИИ сегодня – не модный тренд, а требование нашего времени. Очевидно, что брендам будет необходимо значительно инвестировать в технологии. Особую важность приобретает обучение кадров в области лёгкой промышленности, в том числе конструкторов и дизайнеров [10]. Повышение квалификации позволит им пользоваться современными технологическими преимуществами, что благоприятно скажется на экономических показателях компании. При этом важно обращать внимание на реализацию тесной взаимосвязи и согласованности ИИ со стандартными отраслевыми процессами для обеспечения его практического применения в производстве [5].
ИИ предлагает также и новое качество жизни потребителя: это отражается как на маркетинговой, так и на дизайн-составляющей, поэтому лидерам индустрии необходимо задавать тон и на собственном примере демонстрировать эффективность применения GAI в бизнес-процессах, в том числе в творческих его этапах [4].
В заключение стоит сказать, что ИИ на данном этапе своего развития исключительно человекоориентирован. Он призван помогать профессионалам в разных областях, освобождать их от рутинной работы, с которой способна справиться машина, причём достаточно быстро. Таким образом, люди продолжат заниматься тем, что смогут сделать только они, как специалисты: это касается всех по-настоящему творческих процессов и креативной деятельности [1]. Поэтому важно воспринимать ИИ не как соперника, а как новый неотъемлемый инструмент, который способен усовершенствовать рабочие процессы, сделать их более адаптивными, современными, эффективными.
ЗАКЛЮЧЕНИЕ
В научном исследовании проанализированы принципы работы генераторов изображений (генеративно-состязательных сетей GAN и диффузионных моделей), проанализированы этапы деятельности дизайнеров моды с точки зрения интеграции ИИ-инструментов. В работе представлены примеры российских и мировых фешен-брендов, которые экспериментально сотрудничали с генеративными моделями для создания коллекций и в других ди-зайн-процессах. Особое внимание уделено инновационному событию – серии конкурсных показов AIFashionWeek. Также рассмотрены научные эксперименты зарубежных коллег, применяющих в своих исследованиях GAN (StyleGAN 2), а также популярный сервис Midjourney: выявлены достоинства и недостатки подходов, а также особенности работы, которые необходимо учитывать для достижения оптимальных результатов. При ряде преимуществ ИИ может допускать значительные погрешности и в определенных условиях работать некорректно – уделено внимание рекомендациям по работе с генераторами изображений во избежание создания нежелательного контента. ИИ ставит перед производителями в области лёгкой промышленности и моды ряд вызовов – решение этих сложностей поможет предприятиям получить конкурентное преимущество и развивать отрасль своей страны.