Искусственные звуковые среды: создание, моделирование, применение
Автор: Столбова П.А.
Журнал: Вестник Восточно-Сибирского государственного института культуры @vestnikvsgik
Рубрика: Культурология
Статья в выпуске: 2 (34), 2025 года.
Бесплатный доступ
В статье рассматривается концепция искусственных звуковых ландшафтов, создаваемых с помощью вычислительных моделей, алгоритмов и математических формул. Такие аудиальные среды обладают высокой степенью динамичности и способны адаптироваться к изменениям в реальном и виртуальном пространстве, что делает их востребованными в киноиндустрии, видеоиграх, музыкальном производстве и выставочных проектах. Анализируются ключевые принципы и преимущества создания искусственных звуковых ландшафтов. Ученые и специалисты в области звукового дизайна предполагают, что дальнейшее развитие интерактивного звука будет тесно связано с технологиями процедурной генерации. Исследования показывают, что применение звуковых баз данных и вероятностных методов позволяет создавать адаптивные звуковые среды, в которых аудиальные элементы меняются в зависимости от действий пользователя, создавая эффект развивающегося природного звукового пространства.
Звуковой ландшафт, искусственный звуковой ландшафт, генеративная модель, звуковое оформление, инструменты проектирования
Короткий адрес: https://sciup.org/170209462
IDR: 170209462 | УДК: 534.3+681.84 | DOI: 10.31443/2541-8874-2025-2-34-90-99
Artificial sound environments: Creation, modelling, application
The article considers the conception of artificial soundscapes created with the help of computational models, algorithms and mathematical formulas. Such auditory environments have a high degree of dynamism and are able to adapt to changes in real and virtual space, which make them be in demand in the film industry, video games, music production and exhibition projects. The key principles and advantages of creating artificial soundscapes are analyzed. The scientists and experts in the field of sound design presume that further development of interactive sound will be closely connected with the procedural generation technologies. The research shows that the use of sound databases and probabilistic methods makes it possible to create adaptive sound environments in which auditory elements change in dependance of the user ‘s actions, creating the effect of developing natural sound space.
Текст научной статьи Искусственные звуковые среды: создание, моделирование, применение
Звуковой ландшафт – это совокупность акустических элементов, формирующих иммерсивную среду и создающих эффект погружения в искусственно сформированное пространство. По своей сути, это система звуков, образующаяся в окружающей среде и включающая как естественные акустические явления, так и звуки, создаваемые человеком и технологиями.
Звуковой ландшафт – важная часть культурного пространства, выраженного через звук. Впервые данный термин был введен M. Southworth [13] и получил широкую известность благодаря исследованиям R. M. Schafer [9].
Звуковой ландшафт – не только предмет научных исследований, но и играет значимую роль в культурной, социальной и экологической сферах. Его изучение и регулирование способствует улучшению акустического комфорта, снижению уровня шумового загрязнения и сохранению уникального звукового облика различных мест.
Развитие данной области привело к переходу от анализа существующих звуковых ландшафтов к созданию искусственных акустических сред. Если ранее исследования были сосредоточены на изучении структуры звукового окружения и его влияния на человека, то в настоящее время внимание все больше уделяется целенаправленному проектированию звуковых пространств.
Современные технологии не только позволяют документировать и анализировать звуковые ландшафты, но и дают возможность создавать искусственные акустические среды, которые могут как воспроизводить природные звуки, так и формировать совершенно новые звуковые композиции, значительно расширяя спектр их практического применения.
Искусственный звуковой ландшафт – это акустическая среда, образованная с применением алгоритмов и математических моделей. Этот метод позволяет создавать динамичные саундтреки, изменяющие как в реальном, так и в виртуальной пространстве.
Ранее предпринимались попытки разработки вычислительных моделей для генеративных звуковых ландшафтов. В статье 1998 г. [8] авторы предложили метод автоматизированного создания звуковых пространств в рамках проекта Аудио Аура (Audio Aura), где динамически генерировались морские звуковые пейзажи для передачи информации в различных приложениях, включая уведомления по электронной почте. Однако этот подход ограничивался узким набором звуковых источников и был сосредоточен исключительно на отображении информации.
Исследование D. Birchfield et al. [2] и коллег основано на вероятностном отборе звуковых дорожек, соответствующих концепции R. M. Schafer о ключевых и сигнальных звуках. В данной модели использовался лексический поиск через WordNet, а изменяющиеся вероятности активации звуков в ответ на действия пользователя создавали динамически развивающуюся звуковую среду, приближенную к естественной акустической обстановке. Этот метод базируется на принципах акустической экологии и предоставляет основу для автоматизированного формирования как реалистичных, так и воображаемых звуковых пространств.
Другое исследование, проведенное N. Finney и J. Janer [5], рассматривает использование неструктурированных звуковых баз данных для озвучивания виртуальных сред. В их методе применяется конкатенатив-ный синтез, позволяющий генерировать звуковые ландшафты из аудиоматериалов, загруженных онлайн-со-обществами, таких как Freesound. В рамках этого подхода разработана система генерации звуковых пейзажей для Гугл Стрит вью (Google Street View). Дополнительно модель включает параметризацию входных данных и ресинтез с несколькими слоями исходных и текстурных звуков.
Также изучается система аннотирования звуков [12], в которой разбираются вопросы семантики и пользовательского восприятия, предлагается методология структурированного аннотирования для повышения точности и эффективности процесса.
В работе [11] тестируется влияние звукового дизайна на ощущение присутствия в виртуальной реальности. Приведены предварительные результаты, позволяющие сопоставить восприятие реальных и виртуальных звуковых ландшафтов.
Кроме того, в обзоре [7] систематизированы существующие методы создания звуковых сред, сгруппированные по используемым технологиям, источникам звуков и их применению.
Исследование [3] посвящено системе Каминг Тугезе: Фри саунд (Coming Together: Freesound), в которой четыре автономных агента выбирают звуки из предварительно проанализированной базы данных, ориентируясь на их спектральные характеристики и метаданные.
В другом проекте [4] рассматриваются принципы проектирования автономного движка генерации звука, а также проблемы, связанные с параметризацией поиска, сегментацией и синтезом.
Обзор D. Schwarz [10] посвящен методам анализа, используемым в синтезе звуковой текстуры. В нем рассматриваются такие техники, как сегментация, статистическое моделирование, анализ тембра и моделирование переходов между звуками.
Итак, рассмотренные работы демонстрируют разнообразие подходов и инструментов для конструирования искусственных звуковых сред. Они основаны на генерации определенного аудиального оформления с использованием базы данных звуковых файлов. Акценты сделаны на процессе внедрения звуков в систему и дальнейшее их существование, в частности адаптация к текущим условиям.
Лучшая аналогия для составления звуковых ландшафтов – это коллаж. Один из способов думать о создании звуковых ландшафтов – как о форме звукового коллажа, где вместо фрагментов изображений нужно работать с аудиофайлами, размещенными на нескольких дорожках в цифровой звуковой рабочей станции.
Если придерживаться аналогии с коллажем, то они работают в мире 2D-изображений так, что каждый элемент должен быть интересным сам по себе, а затем, когда он сочетается с другими увлекательными частями, общее визуальное воздействие становится сильнее. Если каждый элемент слаб, итоговый коллаж не будет выразительным. Звуковой ландшафт сцены служит основой всего микса, являясь ориентиром для восприятия и понимания всех остальных элементов саундтрека.
Таким образом, создание звуковых ландшафтов – это форма искусства, объединяющая музыку и эмоции. Осваивая такие техники, как наложение слоев, пространственное проектирование и тематическая интеграция, специалист может создавать захватывающие звуковые миры, которые погружают слушателей в увлекательные, многослойные и насыщенные пространства.
Приведенные ниже ресурсы предлагают готовые инструменты для генерации звука в реальном времени. Более подробное изложение методов можно найти в статье автора, посвященной подготовке искусственных звуковых ландшафтов для техногенных объектов [1]. Основное внимание уделяется использованию цифровых технологий, таких как редактирование записанного звука (включая пространственную, динамическую и частотную обработку), а также генерированию звуков без готовых аудиофайлов. В рамках проекта рассматриваются два подхода к генерации музыки и звуков: генеративное и процедурное аудио (рис. 1).
- Использует алгоритмы и математические формулы - Генерирует неповторимые саундтреки
- Не требует постоянного взаимодействия
-Адаптируете як изменениям
- Использует параметры окружающей среды и взаимодействие
- Звук генерируется в
^.реальном времени
Рис. 1. Сравнение методов: генеративное и процедурное ауди о
Генеративное аудио – это метод создания звука с помощью алгоритмов и математических моделей, который позволяет формировать уникальные, динамически изменяющиеся саундтреки, способные адаптироваться к текущей обстановке.
Одним из востребованных инструментов генерации звуков может быть процедурное аудио, «это звук как процесс, в отличие от звука как продукта. … Процедурное аудио – это нелинейный, часто синтетический звук, создаваемый в реальном времени в соответствии с набором программных правил и живым вводом» [6].
Используя процедурное аудио, звукорежиссеры могут писать глубоко интегрированные звуковые ландшафты, которые реагируют на действия слушателя и среду связным и правдоподобным образом.
«Процедурный звуковой дизайн – это звуковой дизайн как система, алгоритм или процедура, которая перестраивает, объединяет или манипулирует звуковыми активами таким образом, чтобы они могли: производить большее разнообразие результатов (вариативный или неповторяющийся дизайн; быть более восприимчивым к взаимодействию (параметризация)» [14; p. 492].
Процедурное аудио часто рассматривается как подмножество звукового синтеза и особенно полезно для нелинейных медиа, таких как видеоигры, виртуальная реальность и интерактивные аудиовизуальные инсталляции.
Преимущества процедурного аудио включают:
-
1. Широкий звуковой диапазон – возможность генерировать разнообразные звуки, что увеличивает вариативность звучания.
-
2. Экономия памяти – поскольку звук генерируется в реальном времени, отпадает необходимость в хранении больших аудиофайлов.
-
3. Адаптивность – музыкальное сопровождение может подстраиваться под игровые или виртуальные условия.
-
4. Динамичность – звук способен изменяться в ответ на изменения условий окружающей среды.
Здесь следует использовать аудиобиблиотеку и игровой движок для внедрения процедурного звука и генеративной музыки в произведение. Это может включать написание кода, создание алгоритмов и проектирование аудиоресурсов.
Реализация процедурного звука может быть трудоемкой, требующей глубокого понимания программирования звука и алгоритмов, потребовать больших вычислительных ресурсов, что может повлиять на производительность. В качестве примеров успешной реализации процедурного аудио можно привести некоторые проекты. Например:
-
1. Spore [17] – игра-симулятор жизни. Используется генеративная музыка для создания динамичного саундтрека, который адаптируется к действиям игрока.
-
2. Minecraft [15] – игра-песочница. Процедурный звук применяется для генерации звуков в виртуальном мире, основанном на блоках (рис. 2).
-
3. Выставки бюро «Planet 9» [16]. Например «Первая позиция: русский балет» «Балабанов», «Панк-культура. Король и Шут». Зрители
ходят в наушниках по залам. При перемещении из одной точки в другую в персональном устройстве может измениться звук (рис. 3).
Рис. 2. Игровая локация Minecraft
Рис. 3. Иммерсивный аудиоформат на выставках Planet 9
Можно сказать, что процедурный звук и генеративная аудио – инструменты, которые поднимут игровой опыт на новый уровень, обеспе- чивая более захватывающую и увлекательную среду. Понимая преимущества и проблемы этих методов, есть возможность создавать более динамичные и адаптивные аудиосистемы, которые улучшают общий игровой опыт. Включение процедурного звука открывает новые возможности для творческого самовыражения и вовлечения пользователей.
Так, представленные ресурсы могут стать основой базы данных, необходимой для введения звука в проект. Рассмотрим варианты такого применения. Генерация звуковых ландшафтов становится ключевым инструментом для создания аудиальной среды в виртуальном пространстве. Эта система может быть использована для формирования звукового окружения в искусственных средах, помогая пользователям интуитивно ориентироваться в новых или незнакомых пространствах с помощью звуковых маркеров, которые имитируют поведение реальных звуков. Применение звуковых ландшафтов:
-
1. Кино и видеоигры – передача атмосферы сцен через звуковые элементы, например морское побережье с шумом волн и криками чаек или городской ландшафт с гулом машин и звуками толпы.
-
2. Радио и подкасты – использование звуков для создания реалистичной обстановки, например в культурных или образовательных передачах, чтобы погрузить слушателя в атмосферу определенного места.
-
3. Аудиокниги – формирование трехмерного звукового пространства, позволяющего слушателю ощутить присутствие в конкретной локации.
-
4. Театр – использование звуковых ландшафтов для воссоздания сложных сценических локаций, таких как горы, джунгли или вулканы, что усиливает эмоциональное воздействие на зрителя.
-
5. Выставки. Использование звуковых ландшафтов позволяет дать более полное впечатление об эпохе, выдающемся деятеле, представить звуковые образы прошлого. Например, бюро «Planet 9» использует не акустическую систему в залах, а наушники. Так, можно говорить о человекоориентированном подходе: каждый посетитель получает возможность самостоятельно определять, сколько будет длиться звуковое оформление определенной локации.
Концепция искусственного звукового ландшафта позволяет говорить о саундтреках к фильмам, играм, спектаклям, выставкам, подкастам более целостно: не только как о музыке, сопровождающей последовательность сцен в фильме, но и как о сложном сочетании диалогов, музыки и звуковых эффектов, которые в совокупности помогают закрепить впечатления зрителя от увиденного.
Итак, в статье рассмотрена концепция искусственных звуковых ландшафтов, которые создаются с использованием вычислительных моделей, алгоритмов и математических формул. Эти звуковые среды могут быть динамичными и адаптироваться к изменениям в реальной или виртуальной среде, что делает их важным инструментом в различных областях: кино, игры, музыка и выставки.
Ранее разработанные модели демонстрируют использование звуковых баз данных и вероятностных методов для создания адаптивных звуковых ландшафтов, где звуки меняются в зависимости от поведения пользователя, создавая иллюзию динамично развивающегося природного ландшафта. Также обсуждаются работы, использующие методы синтеза и параметризации звуков, а также исследования, направленные на улучшение ощущения присутствия в виртуальных средах через звуковое оформление.
Обсуждаются два основных подхода к генерации звуков: генеративное (создание звуков с помощью алгоритмов) и процедурное аудио (генерация звуков в реальном времени по заданным программным правилам). Процедурное аудио особенно эффективно в интерактивных средах, таких как видеоигры и виртуальная реальность, так как оно создает звуковые ландшафты, которые адаптируются к действиям пользователей.
Искусственные звуковые ландшафты находят применение в различных областях, таких как музыка, кино, подкасты, аудиокниги, театр и выставки. В каждом случае звуковое оформление помогает создать уникальную атмосферу и способствует более глубокому погружению в создаваемое пространство. Например, в театре и на выставках звуковые ландшафты могут передавать ощущение определенной эпохи или локации для эмоционального воздействия на зрителя.