Скрытая передача данных в звуковых файлах формата WAV
Автор: Алексеев Александр Петрович, Аленин Артем Алефтинович
Журнал: Инфокоммуникационные технологии @ikt-psuti
Рубрика: Электромагнитная совместимость и безопасность оборудования
Статья в выпуске: 3 т.8, 2010 года.
Бесплатный доступ
Существует острая проблема защиты конфиденциальной информации и авторских прав. Разработка новых методов защиты информации ведется с помощью приемов, разработанных в криптографии и стеганографии. Криптографические методы защиты информации основаны на модификации (преобразовании) защищаемого сообщения. Стеганография позволяет скрыть сам факт передачи сообщения. В статье рассматриваются методы совершенствования защиты информации путем ее сокрытия в звуковых файлах.
Информация, стеганография, скрытность, сигнал, разряд, осциллограмма, контейнер, тишина, искажения, оценка
Короткий адрес: https://sciup.org/140191404
IDR: 140191404
Текст обзорной статьи Скрытая передача данных в звуковых файлах формата WAV
Методы внедрения информации в звуковые файлы различных форматов
Файл формата WAV содержит в себе цифровые отсчеты амплитуды, сделанные в дискретные моменты времени. Для файла формата WAV наиболее известным методом внедрения информации является метод замены наименьшего значащего бита (НЗБ). Способ имеет приемлемую стойкость к взлому и позволяет скрывать достаточный объем информации в одном звуковом файле. Например, при длине файла 16 Мбайт и размере выборки 16 бит в нем можно скрытно разместить 1 Мбайт информации.
Другими методами сокрытия информации, применимыми к файлам формата WAV, являются методы, основанные на преобразовании спектров звукового сигнала и подмешивании эхо-сигнала [2].
Суть метода модификации спектра фаз заключается в изменении фазы каждой частотной составляющей дискретного сигнала. Для этого исходный сигнал разбивают на серию коротких сегментов, содержащих одинаковое количество отсчетов. Затем к каждому сегменту применяют дискретное преобразование Фурье. В результате для каждого сегмента создаются массивы фаз и амплитуд. Для обеспечения скрытности сообщения необходимо сохранить разность фаз между соседними сегментами. Модификацию фаз производят в массиве фаз первого сегмента. Встраивание информации осуществляют путем замены исходного значения фазы на значение, равное -л]!, если бит скрываемого сообщения равен 0, и на значение л/2, если бит сообщения равен 1. Чтобы сохранить существующую разницу фаз, полученный массив фаз первого сегмента суммируют с вычисленной ранее разностью между первым и вторым массивом фаз. Аналогично поступают с остальными сегментами. Для восстановления звукового сигнала выполняют обратное дискретное преобразование Фурье.
В методе расширения спектра информацию встраивают в звуковой сигнал с помощью незначительного изменения амплитуды сигнала. Помехоустойчивость обеспечивается тем, что энергия сигнала распределяется по всему возможному диапазону частот.
Для сокрытия информации в звуковом сигнале данные умножают на псевдослучайную последовательность и на основной несущий сигнал. Чтобы сделать шум, вносимый полученной после- довательностью незаметным, его ослабляют до уровня в одну сотую долю от исходного уровня сигнала. Ослабленный сигнал суммируют с основным несущим сигналом.
Метод внедрения информации с помощью эхо-сигнала основан на том, что человек не может обнаружить разницу между основным сигналом и эхо-сигналом, если задержка между этими двумя сигналами меньше определенного значения. Для встраивания информации в сигнал используют два времени задержки: одно для кодирования нуля, другое для кодирования единицы.
Для сжатого файла формата MP3 применять метод замены наименее значащего бита нельзя. Но можно применить метод, похожий на НЗБ. Файл формата MP3 состоит из нескольких фреймов. Фрейм MP3 состоит из заголовка и блока данных. Суть метода заключается в том, что если изменить какое-нибудь значение в заголовке фрейма на недопустимое, то проигрыватель просто не воспроизведет этот фрейм и перейдет к следующему. Следовательно, для внедрения данных можно использовать этот фрейм.
Экспертная оценка слышимости искажений контейнера
При внедрении информации в звуковые файлы приходится решать задачу выбора номера разряда отсчета, в который допустимо помещать скрываемую информацию, с учетом двух конфликтующих требований. С одной стороны, необходимо увеличивать объем передаваемой информации в одном файле (увеличивать пропускную способность), а с другой стороны – нужно удерживать высокую степень скрытности передачи информации.
Для решения этой задачи была проведена экспертная оценка слышимости искажений в зависимости от номера разряда отсчета, в который происходило внедрение скрываемой информации.
При проведении экспериментальных исследований учитывались требования, перечисленные в [3]. Для исследования были подготовлены 15 файлов с записью информации в различные разряды отсчетов (от младшего разряда до предпоследнего старшего разряда). Исходный файл содержал запись «полной тишины», он искажался поочередной записью информации в различные разряды. Запись внедряемой информации в каждый файл производилась следующим образом: в четные отсчеты записывался 0, а в нечетные отсчеты записывалась 1.
Восемнадцать экспертов (в возрасте 18…19 лет) оценивали громкость звучания предъявлен- ных файлов по пятибалльной системе (от 0 до 4). Наибольшей громкости звучания соответствовал балл 4, а файлу без вложения («полная тишина») соответствовал балл 0. При прослушивании (тестировании) каждого файла для сравнения воспроизводились файл с записью «полной тишины» и файл с записью битов, скрытых в старшем разряде.
При обработке экспериментальных данных вычислялись среднее арифметическое значение громкости звучания для каждого файла и дисперсия. Значение дисперсии находилось в пределах 3…12% от среднего арифметического значения громкости звучания и позволяло контролировать наличие промахов при проведении исследований. При этом одну запись (с использованием правил статистической обработки данных) пришлось удалить, определив ее как промах (ошибку) эксперта.
Результаты экспертной оценки приведены на рис. 1. По горизонтали отложены номера разрядов отсчетов, по вертикали громкость звучания, выраженная в баллах. На рис. 1 младшему разряду отсчета соответствует номер n = 16. Экспери- ментально полученные данные были аппроксимированы логистической функцией
b

где g – громкость звучания, выраженная в баллах; n – номер разряда, в который происходило внедрение скрываемой информации; коэффициенты a = – 0,165; b = 5,504; c = 3,25; d = 2,325. Исследования показали, что для скрытой передачи информации можно использовать два младших разряда звукового контейнера.
Визуальная оценка искажения синусоидального сигнала
Проверка полученной выше оценки слышимости искажений была повторно проведена визуально с помощью звукового редактора Sound Forge 7.0. Для этого исследовались искажения осциллограмм синусоиды в зависимости от номера разряда, выбранного для внедрения.

Рис. 1. Результаты экспертной оценки слышимости вложений
Временной интервал задавался в виде t = 0:1/44100:10. Функция для генерации сигнала X = 0.5*5777(13 5 0*/).
Генерация звукового файла формата WAV с частотой дискретизации 44100 Гц и уровнем квантования 16 бит осуществлялась функцией wavwrite(x,44100,16,'c:\sin.wav'). Информация в сигнал внедрялась путем замены очередного бита, с учетом знака отсчета. Сначала информация внедрялась в шестнадцатый (младший) разряд. В нечетные отсчеты внедрялась логи- ческая единица, а в четные отсчеты – логический нуль. В следующем файле внедрение осуществлялось в пятнадцатый разряд и т.д. до второго разряда.
Экспериментально установлено, что визуально можно определить наличие вложения в сигнале при изменении седьмого разряда в отсчете. Внедрение информации в разряды 9…1 6 визуально обнаружить практически невозможно. Данные оценки иллюстрирует рис. 2.
■2,5

■2.5

а) пустой контейнер
-2.5 -6.0 -12,0 ■ -Inf. ■ -12,0 ■ -6.0 -2.5 |
/\ /\ А |
V А А |
в) внедрение в пятый разряд

г) внедрение во второй разряд
Рис. 2. Осциллограммы синусоидального сигнала с модифицированными битами
Визуальная оценка искажений звукового сигнала
Искажения, вносимые методом замены наименьшего значащего бита в реальном звуковом сигнале, можно также визуально оценить с помощью осциллограмм.
В качествеконтейнераиспользовалсязвуковой файл с уровнем квантования 16 бит, содержавший запись инструментального, симфонического произведения. На рис. 3а изображена осциллограмма пустого контейнера.
Внедрение в шестнадцатый разряд (самый младший) каждого отсчета не вносило заметных
■24,1 ■ -30,1 ■ -Inf. ■ -30,1 ■ -24,1 ■ |
.. Г|Д11 п,1 ILiljltiil .1.1 111! 1 j 111j Jll illllj . i II |
* I 1 1 1 п и П Ч 11 |


искажений (рис. 3б). Изменения в десятом разряде надежно выявлялись на осциллограммах (рис. 3в), но не различались на слух. При внедрении информации в седьмой разряд искажения были различимыми на слух (рис. 3г). Наиболее заметные искажения регистрировались на участках с низким уровнем сигнала (тишина). Если исключить внедрение информации на участках с низким уровнем громкости, то для внедрения можно использовать разряды с 9 по 16.
Программы Crypto и WaveCrypto
Результаты экспериментальных исследований были учтены при разработке программ Crypto и WaveCrypto (программа разработана совместно с Сомковым С.А.).
Программа Crypto предназначена для скрытой передачи сообщений в файл-контейнерах с использованием принципов стеганографии [4]. В частности, в данной программе применяется метод замены наименьшего значащего бита.
Для повышения скрытности внедренной информации в данной программе использован модифицированный метод замены наименьшего значащего бита. Информация разделяется на фрагменты и распределяется по нескольким звуковым файлам. Программа позволяет распределять информацию по десяти звуковым файлам. В программе в качестве контейнера используется файл формата WAV. Ключом для извлечения сообщения служит последовательность файлов, в которых были скрыты фрагменты сообщения. Для повышения степени защиты информации скрываемое сообщение можно предварительно зашифровать с использованием различных симметричных алгоритмов, которые реализованы в данной программе: шифр Цезаря, шифр Атбаш, квадрат Полибия, прямоугольник Плейфейра, метод перестановок, метод гаммирования, аффинные преобразования, шифр Виженера.

Рис. 4. Главное окно программы Crypto
Программа W aveCrypto позволяет внедрять информацию в один звуковой файл с использованием ключа, распределяющего внедряемую информацию по всему контейнеру. Ключ распределения генерируется в зависимости от требующегося соотношения между наполняемостью и скрытностью, а также размера файла таким образом, чтобы информация распределилась по всему контейнеру. Если в контейнере содержится «тишина», то есть нулевые отсчеты, то программа пропускает их, внедряя информацию только в звук. Для пропуска тишины файл-контейнер разбивается на серии от «тишины» до «тишины», а в серии информация внедряется по ключу распределения.
Выводы
-
1. При выборе номера разряда, в который допустимо осуществлять внедрение информации, следует ориентироваться на наиболее уязвимые случаи. Полученные экспертным путем оценки показывают, что внедрение допустимо делать в два младших разряда отсчета при 16-битном кодировании звуковых файлов.
-
2. Разработанные программы Crypto и WaveCrypto создают несколько уровней защиты
-
3. Рассмотренный метод сокрытия информации может быть использован для формирования «водяных знаков» (защиты авторских прав).
информации: шифруют открытый текст одним из криптографических методов, внедряют зашифрованный текст в звуковые файлы, распыляя биты внутри одного или нескольких контейнеров.
Список литературы Скрытая передача данных в звуковых файлах формата WAV
- Алексеев А.П., Орлов В.В. Стеганографические и криптографические методы защиты информации. Самара: Изд. ПГУТИ, 2010. -330 с.
- Bender W., Gruhl D. u.a. Techniques for data hiding//IBM Systems Journal. №35(3&4), 1996. -Р.313-336.
- Алдошина И.А., Вологдин Э.И. и др. Электроакустика и звуковое вещание. М.: Горячая линия -Телеком, Радио и связь, 2007. -872 с.
- Аленин А.А., Алексеев А.П. Пространственное распределение информации в звуковых файлах//Тезисы XVI РНТК ПГУТИ, 2009. -С. 171-172.