Статистические исследования распределения временных меток в субтитрах формата SRT
Автор: Алексеев Александр Петрович, Макаров Максим Игоревич
Журнал: Инфокоммуникационные технологии @ikt-psuti
Рубрика: Технологии компьютерных систем и сетей
Статья в выпуске: 2 т.9, 2011 года.
Бесплатный доступ
Рассмотрена статистика распределения временных меток субтитров. Выявлены закономерности данной статистики.
Математическая статистика, субтитры, авторское право, скрытый канал связи, стеганография
Короткий адрес: https://sciup.org/140191888
IDR: 140191888
Текст научной статьи Статистические исследования распределения временных меток в субтитрах формата SRT
Постановка задачи
Файлы субтитров создают двумя способами. Во-первых, субтитры автоматически извлекают из DVD-фильмов с помощью программ распознавания текста. Необходимость использования распознающих систем объясняется тем, что в DVD-фильмах субтитры представлены в графической форме [1]. Во-вторых, пользователи вручную составляют тексты субтитров и расставляют временные метки, которые определяют моменты начала и конца демонстрации поясняющего текста на экране. Форми- рование таких субтитров осуществляют с помощью текстовых редакторов или специализированных программ. Подавляющее большинство файлов с субтитрами формируют первым способом.
Существует большое число форматов субтитров (SRT, SUB, ASS, SMI, S2K, SSA, SST, AQT, JSS, PJS, PSB, RT, SSF, GSUB, USF), но в рамках данного исследования рассматриваются лишь файлы формата SRT. Это объясняется тем, что результаты данных исследований предполагается использовать для разработки новых методов стеганографического сокрытия информации в субтитрах фильмов [2].
Формат файла субтитров определяется программой, которая была использована при автоматическом извлечении (распознавании) текста субтитров. Формат SRT представляет собой текстовый файл, состоящий из строк трех видов: порядкового номера субтитра, временных меток и текста, выводимого на экран (см. рис. 1).
Рис. 1 Субтитры формата SRT
Формат SRT получается при работе с программой извлечения субтитров SubRip, которая использует оптическое распознавание текста OCR (optical character recognition). Пользовательский интерфейс программы показан на рис. 2.

Рис. 2. Пользовательский интерфейс программы SubRip 1.50 beta 4
Программа позволяет пользователю настраивать процесс распознавания текста субтитров (см. рис. 3). При скрытой передаче информации необходимо свести к минимуму возможность обнаружения криптоаналитиком вложений, внедренных в субтитры. Поэтому внедрение секретной информации должно происходить таким образом, чтобы как можно меньше изменять статистические характеристики контейнеров. Очевидно, что для этого необходимо исследовать эти характеристики: вначале определим участки фильма, наиболее подходящие для внедрения конфиденциальной информации.

Рис. 3 Диалоговое окно OCR в программе SubRip 1.50 beta 4
На рис. 3 приведено распределение плотности временных меток в субтитрах. На гистог- рамме представлена статистика, полученная при обработке 52 фильмов. Общее число обработанных временных меток составило 126996. Здесь и далее рассматриваются субтитры, полученные путем автоматического извлечения текста из DVD-фильмов. Необходимое число временных меток для проведения исследований было определено с учетом рекомендаций математической статистики [4].
Были выбраны предельная погрешность
A = 80 и доверительная вероятность p = 0,99 , по которой найдена квантильZ„/2= 2,576. После экспериментальной оценки дисперсия исходных
данных cr2 был произведен расчет необходимого
* CT числа меток по формуле и = —^ . Зависимость, показанная на рис. 4, была аппроксимиро- вана выражением [4]:
p = a, + a2x + ap?’5 + aA4x + a5e л, (1)
где а 1 = –1102,38; а 2 = –1120,29; а 3 = 0,1093; а 4 = 11510,34; а 5 = 1102,4; p – число временных меток; х – время демонстрации, мин. Максимум плотности временных меток приходился примерно на середину фильмов (с 21 по 42 мин.), более точное определение максимума с помощью (1) и приемов математического анализа дает значение 28,5 мин. Другими словами, в середине фильма персонажи разговаривают и размышляют больше всего. Уменьшение числа временных меток в конце графика можно объяснить наличием в выборке «коротких» и «длинных» фильмов. Очевидно, что фильмы длительностью 168 мин. встречаются в кинопрокате достаточно редко.

Рис. 4. Плотность временных меток
Еще одним важным показателем статистических свойств контейнера является распределение числовых значений временных меток (распределение цифр в метках). Известен способ сокры- тия секретной информации, в котором внедрение осуществляется в последний и предпоследний разряды временных меток [2]. Естественно, что для этого способа необходимо знать законы распределения цифр во временных метках.
В субтитрах время демонстрации поясняющего текста определяется с помощью двух меток: начала показа и завершения показа субтитров. Указанные метки в программе SubRip формируются по-разному.
Метки начала показа
Так как разметку субтитров программа осуществляет автоматически, то положение временных меток в формируемом файле субтитров зависит от времени показа субтитров в DVD-фильме и от настроек распознающей программы. Программа SubRip формирует текст путем его извлечения из отдельно взятых кадров, и, следовательно, время начала показа должно зависеть от момента демонстрации кадра.
Как известно, в фильмах с частотой 25 кадров/С каждый кадр демонстрируется на экране 40 мС. В результате при демонстрации последовательно сменяющихся кадров фильма образуется временной ряд чисел со значениями 0; 40; 80; 120 мС и т.д. Такой ряд содержит в последнем разряде только нули, а в предпоследнем разряде – только нули и четные числа. Для проверки сделанных предположений были проведены статистические исследования. При сборе статистики использовались фильмы с частотой 25 кадров/С, произведенные в США в 1990-99 г.г. Ниже приведена статистика для последнего (см. рис. 5а) и предпоследнего разрядов временных меток (см. рис. 5б).
Полученная статистика противоречит первоначальным предположениям. Кроме ожидаемых нулей в последнем разряде наблюдаются и другие цифры. Легко заметить (см. рис. 5а), что в последнем разряде нуль встречается почти в пять раз чаще, чем любая другая цифра. Это позволяет сделать предположение, что появление других цифр вызвано действием каких-то случайных причин («шумов»). В предпоследнем разряде (см. рис.5б) четные цифры встречаются почти в два раза чаще нечетных цифр (аналогично можно предположить, что нечетные цифры здесь случайны).
В процессе исследований было выяснено, что часть фильмов, использованных при сборе статистики, были когда-то подвергнуты дополнительной (пиратской) обработке неизвестными пользователями, извлекавшими субтитры из
DVD-фильмов. В большинстве случаев ими были произведены смещения начала показа фильма: все временные метки были уменьшены в каждом фильме на одинаковые значения.
Например, первоначально лицензионный фильм начинался с трех меток 00:05:03,280, 00:05:23,160 и 00:06:05,240, а некоторый пользователь вырезал из фильма заставки студий, рекламу и титры, а затем сместил начало показа на 00:03:03,015 (час: мин: С, мС). В результате в файле субтитров были записаны следующие метки 00:02:00,265; 00:02:20,145 и 00:03:02,225. Следовательно, в последнем разряде появились цифры, отличные от нуля. Именно эти значения являются «шумом», который затеняет истинное распределение временных меток, имеющееся в лицензионных фильмах.
Для обнаружения наличия равномерного смещения временных меток требуется произвести операцию деления по модулю 40 значений всех меток начала показа. Если остатки от деления будут равны, это значит, что было произведено равномерное смещение. То есть для обнаружения наличия смещения следует проверить выполнение условия:
Исключив субтитры, в которых временные метки подверглись описанному редактированию, была получена иная («очищенная») статистика для последнего (см. рис. 5в) и предпоследнего разрядов временных меток (см. рис. 5г).
Полученные данные удовлетворяют первоначальным предположениям о том, что эти числа принадлежат к равномерному распределению.
Метки завершения показа
Численные значения меток завершения показа определяется как сумма времени начала показа субтитров и длительности демонстрации субтитров вида ti -t^ d, где d длительность показа, ^ 1 время начало показа, /2 время завершения показа. Была собрана статистика для последнего (см. рис.5д) и предпоследнего (см. рис 5е) разрядов меток завершения показа субтитров.
Из гистограммы на рис. 5д видно, что значения последних цифр в метках завершения показа распределяются неравномерно и большинство значений равны нулю. Как было ранее показано, величина временных меток в файле субтитров зависит от временного расположения кадра и от настроек программы распознавания субтитров. Положение временной метки окончания показа определяется длиной субтитров, однако вид гистограммы зависит и от настроек программы.
На рис. 6 выделены стандартные настройки длительности показа субтитров. Длительность показа субтитра D определяется по формуле D = m + n- к, где m – это «сдвиг», минимальная длительность, не зависящая от длины субтитра, отвечающая за базовое значение, мС; n – число символов в субтитре; k – время демонстрации одного символа на экране.
По умолчанию значение «сдвига» равняется 500 мС, а время демонстрации одного символа – 50 мС. Таким образом, длительность демонстрации одного субтитра по умолчанию вычисляется как


б)


20000 q
В)
15000 ■- юооо --
5000 --




Рис. 5. Распределение значений во временных метках
D = 500 + 50и, мС. Ожидалось, что в последнем разряде меток завершения показа будут наблюдаться только нули, так как время начала показа оканчивается на нуль и настройки по умолчанию кратны 10. Фактически (см. рис. 5д) наблюдаются все цифры, хотя доминирует цифра нуль. Объясняется это тем, что и время начала показа в ряде случаев в последнем разряде содержит цифры, отличные от нуля, и настройки программы могут быть сделаны пользователями любыми.

Рис. 6. Окно «Коррекция времени» программы SubRip
Общая статистика для субтитров (которая включает в себя метки начала и метки завершения показа)
подтверждает выявленные закономерности – преобладание нулевых значений над остальными в последнем разряде (см. рис.5ж), и преобладание четных чисел над нечетными в предпоследнем (см. рис. 5з).
Выводы
Для устранения «шумов» в статистических исследованиях следует использовать лицензионные фильмы. При внедрении скрытой информации в лицензионные и «правленые» фильмы следует использовать разные законы распределения цифр во временных метках. Стеганографическое внедрение информации в субтитры помимо установления скрытого канала связи и цифровой подписи могут применяться в прикладных задачах, например, для создания видеотестов (при изучении иностранных языков).
Список литературы Статистические исследования распределения временных меток в субтитрах формата SRT
- Лапин Е. В. Подготовка и запись DVD всех типов. М.: Вильямс, 2006. -320 с.
- Макаров М.И., Батаев А.Ф., Алексеев А.П. Стеганографические методы вложения информации в субтитры мультимедиа-контейнеров формата ASF, AVI и MATROSKA//ИКТ. Т.8, №2, 2010. -С. 32-35.
- Digital video and HDTV: algorithms and interfaces. Charles A. Poynton, 2003. -736 p.
- Алексеев А.П., Камышенков Г.Е. Использование ЭВМ для математических расчетов. Самара: Парус, 1998. -190 с.