Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи
Автор: Дворянкин Сергей Владимирович, Мишуков Андрей Андреевич
Журнал: Спецтехника и связь @st-s
Статья в выпуске: 1, 2011 года.
Бесплатный доступ
Для обеспечения эффективной защиты речевой информации в многоканальных системах конфиденциальной голосовой связи, целесообразно управлять основным показателем защищенности речевой информации, а именно разборчивостью речи, как комплексного речевого сигнала, так и составляющих его речеподобных сигналов через цифровую обработку изображений их графических образов путем процедур сепарации и маскирования. Результаты экспериментального тестирования предложенных организационно-технических моделей по управлению разборчивостью речи для защиты конфиденциальных переговоров в каналах голосовой связи полностью подтвердили их экономичность, эффективность и работоспособность.
Защита речевой информации, разборчивость речи, каналы голосовой связи
Короткий адрес: https://sciup.org/14967019
IDR: 14967019
Текст научной статьи Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи
С овременное состояние проблемы защиты речевой информации (ЗРИ) характеризуется постоянным расширением арсенала методов и средств негласного съема и перехвата акустических (речевых) сигналов, технические характеристики и способы применения которых неуклонно совершенствуются злоумышленниками (ЗЛ) [1, 5].
Это особенно справедливо для систем головой связи, передача речевой информации (РИ) в которых остается одной из самых востребованных пользователями [1].
Характеристики речи
Речевой сигнал - носитель РИ, является сложным акустическим сигналом в небольшом диапазоне частот (70 – 12 000 Гц), который может включать целый спектр элементарных гармонических составляющих, квазистационарных на относительно коротких временных интервалах (до 30 – 40 мс).
Речь может быть охарактеризована тремя группами характеристик:
-
♦ семантическая или смысловая сторона речи – характеризует смысл тех понятий, которые передаются
при ее помощи, определяет суть передаваемого речевого сообщения и может быть представлена в письменной форме в виде текста;
-
♦ фонетические характеристики речи – данные, характеризующие речь с точки зрения ее звукового состава. Основной фонетической характеристикой звукового состава является частота встречаемости в речи различных звуков и их сочетаний;
-
♦ физические характеристики — величины и зависимости, характеризующие речь как акустический сигнал;
1 – Российский новый университет, проректор;
2 – Российский новый университет, аспирант.
♦ индивидуальные характеристики речи – параметры, идентифицирующие личность говорящего.
Особенности современной голосовой связи
Как часть телекоммуникационной информации речевая информация обрабатывается техническими средствами и/или передается по линиям (каналам) связи. Причем под обобщенным термином «обработка информации» понимается совокупность операций сбора, накопления, ввода, вывода, приема, передачи, записи, хранения, регистрации, уничтожения, преобразования и отображения информации.
Сегодня процессы качественного и безопасного приема-передачи РИ по различным каналам телекоммуникаций характеризуются появлением новых особенностей применения, удовлетворяющим все новым запросам пользователей.
Так, в соответствии с данными Федеральной службы государственной статистики, в среднем по России на одного абонента в трудоспособном возрасте населения (для мужчин 16-59 лет, для женщин 16-54 года) уже приходится более 3 каналов голосовой связи, включая системы передачи данных ( рис. 1 ). Абоненты для проведения переговоров имеют возможность соединяться друг с другом посредством различных типов каналов телекоммуникаций: VoIP, проводная и сотовая связь. Пользователь сам выбирает канал голосовой связи, который в данный момент ему наиболее удобен. Таким образом, помимо традиционной модели голосовой связи двух абонентов по одному каналу ( рис. 2 ) сегодня уже используются современные модели голосовой связи абонентов по схеме «два абонента - много линий связи» ( рис. 3 ) и по схеме «много абонентов - много линий связи» для многосторонней связи: совещаний и аудиоконференций ( рис. 4 ).
Заметим, что, помимо собственно аудиоконференций, последняя модель очень часто применяется в ходе проведения различного рода видеоконференций, которые все чаще используются в деловой среде.
В процессе переговоров по указанным схемам речевой сигнал (РС) может неоднократно преобразовываться из ана-

—■— Терминалы (каналы) сотовой связи
+ Терминалы (каналы) фиксированной связи
_^ Терминалы (каналы) передачи данных
Рис. 1. Число подключенных терминалов (каналов) голосовой связи на 1 человека в трудоспособном возрасте на территории России
Абонент «А»

Линия связи
Рис. 2. Традиционная модель связи абонентов (два абонента - одна линия связи)

Рис. 3. Современная модель связи абонентов (два абонента - много линий связи)
логовой формы представления в цифровую и проходить различные участки и оборудование линий голосовой связи: телефон - телефон; компьютер - компьютер; телефон - компьютер;

компьютер - телефон [1 - 3]. На некоторых участках штатными средствами операторов связи может обеспечиваться защита РС от перехвата и прослушивания, а на некоторых - нет.

Рис. 4. Модель многоточечной аудиоконференции (много абонентов - много линий связи).
Конфиденциальная РИ, угрозы и что защищать?
Такая многозвенность, мультимодальность и многоканальность речевой связи предопределяет право абонентов на выбор наиболее приемлемого канала речевой связи, обуславливает современные тенденции ее развития и новые требования к защите РИ от несанкционированного доступа (НСД) и DOS, прежде всего, при организации многосторонних аудио-, видеоконференций и вебинаров, на которых обсуждаются вопросы, связанные с коммерческой, врачебной, служебной и другими видами тайн, относящимися к разряду конфиденциальной информации.
Непрекращающийся интерес к защите конфиденциальной РИ в каналах телекоммуникаций обусловлен следующими двумя видами угроз со стороны ЗЛ - НСД и блокирование канала голосовой связи или отказ в обслуживании [1 - 5].
В первом случае источником угрозы является либо недобросовестная конкуренция в целях получения подробной информации о конкретных хозяйствующих субъектах, в том числе информации об их интеллектуальной собственности, либо необходимость получения ЗЛ подробной информации о личной жизни конкретных физических лиц, а также их персональных данных для реализации в последующих противоправных действиях.
Во втором случае – дестабилизация работы конкретных хозяйствующих субъектов, хулиганство в отношении конкретных физических лиц или неограниченного круга лиц.
В любом случае надо исходить из того, что ЗЛ имеет возможность получить доступ к каналу голосовой связи, знает время и место проводимых конфиденциальных переговоров, частично предполагает, кем и о чем будет вестись беседа. Исходя из этого, на первый план речевых характеристик, подлежащих защите, выходит семантическая составляющая речевой информации, определяющая смысловое содержание передаваемого РС и тесно связанная с показателями речевой разборчивости и понятности.
Технологии защиты. Куда идти?
Сегодня известны две основные технологии защиты речевых сообщений, отличающиеся способами передачи по каналам связи речевых сообщений: аналоговое скремблирование и диск- ретизация речи с последующим шифрованием [3, 4].
Методы аналогового скремблирования успешно используются в тактическом звене военного и государственного управления, а также в коммерческих каналах связи для защиты конфиденциальных речевых сообщений, обеспечивая достаточно приемлемое качество и разборчивость восстановленной речи, пока более высокие, чем у узкополосных цифровых систем защиты, при относительно низкой цене.
Цифровые методы кодирования, при всей своей надежности пока еще не отличаются простотой технической реализации и высоким качеством восстановленной речи при своей еще достаточно высокой стоимости.
К сожалению, эти традиционные технологии обеспечения безопасности речевых сообщений (ОБРС) не в полной мере соответствуют обозначенным особенностям современной многоточечной голосовой связи. Прежде всего, из-за наличия процессов синхронизации в процедурах речевой обработки на обоих концах канала голосовой связи, а также из-за чувствительности алгоритмов закрытия речи к потерям и запаздываниям пакетов аудиоданных. Поэтому указанные технологии применимы только для одного защищен- ного режима работы и только двух абонентов, работающих только в одном канале связи (рис. 2), с учетом наличия у обоих (или у оператора связи) сложного и достаточно дорогостоящего оборудования защиты РИ.
Появившиеся в последние годы методы и средства аддитивного маскирования РС шумом или другими сложными акустическими сигналами, принудительно введенными в канал голосовой связи в целях затруднения восприятия РС злоумышленником, также ориентированы на традиционную модель голосовой связи ( рис. 2 ) и не всегда пригодны для реализации в многоточечной аудио-видеоконференции с множеством используемых каналов. Тем не менее новые методы маскирования, непосредственно связанные с процессами речепреобразования защищаемых сигналов, могут оказаться весьма перспективными и требуют своего исследования.
На что опереться?
Таким образом, удовлетворить требованиям современных групповых пользователей по защите от НСД и блокирования конфиденциальной РИ, передаваемой по различным общедоступным каналам связи, как-то: проводная телефония, сотовые и компьютерные сети, - можно уже сегодня на основе методов и ПО управления речевой разборчивостью (РР), реализованных на стандартных средствах вычислительной техники. Для этого можно восполь- зоваться наработанным потенциалом в области защиты РИ, доступной ЗЛ по техническим каналам утечки речевой информации (ТКУРИ) в выделенных помещениях (ВП) проведения конфиденциальных переговоров. Под ними понимаются специальные помещения (служебные кабинеты, актовые залы, конференц-залы и т.д.), которые так и называются выделенными или защищаемыми помещениями, предназначенными для обсуждения информации ограниченного доступа (совещаний, обсуждений, конференций, переговоров и т.п.).
Анализ перехваченной с помощью технических средств акустической (речевой) разведки информации производит человек. Поэтому в качестве нормативного показателя оценки эффективности защиты выделенных помещений от утечки речевой информации по техническим каналам используется словесная разборчивость речи W , под которой понимается относительное количество (в процентах) правильно понятых человеком слов, перехваченных (зарегистрированных) средством разведки.
Управление речевой разборчивостью в ВП заключается в инструментальном методе ее оценки, сравнении с заданным показателем (нормой) и при необходимости реализации комплекса мер по нейтрализации ТКУРИ путем уменьшения РР до нормированного значения посредством постановки активных акустических помех или реализации комплекса мер по усилению пассивной акустозащиты: установки заграждающих экранов, звукоизоляционных материалов и т.п. [5].
Содержание и критерии эффективности защиты РИ в технических каналах ее утечки показаны в табл. 1 .
Указанный подход может быть применим не только к защите конфиденциальных переговоров в выделенных помещениях, но и к защите голосовой связи, современные системы которой, как уже отмечалось, характеризуются многозвенностью, мультимодальностью, многоканальностью и большим числом абонентов, участвующих в переговорах.
Основная идея
В этой связи речевой сигнал каждого из абонентов конфиденциальных переговоров будем рассматривать как совокупность, а иногда и как сумму нескольких речеподобных сигналов, каждый из которых имеет свою РР со значением менее заданного уровня (нормы) и может быть передан другому собеседнику по своему отдельному каналу.
S (t) = и Sk (t)
K
s (t) = 2 Sk (t)
K
W s k ≤ W n
Такой отдельный РС, будучи возможно перехваченным в одном из контролируемых каналов связи, уже
Таблица 1. Цель и критерии эффективности защиты РИ в технических каналах ее утечки
Цель защиты |
Потенциальные технические каналы утечки информации |
Критерий эффективности защиты |
Скрытие факта ведения переговоров в ВП |
Прямой акустический, акустовибрационный, акустооптичес-кий, акустоэлектрический, акустоэлектромагнитный |
W n ≤ 10% |
Скрытие предмета переговоров в ВП |
Прямой акустический, акустовибрационный, акустооптичес-кий, акустоэлектрический, акустоэлектромагнитный |
W n ≤ 20% |
Скрытие содержания переговоров в ВП |
Прямой акустический, акустовибрационный, акустооптичес-кий, акустоэлектрический, акустоэлектромагнитный (прослушивание с использованием технических средств) |
W n ≤ 30% |
Скрытие содержания переговоров в ВП |
Прямой акустический без применения технических средств (непреднамеренное прослушивание) |
W n ≤ 40% |



Рис. 5. Общая схема многоканальной системы маскированной речевой связи
не будет понятен нарушителю. У легального же пользователя на приемном конце все полученные по разным путям элементарные сигналы снова объединяются, «сшиваются» по определенным правилам в один, теперь уже разборчивый сигнал.
Организационно-техническая модель такой защищенной голосовой связи для двух человек и одновременно используемых ими 4-х каналов (3 сотовых операторов «большой тройки» плюс канал VoIP) показана на рис. 5 . Понятно, что эта модель может быть расширена на большее число абонентов, участников конференции.
Для сохранения конфиденциальности переговоров в ВП считается, что если уровень расчетной словесной разборчивости не превышает 20% (табл. 1), то данный ТКУРИ не требует проведения защитных мероприятий [5]. А если расчетная словесная разборчивость превышает 80% (что соответствует 100% фразовой), то перехватываемая ЗЛ по каналу ТКУРИ речевая информация будет полностью понятна нарушителю. Эти же выводы можно отнести и к телекоммуникационным каналам ре- чевой связи, защищаемым от НСД. При необходимости в целях достижения еще большего уровня защиты РИ в каждом из используемых каналов можно дополнительно использовать известные и новые алгоритмы речевого маскирования, не требующие синхронизации [4].
Плюс от сеанса к сеансу можно организационно изменять набор участвующих в модели каналов, добавляя каналы новых операторов связи (например фиксированную телефонную связь, другие сервисы VoIP и сотовой связи) и исключая старых.
Какая может быть сепарация?
Класс методов разделения исходного РС на неразборчивые речеподобные составляющие также весьма широк: от полосовой фильтрации по группам равноартикуляционных полос до спектрально-временной обработки фонетической функции (динамической огибающей спектра), определяющей РР.
Последние методы, основанные на технологии образного анализа-син- теза, заключающегося в переходе от волнового представления РС к изображению динамических узкополосных спектрограмм - графическим образам (ГО), их обработке методами цифровой обработки изображений для решения прикладных задач и обратном переходе (синтезе) от нового изображения к новой волновой форме РС, - лучше подходят для организации многоканального асинхронного маскирования РС. Поскольку в них одновременно с преобразованиями фонетической функции могут реализовываться процедуры цифровой «шумоочистки» амплитудных, фазовых и других принудительно введенных канальных искажений, а также искажений, возникающих в процессе финальной «склейки» ГО элементарных составляющих.
Процесс управления РР здесь можно представить в виде преобразования или расслоения («слайдирования») исходного ГО на ряд других, мало похожих или совсем непохожих на исходный ГО, по которым синтезируются неразборчивые речеподобные сигналы, передаваемые в свои каналы связи на передающем конце, и сшивку или

Рис. 6. Спектрограммы речевых и речеподобных сигналов с одинаковой ФФ
объединение их ГО с последующим синтезом в новый разборчивый сигнал на приемном.
Фонетическая функция или с чем связана разборчивость
Известно, что смысловое содержание речевого сообщения определяется динамикой перестройки формантной структуры или огибающей спектра. Процесс речеобразования, связанный с динамикой этой огибающей, часто называемой фонетической функцией Пирогова (ФФ), удобно исследовать посредством цифрового спектральновременного анализа спектрограмм. Результаты одного из таких исследований представлены на рис. 6 , где показаны спектрограммы разных речевых сигналов, но с одинаковой ФФ и, как следствие, одинаковым смысловым содержанием, выражаемом в одной и той же текстовой форме. На спектрограммах по вертикальной оси отложена частота, по горизонтальной – время. В уровнях серого цвета указана мощность сигнала на данной частоте в данной момент времени. Максимальная мощность отображается черным цветом, минимальная -белым.
В левом нижнем углу рис. 6 представлена сонограмма исходной речи; в правом нижнем – спектрограмма этой же фразы, сказанная громким шепотом; в правом верхнем – монотонная речь; в левом верхнем – та же фраза, но сказанная с другим эмоциональным выражением.
Таким образом, речь содержит в себе форманты, прием которых определяет ее разборчивость и неформантные составляющие, к которым относятся основные тоны, области частот между формантами и составляющие, зависящие от индивидуальных особенностей говорящих.
Примеры сепарации и маскировки для защиты от НСД
Исходя из этого, речевой сигнал как процесс, развивающийся во времени и по частоте, можно рассматривать как взаимное наложение друг на друга его гармонической и формантной структуры, присутствующее на изображениях узкополосных спектрограмм или ГО РС. Отделяя, изменяя и снова соединяя на изображениях спектрограмм гармоническую и формантную структуры, можно РС делать неразборчивым на передающем конце канала связи и разборчивым после выполнения обратных операций – на приемном.
Результаты выполнения подобных процедур для одного из новых перспективных методов асинхронного мас- кирования РС в полной полосе частот представлены на рис. 7.
Понятно, что такие же процедуры можно проводить для полосы частот каждого отдельного речеподобного (РП) сигнала, передаваемого по своей отдельной линии связи в многоканальной системе защищенных переговоров. Заметим, что на приемном конце производятся обратные преобразования динамических огибающих спектра каждого РП-сигнала и их сшивка в интегрирующий ГО с последующим синтезом по нему нового восстановленного РС.
Дополнительно для лучшей синхронизации в процессе восстановления РР комплексного РС путем сшивки ГО речеподобных сигналов его составляющих в каждом из них можно применять маскированные пилот-сигналы в виде узкополосных помех, как это показано на рис. 8 для наглядности в полной полосе телефонного канала. Там же показаны и результаты снятия такой маскировки.
Защита от блокирования (отказа в обслуживании – DOS)
Возможности ЗЛ по блокированию каналов голосовой связи также можно и нужно оценивать с учетом комплексного анализа и обработки ГО




Рис. 7. Примеры асинхронного маскирования речи в полной полосе телефонного канала посредством изменения ее формантной структуры: а) графический образ спектра исходного речевого сигнала;
б) графический образ спектра исходного РС с инвертированной огибающей;
в) графический образ РС с инвертированной огибающей со статическим сдвигом;
г) графический образ спектра исходного РС с динамической сдвигом огибающей
акустических (речевых) сигналов, принимаемых с различных линий связи с последующей их постобработкой и шу-моочисткой. Здесь в случае блокирования или отказа одного или нескольких каналов голосовой связи, по которым передается только часть исходной РИ, оставшихся долей РР в действующих каналах должно быть вполне достаточно для полного понимания передаваемого речевого сообщения легитимным пользователем.
Так же, как и раньше, защищаемый речевой сигнал, рассматривается как некоторая совокупность нескольких отдельных речеподобных сигналов, передаваемых по каждому из каналов го- лосовой связи. Каждый из этих сигналов может иметь свою РР, со значением меньше нормы. Такой отдельный РС, будучи перехваченным в одном из контролируемых каналов, не будет понятен ЗЛ и может быть им заблокирован.
Тем не менее на приемном конце при многоканальной сшивке ГО РС в не-заблокированных каналах в новый ГО и последующим восстановлением по нему нового РС, последний должен иметь уже свою собственную РР, большую, чем РР его составляющих в используемых каналах приема-передачи, и вполне достаточную для понимания абонентом сути ведущихся переговоров.
S (t) = U Sj (t)
J < K
Wsj < Wn WS ^ 80%
Для получения еще большей РР информацию о пропущенных (заблокированных) участках на комплексоном ГО РС можно частично восстановить, сочетая известные методы восстановления и реконструкции искаженных изображений с известными механизмами речеобразования, выражающимися в построении гармонической структуры ГО РС.
Как видим, при защите РИ от угрозы блокирования каналов голосовой свя-

Рис. 8. Маскирование речи квазигорманической помехой:
слева – постановка мощной квазигармонической помехи в речевом сигнале; справа – снятие помехи из полезной смеси на приемном конце канала связи
зи решается обратная задача по управлению РР в отличие от угрозы НСД. Она заключается в объединении или сшивке ГО речеподобных сигналов с отдельных действующих линий связи в одно новое изображение ГО, для организации последующей процедуры синтеза нового разборчивого сигнала.
Выводы
Результаты экспериментального тестирования предложенных организационно-технических моделей по управлению РР для защиты конфиденциальных
Литература переговоров в каналах голосовой связи полностью подтвердили их экономичность, эффективность и работоспособность.
Таким образом, для обеспечения эффективной защиты РИ в многоканальных системах конфиденциальной голосовой связи, целесообразно управлять основным показателем защищенности речевой информации, а именно РР, как комплексного РС, так и составляющих его речеподобных сигналов через цифровую обработку изображений их графических образов путем процедур сепарации и маскирования.
-
1 . Петраков А.В., Лагутин В.С. Утечка и защита информации в телефонных каналах. - М.: Энергоатомиздат, 1998. - 317 с.
-
2. Дворянкин С.В. Компьютерные технологии защиты речевых сообщений в каналах электросвязи. Учебное пособие. - М.: РИО МТУСИ. 1999. - 52 с.
-
3. Барсуков В.С., Дворянкин С.В., Шеремет И.А. Безопасность связи в каналах телекоммуникаций. - М.: Электронные знания, 1992-1993. - 122 с.
-
4. Дворянкин С.В., Девочкин Д.В. Методы закрытия речевых сигналов в телефонных каналах / Защита информации. Конфидент,1995. -№ 5. - С.45 - 59.
-
5. Дворянкин С.В., Макаров Ю.К., Хорев А.А. Обоснование критериев эффективности защиты речевой информации от утечки по техническим каналам. / Защита информации. Инсайд. - № 2 (14). - март-апрель 2007. - С. 18 - 25.
Список литературы Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи
- Петраков А.В., Лагутин В.С. Утечка и защита информации в телефонных каналах. -М.: Энергоатомиздат, 1998. -317 с.
- Дворянкин С.В. Компьютерные технологии защиты речевых сообщений в каналах электросвязи. Учебное пособие. -М.: РИО МТУСИ. 1999. -52 с.
- Барсуков В.С., Дворянкин С.В., Шеремет И.А. Безопасность связи в каналах телекоммуникаций. -М.: Электронные знания, 1992-1993. -122 с.
- Дворянкин С.В., Девочкин Д.В. Методы закрытия речевых сигналов в телефонных каналах/Защита информации. Конфидент,1995. -№ 5. -С.45 -59.
- Дворянкин С.В., Макаров Ю.К., Хорев А.А. Обоснование критериев эффективности защиты речевой информации от утечки по техническим каналам./Защита информации. Инсайд. -№ 2 (14). -март-апрель 2007. -С. 18 -25.