Научные статьи \ Общие вопросы науки и культуры \ Информационные технологии. Вычислительная техника. Обработка данных \ Связь компьютеров. Сети ЭВМ. Вычислительные сети

Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи

Автор: Дворянкин Сергей Владимирович, Мишуков Андрей Андреевич

Журнал: Спецтехника и связь @st-s

Статья в выпуске: 1, 2011 года.

Бесплатный доступ

Для обеспечения эффективной защиты речевой информации в многоканальных системах конфиденциальной голосовой связи, целесообразно управлять основным показателем защищенности речевой информации, а именно разборчивостью речи, как комплексного речевого сигнала, так и составляющих его речеподобных сигналов через цифровую обработку изображений их графических образов путем процедур сепарации и маскирования. Результаты экспериментального тестирования предложенных организационно-технических моделей по управлению разборчивостью речи для защиты конфиденциальных переговоров в каналах голосовой связи полностью подтвердили их экономичность, эффективность и работоспособность.

Еще

Защита речевой информации, разборчивость речи, каналы голосовой связи

Короткий адрес: https://sciup.org/14967019

IDR: 14967019

Текст научной статьи Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи

С овременное состояние проблемы защиты речевой информации (ЗРИ) характеризуется постоянным расширением арсенала методов и средств негласного съема и перехвата акустических (речевых) сигналов, технические характеристики и способы применения которых неуклонно совершенствуются злоумышленниками (ЗЛ) [1, 5].

Это особенно справедливо для систем головой связи, передача речевой информации (РИ) в которых остается одной из самых востребованных пользователями [1].

Характеристики речи

Речевой сигнал - носитель РИ, является сложным акустическим сигналом в небольшом диапазоне частот (70 – 12 000 Гц), который может включать целый спектр элементарных гармонических составляющих, квазистационарных на относительно коротких временных интервалах (до 30 – 40 мс).

Речь может быть охарактеризована тремя группами характеристик:

♦ семантическая или смысловая сторона речи – характеризует смысл тех понятий, которые передаются

при ее помощи, определяет суть передаваемого речевого сообщения и может быть представлена в письменной форме в виде текста;

♦ фонетические характеристики речи – данные, характеризующие речь с точки зрения ее звукового состава. Основной фонетической характеристикой звукового состава является частота встречаемости в речи различных звуков и их сочетаний;
♦ физические характеристики — величины и зависимости, характеризующие речь как акустический сигнал;

¹ – Российский новый университет, проректор;

² – Российский новый университет, аспирант.

♦ индивидуальные характеристики речи – параметры, идентифицирующие личность говорящего.

Особенности современной голосовой связи

Как часть телекоммуникационной информации речевая информация обрабатывается техническими средствами и/или передается по линиям (каналам) связи. Причем под обобщенным термином «обработка информации» понимается совокупность операций сбора, накопления, ввода, вывода, приема, передачи, записи, хранения, регистрации, уничтожения, преобразования и отображения информации.

Сегодня процессы качественного и безопасного приема-передачи РИ по различным каналам телекоммуникаций характеризуются появлением новых особенностей применения, удовлетворяющим все новым запросам пользователей.

Так, в соответствии с данными Федеральной службы государственной статистики, в среднем по России на одного абонента в трудоспособном возрасте населения (для мужчин 16-59 лет, для женщин 16-54 года) уже приходится более 3 каналов голосовой связи, включая системы передачи данных ( рис. 1 ). Абоненты для проведения переговоров имеют возможность соединяться друг с другом посредством различных типов каналов телекоммуникаций: VoIP, проводная и сотовая связь. Пользователь сам выбирает канал голосовой связи, который в данный момент ему наиболее удобен. Таким образом, помимо традиционной модели голосовой связи двух абонентов по одному каналу ( рис. 2 ) сегодня уже используются современные модели голосовой связи абонентов по схеме «два абонента - много линий связи» ( рис. 3 ) и по схеме «много абонентов - много линий связи» для многосторонней связи: совещаний и аудиоконференций ( рис. 4 ).

Заметим, что, помимо собственно аудиоконференций, последняя модель очень часто применяется в ходе проведения различного рода видеоконференций, которые все чаще используются в деловой среде.

В процессе переговоров по указанным схемам речевой сигнал (РС) может неоднократно преобразовываться из ана-

—■— Терминалы (каналы) сотовой связи

+ Терминалы (каналы) фиксированной связи

_^ Терминалы (каналы) передачи данных

Рис. 1. Число подключенных терминалов (каналов) голосовой связи на 1 человека в трудоспособном возрасте на территории России

Абонент «А»

Линия связи

Рис. 2. Традиционная модель связи абонентов (два абонента - одна линия связи)

Рис. 3. Современная модель связи абонентов (два абонента - много линий связи)

логовой формы представления в цифровую и проходить различные участки и оборудование линий голосовой связи: телефон - телефон; компьютер - компьютер; телефон - компьютер;

компьютер - телефон [1 - 3]. На некоторых участках штатными средствами операторов связи может обеспечиваться защита РС от перехвата и прослушивания, а на некоторых - нет.

Рис. 4. Модель многоточечной аудиоконференции (много абонентов - много линий связи).

Конфиденциальная РИ, угрозы и что защищать?

Такая многозвенность, мультимодальность и многоканальность речевой связи предопределяет право абонентов на выбор наиболее приемлемого канала речевой связи, обуславливает современные тенденции ее развития и новые требования к защите РИ от несанкционированного доступа (НСД) и DOS, прежде всего, при организации многосторонних аудио-, видеоконференций и вебинаров, на которых обсуждаются вопросы, связанные с коммерческой, врачебной, служебной и другими видами тайн, относящимися к разряду конфиденциальной информации.

Непрекращающийся интерес к защите конфиденциальной РИ в каналах телекоммуникаций обусловлен следующими двумя видами угроз со стороны ЗЛ - НСД и блокирование канала голосовой связи или отказ в обслуживании [1 - 5].

В первом случае источником угрозы является либо недобросовестная конкуренция в целях получения подробной информации о конкретных хозяйствующих субъектах, в том числе информации об их интеллектуальной собственности, либо необходимость получения ЗЛ подробной информации о личной жизни конкретных физических лиц, а также их персональных данных для реализации в последующих противоправных действиях.

Во втором случае – дестабилизация работы конкретных хозяйствующих субъектов, хулиганство в отношении конкретных физических лиц или неограниченного круга лиц.

В любом случае надо исходить из того, что ЗЛ имеет возможность получить доступ к каналу голосовой связи, знает время и место проводимых конфиденциальных переговоров, частично предполагает, кем и о чем будет вестись беседа. Исходя из этого, на первый план речевых характеристик, подлежащих защите, выходит семантическая составляющая речевой информации, определяющая смысловое содержание передаваемого РС и тесно связанная с показателями речевой разборчивости и понятности.

Технологии защиты. Куда идти?

Сегодня известны две основные технологии защиты речевых сообщений, отличающиеся способами передачи по каналам связи речевых сообщений: аналоговое скремблирование и диск- ретизация речи с последующим шифрованием [3, 4].

Методы аналогового скремблирования успешно используются в тактическом звене военного и государственного управления, а также в коммерческих каналах связи для защиты конфиденциальных речевых сообщений, обеспечивая достаточно приемлемое качество и разборчивость восстановленной речи, пока более высокие, чем у узкополосных цифровых систем защиты, при относительно низкой цене.

Цифровые методы кодирования, при всей своей надежности пока еще не отличаются простотой технической реализации и высоким качеством восстановленной речи при своей еще достаточно высокой стоимости.

К сожалению, эти традиционные технологии обеспечения безопасности речевых сообщений (ОБРС) не в полной мере соответствуют обозначенным особенностям современной многоточечной голосовой связи. Прежде всего, из-за наличия процессов синхронизации в процедурах речевой обработки на обоих концах канала голосовой связи, а также из-за чувствительности алгоритмов закрытия речи к потерям и запаздываниям пакетов аудиоданных. Поэтому указанные технологии применимы только для одного защищен- ного режима работы и только двух абонентов, работающих только в одном канале связи (рис. 2), с учетом наличия у обоих (или у оператора связи) сложного и достаточно дорогостоящего оборудования защиты РИ.

Появившиеся в последние годы методы и средства аддитивного маскирования РС шумом или другими сложными акустическими сигналами, принудительно введенными в канал голосовой связи в целях затруднения восприятия РС злоумышленником, также ориентированы на традиционную модель голосовой связи ( рис. 2 ) и не всегда пригодны для реализации в многоточечной аудио-видеоконференции с множеством используемых каналов. Тем не менее новые методы маскирования, непосредственно связанные с процессами речепреобразования защищаемых сигналов, могут оказаться весьма перспективными и требуют своего исследования.

На что опереться?

Таким образом, удовлетворить требованиям современных групповых пользователей по защите от НСД и блокирования конфиденциальной РИ, передаваемой по различным общедоступным каналам связи, как-то: проводная телефония, сотовые и компьютерные сети, - можно уже сегодня на основе методов и ПО управления речевой разборчивостью (РР), реализованных на стандартных средствах вычислительной техники. Для этого можно восполь- зоваться наработанным потенциалом в области защиты РИ, доступной ЗЛ по техническим каналам утечки речевой информации (ТКУРИ) в выделенных помещениях (ВП) проведения конфиденциальных переговоров. Под ними понимаются специальные помещения (служебные кабинеты, актовые залы, конференц-залы и т.д.), которые так и называются выделенными или защищаемыми помещениями, предназначенными для обсуждения информации ограниченного доступа (совещаний, обсуждений, конференций, переговоров и т.п.).

Анализ перехваченной с помощью технических средств акустической (речевой) разведки информации производит человек. Поэтому в качестве нормативного показателя оценки эффективности защиты выделенных помещений от утечки речевой информации по техническим каналам используется словесная разборчивость речи W , под которой понимается относительное количество (в процентах) правильно понятых человеком слов, перехваченных (зарегистрированных) средством разведки.

Управление речевой разборчивостью в ВП заключается в инструментальном методе ее оценки, сравнении с заданным показателем (нормой) и при необходимости реализации комплекса мер по нейтрализации ТКУРИ путем уменьшения РР до нормированного значения посредством постановки активных акустических помех или реализации комплекса мер по усилению пассивной акустозащиты: установки заграждающих экранов, звукоизоляционных материалов и т.п. [5].

Содержание и критерии эффективности защиты РИ в технических каналах ее утечки показаны в табл. 1 .

Указанный подход может быть применим не только к защите конфиденциальных переговоров в выделенных помещениях, но и к защите голосовой связи, современные системы которой, как уже отмечалось, характеризуются многозвенностью, мультимодальностью, многоканальностью и большим числом абонентов, участвующих в переговорах.

Основная идея

В этой связи речевой сигнал каждого из абонентов конфиденциальных переговоров будем рассматривать как совокупность, а иногда и как сумму нескольких речеподобных сигналов, каждый из которых имеет свою РР со значением менее заданного уровня (нормы) и может быть передан другому собеседнику по своему отдельному каналу.

S (t) = и Sk (t)

s (t) = 2 Sk (t)

W s k ≤ W n

Такой отдельный РС, будучи возможно перехваченным в одном из контролируемых каналов связи, уже

Таблица 1. Цель и критерии эффективности защиты РИ в технических каналах ее утечки

Цель защиты	Потенциальные технические каналы утечки информации	Критерий эффективности защиты
Скрытие факта ведения переговоров в ВП	Прямой акустический, акустовибрационный, акустооптичес-кий, акустоэлектрический, акустоэлектромагнитный	W n ≤ 10%
Скрытие предмета переговоров в ВП	Прямой акустический, акустовибрационный, акустооптичес-кий, акустоэлектрический, акустоэлектромагнитный	W n ≤ 20%
Скрытие содержания переговоров в ВП	Прямой акустический, акустовибрационный, акустооптичес-кий, акустоэлектрический, акустоэлектромагнитный (прослушивание с использованием технических средств)	W n ≤ 30%
Скрытие содержания переговоров в ВП	Прямой акустический без применения технических средств (непреднамеренное прослушивание)	W n ≤ 40%

Рис. 5. Общая схема многоканальной системы маскированной речевой связи

не будет понятен нарушителю. У легального же пользователя на приемном конце все полученные по разным путям элементарные сигналы снова объединяются, «сшиваются» по определенным правилам в один, теперь уже разборчивый сигнал.

Организационно-техническая модель такой защищенной голосовой связи для двух человек и одновременно используемых ими 4-х каналов (3 сотовых операторов «большой тройки» плюс канал VoIP) показана на рис. 5 . Понятно, что эта модель может быть расширена на большее число абонентов, участников конференции.

Для сохранения конфиденциальности переговоров в ВП считается, что если уровень расчетной словесной разборчивости не превышает 20% (табл. 1), то данный ТКУРИ не требует проведения защитных мероприятий [5]. А если расчетная словесная разборчивость превышает 80% (что соответствует 100% фразовой), то перехватываемая ЗЛ по каналу ТКУРИ речевая информация будет полностью понятна нарушителю. Эти же выводы можно отнести и к телекоммуникационным каналам ре- чевой связи, защищаемым от НСД. При необходимости в целях достижения еще большего уровня защиты РИ в каждом из используемых каналов можно дополнительно использовать известные и новые алгоритмы речевого маскирования, не требующие синхронизации [4].

Плюс от сеанса к сеансу можно организационно изменять набор участвующих в модели каналов, добавляя каналы новых операторов связи (например фиксированную телефонную связь, другие сервисы VoIP и сотовой связи) и исключая старых.

Какая может быть сепарация?

Класс методов разделения исходного РС на неразборчивые речеподобные составляющие также весьма широк: от полосовой фильтрации по группам равноартикуляционных полос до спектрально-временной обработки фонетической функции (динамической огибающей спектра), определяющей РР.

Последние методы, основанные на технологии образного анализа-син- теза, заключающегося в переходе от волнового представления РС к изображению динамических узкополосных спектрограмм - графическим образам (ГО), их обработке методами цифровой обработки изображений для решения прикладных задач и обратном переходе (синтезе) от нового изображения к новой волновой форме РС, - лучше подходят для организации многоканального асинхронного маскирования РС. Поскольку в них одновременно с преобразованиями фонетической функции могут реализовываться процедуры цифровой «шумоочистки» амплитудных, фазовых и других принудительно введенных канальных искажений, а также искажений, возникающих в процессе финальной «склейки» ГО элементарных составляющих.

Процесс управления РР здесь можно представить в виде преобразования или расслоения («слайдирования») исходного ГО на ряд других, мало похожих или совсем непохожих на исходный ГО, по которым синтезируются неразборчивые речеподобные сигналы, передаваемые в свои каналы связи на передающем конце, и сшивку или

Рис. 6. Спектрограммы речевых и речеподобных сигналов с одинаковой ФФ

объединение их ГО с последующим синтезом в новый разборчивый сигнал на приемном.

Фонетическая функция или с чем связана разборчивость

Известно, что смысловое содержание речевого сообщения определяется динамикой перестройки формантной структуры или огибающей спектра. Процесс речеобразования, связанный с динамикой этой огибающей, часто называемой фонетической функцией Пирогова (ФФ), удобно исследовать посредством цифрового спектральновременного анализа спектрограмм. Результаты одного из таких исследований представлены на рис. 6 , где показаны спектрограммы разных речевых сигналов, но с одинаковой ФФ и, как следствие, одинаковым смысловым содержанием, выражаемом в одной и той же текстовой форме. На спектрограммах по вертикальной оси отложена частота, по горизонтальной – время. В уровнях серого цвета указана мощность сигнала на данной частоте в данной момент времени. Максимальная мощность отображается черным цветом, минимальная -белым.

В левом нижнем углу рис. 6 представлена сонограмма исходной речи; в правом нижнем – спектрограмма этой же фразы, сказанная громким шепотом; в правом верхнем – монотонная речь; в левом верхнем – та же фраза, но сказанная с другим эмоциональным выражением.

Таким образом, речь содержит в себе форманты, прием которых определяет ее разборчивость и неформантные составляющие, к которым относятся основные тоны, области частот между формантами и составляющие, зависящие от индивидуальных особенностей говорящих.

Примеры сепарации и маскировки для защиты от НСД

Исходя из этого, речевой сигнал как процесс, развивающийся во времени и по частоте, можно рассматривать как взаимное наложение друг на друга его гармонической и формантной структуры, присутствующее на изображениях узкополосных спектрограмм или ГО РС. Отделяя, изменяя и снова соединяя на изображениях спектрограмм гармоническую и формантную структуры, можно РС делать неразборчивым на передающем конце канала связи и разборчивым после выполнения обратных операций – на приемном.

Результаты выполнения подобных процедур для одного из новых перспективных методов асинхронного мас- кирования РС в полной полосе частот представлены на рис. 7.

Понятно, что такие же процедуры можно проводить для полосы частот каждого отдельного речеподобного (РП) сигнала, передаваемого по своей отдельной линии связи в многоканальной системе защищенных переговоров. Заметим, что на приемном конце производятся обратные преобразования динамических огибающих спектра каждого РП-сигнала и их сшивка в интегрирующий ГО с последующим синтезом по нему нового восстановленного РС.

Дополнительно для лучшей синхронизации в процессе восстановления РР комплексного РС путем сшивки ГО речеподобных сигналов его составляющих в каждом из них можно применять маскированные пилот-сигналы в виде узкополосных помех, как это показано на рис. 8 для наглядности в полной полосе телефонного канала. Там же показаны и результаты снятия такой маскировки.

Защита от блокирования (отказа в обслуживании – DOS)

Возможности ЗЛ по блокированию каналов голосовой связи также можно и нужно оценивать с учетом комплексного анализа и обработки ГО

Рис. 7. Примеры асинхронного маскирования речи в полной полосе телефонного канала посредством изменения ее формантной структуры: а) графический образ спектра исходного речевого сигнала;

б) графический образ спектра исходного РС с инвертированной огибающей;

в) графический образ РС с инвертированной огибающей со статическим сдвигом;

г) графический образ спектра исходного РС с динамической сдвигом огибающей

акустических (речевых) сигналов, принимаемых с различных линий связи с последующей их постобработкой и шу-моочисткой. Здесь в случае блокирования или отказа одного или нескольких каналов голосовой связи, по которым передается только часть исходной РИ, оставшихся долей РР в действующих каналах должно быть вполне достаточно для полного понимания передаваемого речевого сообщения легитимным пользователем.

Так же, как и раньше, защищаемый речевой сигнал, рассматривается как некоторая совокупность нескольких отдельных речеподобных сигналов, передаваемых по каждому из каналов го- лосовой связи. Каждый из этих сигналов может иметь свою РР, со значением меньше нормы. Такой отдельный РС, будучи перехваченным в одном из контролируемых каналов, не будет понятен ЗЛ и может быть им заблокирован.

Тем не менее на приемном конце при многоканальной сшивке ГО РС в не-заблокированных каналах в новый ГО и последующим восстановлением по нему нового РС, последний должен иметь уже свою собственную РР, большую, чем РР его составляющих в используемых каналах приема-передачи, и вполне достаточную для понимания абонентом сути ведущихся переговоров.

S (t) = U Sj (t)

J < K

Wsj < Wn WS ^ 80%

Для получения еще большей РР информацию о пропущенных (заблокированных) участках на комплексоном ГО РС можно частично восстановить, сочетая известные методы восстановления и реконструкции искаженных изображений с известными механизмами речеобразования, выражающимися в построении гармонической структуры ГО РС.

Как видим, при защите РИ от угрозы блокирования каналов голосовой свя-

Рис. 8. Маскирование речи квазигорманической помехой:

слева – постановка мощной квазигармонической помехи в речевом сигнале; справа – снятие помехи из полезной смеси на приемном конце канала связи

зи решается обратная задача по управлению РР в отличие от угрозы НСД. Она заключается в объединении или сшивке ГО речеподобных сигналов с отдельных действующих линий связи в одно новое изображение ГО, для организации последующей процедуры синтеза нового разборчивого сигнала.

Выводы

Результаты экспериментального тестирования предложенных организационно-технических моделей по управлению РР для защиты конфиденциальных

Литература переговоров в каналах голосовой связи полностью подтвердили их экономичность, эффективность и работоспособность.

Таким образом, для обеспечения эффективной защиты РИ в многоканальных системах конфиденциальной голосовой связи, целесообразно управлять основным показателем защищенности речевой информации, а именно РР, как комплексного РС, так и составляющих его речеподобных сигналов через цифровую обработку изображений их графических образов путем процедур сепарации и маскирования.

1 . Петраков А.В., Лагутин В.С. Утечка и защита информации в телефонных каналах. - М.: Энергоатомиздат, 1998. - 317 с.
2. Дворянкин С.В. Компьютерные технологии защиты речевых сообщений в каналах электросвязи. Учебное пособие. - М.: РИО МТУСИ. 1999. - 52 с.
3. Барсуков В.С., Дворянкин С.В., Шеремет И.А. Безопасность связи в каналах телекоммуникаций. - М.: Электронные знания, 1992-1993. - 122 с.
4. Дворянкин С.В., Девочкин Д.В. Методы закрытия речевых сигналов в телефонных каналах / Защита информации. Конфидент,1995. -№ 5. - С.45 - 59.
5. Дворянкин С.В., Макаров Ю.К., Хорев А.А. Обоснование критериев эффективности защиты речевой информации от утечки по техническим каналам. / Защита информации. Инсайд. - № 2 (14). - март-апрель 2007. - С. 18 - 25.

Список литературы Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи

Петраков А.В., Лагутин В.С. Утечка и защита информации в телефонных каналах. -М.: Энергоатомиздат, 1998. -317 с.
Дворянкин С.В. Компьютерные технологии защиты речевых сообщений в каналах электросвязи. Учебное пособие. -М.: РИО МТУСИ. 1999. -52 с.
Барсуков В.С., Дворянкин С.В., Шеремет И.А. Безопасность связи в каналах телекоммуникаций. -М.: Электронные знания, 1992-1993. -122 с.
Дворянкин С.В., Девочкин Д.В. Методы закрытия речевых сигналов в телефонных каналах/Защита информации. Конфидент,1995. -№ 5. -С.45 -59.
Дворянкин С.В., Макаров Ю.К., Хорев А.А. Обоснование критериев эффективности защиты речевой информации от утечки по техническим каналам./Защита информации. Инсайд. -№ 2 (14). -март-апрель 2007. -С. 18 -25.