Иерархическая модель и базовые алгоритмы временной сегментации речевых сигналов

Автор: Томчук Кирилл Константинович, Зилинберг Андрей Юрьевич

Журнал: Ученые записки Петрозаводского государственного университета @uchzap-petrsu

Рубрика: Физико-математические науки

Статья в выпуске: 2 (131), 2013 года.

Бесплатный доступ

Представлен системный подход к временной сегментации речевых сигналов, основанный на разработанной иерархической модели речевых сигналов. Обосновано применение многоуровневой временной сегментации речевых сигналов и разработаны базовые алгоритмы для основных уровней сегментации: VAD-алгоритм; деление речевых сигналов на вокализованный, шумовой, взрывной сегменты; сегментация вокализованных фрагментов на периоды основного тона. Предложен возможный вариант разделения смежных вокализованных звуков с помощью анализа их структуры.

Речь, модель речевого сигнала, сегментация, основной тон

Короткий адрес: https://sciup.org/14750368

IDR: 14750368

Список литературы Иерархическая модель и базовые алгоритмы временной сегментации речевых сигналов

  • Архипов И. О., Гитлин В. Г. Оценка точности выделения основного тона методом GS//Современные речевые технологии: Сборник трудов IX сессии Российского акустического общества. М.: ГЕОС, 1999. С. 38-42.
  • Зилинберг А. Ю., Корнеев Ю. А. Разработка и исследование временных и спектральных алгоритмов VAD (Voice Activity Detection)//Российская школа-конференция «Мобильные системы передачи данных». М.: МИЭТ, 2006. С. 5870.
  • Кипяткова И. С. Комплекс программных средств обработки и распознавания разговорной русской речи//Информационно-управляющие системы. 2011. № 4. С. 53-59.
  • Кипяткова И. С., Карпов А. А. Автоматическая обработка и статистический анализ новостного текстового корпуса для модели языка системы распознавания русской речи//Информационно-управляющие системы. 2010. № 4. С. 2-8.
  • Маркел Дж. Д., Грэй А. Х. Линейное предсказание речи: Пер. с англ. М.: Связь, 1980. 308 с.
  • Михайлов В. Г., Златоустова Л. В. Измерение параметров речи. М.: Радио и связь, 1987. 168 с.
  • Ронжин А. Л., Глазков С. В. Метод автоматического распознавания голосовых команд и неречевых акустических событий//Информационно-управляющие системы. 2012. № 4. С. 74-77.
  • Ронжин А. Л., Карпов А. А., Кагиров И. А. Особенности дистанционной записи и обработки речи в автоматах самообслуживания//Информационно-управляющие системы. 2009. № 5. С. 32-38.
  • Ронжин А. Л., Карпов А. А., Лобанов Б. М., Цирульник Л. И., Йокиш О. Фонетико-морфологическая разметка речевых корпусов для распознавания и синтеза русской речи//Информационно-управляющие системы. 2006. № 6. С. 24-34.
  • Савченко В. В., Акатьев Д. Ю. Результаты экспериментальных исследований методики формирования фонетической базы данных диктора из непрерывного потока его разговорной речи//Информационно-управляющие системы. 2012. № 6. С. 38-42.
  • Савченко В. В., Савченко А. В. Метод фонетического декодирования слов в информационной метрике Кульбака -Лейблера для систем автоматического анализа и распознавания речи с повышенным быстродействием//Информационно-управляющие системы. 2013. № 2. С. 7-12.
  • Свириденко В. А. Аутентификация личности по голосу//Мобильные системы. 2004. № 2 [Электронный ресурс]. Режим доступа: http://www.spirit.ru/articles/svi_mb.html
  • Старченко И. Б., Вишневецкий В. Ю. Практикум по курсу «Математическое моделирование биологических процессов и систем». Таганрог: Изд-во ТТИ ЮФУ, 2010. 36 с.
  • Томчук К. К., Зилинберг А. Ю., Корнеев Ю. А. Анализ трендов и разладок структуры ОТ-кластеров вокализованных сегментов речи//Сборник докладов Научной сессии ГУАП. СПб.: ГУАП, 2010. С. 70-73.
  • Хованова Н. А., Хованов И. А. Методы анализа временных рядов. Саратов: ГосУНЦ «Колледж», 2001. 120 с.
Еще
Статья научная