Иерархическая модель и базовые алгоритмы временной сегментации речевых сигналов
Автор: Томчук Кирилл Константинович, Зилинберг Андрей Юрьевич
Журнал: Ученые записки Петрозаводского государственного университета @uchzap-petrsu
Рубрика: Физико-математические науки
Статья в выпуске: 2 (131), 2013 года.
Бесплатный доступ
Представлен системный подход к временной сегментации речевых сигналов, основанный на разработанной иерархической модели речевых сигналов. Обосновано применение многоуровневой временной сегментации речевых сигналов и разработаны базовые алгоритмы для основных уровней сегментации: VAD-алгоритм; деление речевых сигналов на вокализованный, шумовой, взрывной сегменты; сегментация вокализованных фрагментов на периоды основного тона. Предложен возможный вариант разделения смежных вокализованных звуков с помощью анализа их структуры.
Речь, модель речевого сигнала, сегментация, основной тон
Короткий адрес: https://sciup.org/14750368
IDR: 14750368
Список литературы Иерархическая модель и базовые алгоритмы временной сегментации речевых сигналов
- Архипов И. О., Гитлин В. Г. Оценка точности выделения основного тона методом GS//Современные речевые технологии: Сборник трудов IX сессии Российского акустического общества. М.: ГЕОС, 1999. С. 38-42.
- Зилинберг А. Ю., Корнеев Ю. А. Разработка и исследование временных и спектральных алгоритмов VAD (Voice Activity Detection)//Российская школа-конференция «Мобильные системы передачи данных». М.: МИЭТ, 2006. С. 5870.
- Кипяткова И. С. Комплекс программных средств обработки и распознавания разговорной русской речи//Информационно-управляющие системы. 2011. № 4. С. 53-59.
- Кипяткова И. С., Карпов А. А. Автоматическая обработка и статистический анализ новостного текстового корпуса для модели языка системы распознавания русской речи//Информационно-управляющие системы. 2010. № 4. С. 2-8.
- Маркел Дж. Д., Грэй А. Х. Линейное предсказание речи: Пер. с англ. М.: Связь, 1980. 308 с.
- Михайлов В. Г., Златоустова Л. В. Измерение параметров речи. М.: Радио и связь, 1987. 168 с.
- Ронжин А. Л., Глазков С. В. Метод автоматического распознавания голосовых команд и неречевых акустических событий//Информационно-управляющие системы. 2012. № 4. С. 74-77.
- Ронжин А. Л., Карпов А. А., Кагиров И. А. Особенности дистанционной записи и обработки речи в автоматах самообслуживания//Информационно-управляющие системы. 2009. № 5. С. 32-38.
- Ронжин А. Л., Карпов А. А., Лобанов Б. М., Цирульник Л. И., Йокиш О. Фонетико-морфологическая разметка речевых корпусов для распознавания и синтеза русской речи//Информационно-управляющие системы. 2006. № 6. С. 24-34.
- Савченко В. В., Акатьев Д. Ю. Результаты экспериментальных исследований методики формирования фонетической базы данных диктора из непрерывного потока его разговорной речи//Информационно-управляющие системы. 2012. № 6. С. 38-42.
- Савченко В. В., Савченко А. В. Метод фонетического декодирования слов в информационной метрике Кульбака -Лейблера для систем автоматического анализа и распознавания речи с повышенным быстродействием//Информационно-управляющие системы. 2013. № 2. С. 7-12.
- Свириденко В. А. Аутентификация личности по голосу//Мобильные системы. 2004. № 2 [Электронный ресурс]. Режим доступа: http://www.spirit.ru/articles/svi_mb.html
- Старченко И. Б., Вишневецкий В. Ю. Практикум по курсу «Математическое моделирование биологических процессов и систем». Таганрог: Изд-во ТТИ ЮФУ, 2010. 36 с.
- Томчук К. К., Зилинберг А. Ю., Корнеев Ю. А. Анализ трендов и разладок структуры ОТ-кластеров вокализованных сегментов речи//Сборник докладов Научной сессии ГУАП. СПб.: ГУАП, 2010. С. 70-73.
- Хованова Н. А., Хованов И. А. Методы анализа временных рядов. Саратов: ГосУНЦ «Колледж», 2001. 120 с.