Помехоустойчивая обработка речевых сигналов на основе комплементарной множественной декомпозиции на эмпирические моды
Автор: Алимурадов А.К., Квитка Ю.С., Зарецкий А.П., Кулешов А.П.
Журнал: Труды Московского физико-технического института @trudy-mipt
Рубрика: Информатика, вычислительная техника и упровление
Статья в выпуске: 3 (31) т.8, 2016 года.
Бесплатный доступ
Помехоустойчивая обработка речевых сигналов является одной из основных проблем практической реализации систем распознавания речи (СРР). Предлагаемый алгоритм помехоустойчивой обработки представляет собой фильтрацию речевых сигналов с использованием методов комплементарной множественной декомпозиции на эмпирические моды (КМДЭМ) и независимого компонентного анализа (НКА). Зашумленный речевой сигнал адаптивно раскладывается на частотные составляющие - эмпирические моды (ЭМ) - с помощью метода КМДЭМ. Применение метода КМДЭМ для разложения сигналов позволяет исключить явление смешивания ЭМ, возникающее при обработке сигналов, содержащих кратковременные и несоизмеримые по масштабу участки. Из полученного набора ЭМ определяется мода, содержащая основной шум, посредством оценки весовых энергетических и шумовых коэффициентов мод. Далее исходный зашумленный речевой сигнал и ЭМ с основным шумом подвергаются обработке с помощью метода НКА. В результате выделяется отфильтрованный речевой сигнал. Применение предложенного алгоритма фильтрации способствует повышению устойчивости к шумам СРР и точности распознавания соответственно. Результаты исследований предложенного алгоритма демонстрируют эффективное подавление шума, в том числе и для малых значений отношения сигнал/шум.
Помехоустойчивая обработка, фильтрация речевых сигналов, распознавание речи, комплементарная множественная декомпозиция на эмпирические моды, независимый компонентный анализ
Короткий адрес: https://sciup.org/142186146
IDR: 142186146
Список литературы Помехоустойчивая обработка речевых сигналов на основе комплементарной множественной декомпозиции на эмпирические моды
- Boll S. Suppression of acoustic noise in speech using spectral subtraction//IEEE Trans Acoust Speech Signal Process. 1979. V. 27(2). P. 113-120
- Berstein A., Shallom I. A hypothesized Wiener filtering approach to noisy speech recognition//International Conference on Acoustics, Speech, and Signal Processing (ICASSP’91). 1991. V. 2. P. 913-916
- Furui S. Cepstral analysis technique for automatic speaker verification//IEEE Trans Acoust Speech Signal Process. 1991. V. 29(2). P. 254-272
- Hermansky H., Morgan N. RASTA processing of speech//IEEE Trans. Speech and Audio Proc. 1994. V. 2(4). P. 578-589
- Kuo-Hau Wu, Chia-Ping Chen, Bing-Feng Yeh. Noise-robust speech feature processing with empirical mode decomposition//EURASIP Journal on Audio, Speech, and Music Processing, 2011. 9 p
- Jingjiao Li, Dong An, Jiao Wang, Chaoqun Rong. Speech Endpoint Detection in Noisy Environment Based on the Ensemble Empirical Mode Decomposition//Advanced Engineering Forum. 2012. V. 2-3. P. 135-139
- Huang N.E., Zheng Shen, Steven R.L. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis//Proceedings of the Royal Society of London A. 1998. V. 454. P. 903-995
- Zhaohua Wu, Huang N.E. Ensemble empirical mode decomposition: A noise-assisted data analysis method//Advances in Adaptive Data Analysis. 2009. V. 1(1). P. 1-41
- Алимурадов А.К., Муртазов Ф.Ш. Методы повышения эффективности распознавания речевых сигналов в системах голосового управления//Измерительная техника. 2015. № 10. С. 20-24
- Алимурадов А.К. Адаптивная компенсация помех речевых сигналов с использованием комплементарной множественной декомпозиция на эмпирические моды/А.К. Алимурадов//«Молодежь и XXI век -2015»: материалы V Международной молодежной научной конференции (26-27 февраля 2015 года), в 3-х томах, Том 2, Юго-Зап. гос. ун-т., ЗАО «Университетская книга», Курск, 2015, С. 96-99
- Алимурадов А.К. Применение преобразования Гильберта-Хуанга в задаче выделения информативных признаков речевых сигналов/А.К. Алимурадов, А.Ю. Тычков//Международный научно-исследовательский журнал. 2013. № 5-1(12). С. 57-58
- Yeh, J.-R., Shieh, J.-S., Huang N.E. Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method//Advances in Adaptive Data Analysis. 2010. V. 2(2). P. 135-156
- Алимурадов А.К. Применение методов декомпозиции на эмпирические моды в задаче фильтрации речевых сигналов в условиях интенсивных помех/А.К. Алимурадов, П.П. Чураков//Измерение. Мониторинг. Управление. Контроль. 2016. № 1(15). С. 4-14