Исследование частотно-избирательных свойств методов декомпозиции на эмпирические моды для оценки частоты основного тона речевых сигналов

Бесплатный доступ

Рассмотрена проблема повышения эффективности анализа речевых сигналов на этапе предварительной обработки в алгоритмах оценки частоты основного тона (ЧОТ). Проведен краткий обзор методов декомпозиции, применяемых на этапах предварительной обработки, показаны их достоинства и недостатки. Предложен новый метод адаптивного разложения нелинейных и нестационарных речевых сигналов - метод декомпозиции на эмпирические моды (ДЭМ). Представлены блок-схемы разновидностей методов декомпозиции (множественной декомпозиции на эмпирические моды (МДЭМ), комплементарной множественной декомпозиции на эмпирические моды (КМДЭМ)) с подробным описанием математического аппарата. Приведены результаты исследований частотно-избирательных свойств методов ДЭМ, МДЭМ и КМДЭМ. В соответствии с результатами сделан вывод, что наиболее адаптивным методом декомпозиции речевых сигналов является метод КМДЭМ, который предпочтительно использовать в алгоритмах оценки ЧОТ.

Еще

Обработка речевых сигналов, декомпозиция на эмпирические моды, дэм, множественная декомпозиция на эмпирические моды мдэм, комплементарная множественная декомпозиция на эмпирические моды кмдэм, частота основного тона

Короткий адрес: https://sciup.org/142186085

IDR: 142186085

Список литературы Исследование частотно-избирательных свойств методов декомпозиции на эмпирические моды для оценки частоты основного тона речевых сигналов

  • Михайлов В.Г., Златоусова Л.В. Измерение параметров речи/под ред. М.А. Сапожникова. М.: Радио и связь, 1987. 168 с
  • Azarov E., Vashkevich M., Petrovsky A. Instantaneous pitch estimation based on RAPT framework. Signal Processing Conference (EUSIPCO), 2012 Proceedings of the 20th European, 27-31 Aug. 2012. Р. 2787-2791
  • Huang N.E., Zheng Shen, Steven R.L. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis, Proceedings of the Royal Society of London A. 1998. V. 454. P. 903-995
  • Zhaohua Wu, Huang N.E. Ensemble empirical mode decomposition: A noise -assisted data analysis method, Advances in Adaptive Data Analysis. 2009. V. 1(1). P. 1-41
  • Yeh J.-R., Shieh J.-S., Huang N.E. Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method, Advances in Adaptive Data Analysis. 2010. V. 2(2). P. 135-156
  • Алимурадов А.К. Применение преобразования Гильберта-Хуанга в задаче выделения информативных признаков речевых сигналов/А. К. Алимурадов, А.Ю. Тычков//Международный научно-исследовательский журнал. 2013. № 5-1(12). С. 57-58
  • Алимурадов А.К. Применение комплементарной множественной декомпозиции на эмпирические моды для анализа речевых сигналов/А.К. Алимурадов, Ю.С. Квитка//Измерение. Мониторинг. Управление. Контроль. 2014. № 4(10). С. 69-75
  • Алимурадов А.К. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи/А.К. Алимурадов, П.П. Чураков//Измерение. Мониторинг. Управление. Контроль. 2015. № 2(12). С. 27-35
  • Баскаков С.И. Радиотехнические цепи и сигналы. М. Высшая школа, 2000. 214 с
  • Малла С. Вейвлеты в обработке сигналов: пер. англ. М.: Мир, 2005. 212 с
  • Huang N.E. The Hilbert-Huang transform and its applications/World Scientific Publishing Co. Pte. Ltd. 5, Singapore 596224. 2005. 526 p
  • Huang N.E. An Introduction to Hilbert-Huang Transform: A Plea for Adaptive Data Analysis//Research Center for Adaptive Data Analysis. National Central University. Singapore. 2007, 257 pages
  • Kuo-Hau Wu, Chia-Ping Chen, Bing-Feng Yeh Noise-robust speech feature processing with empirical mode decomposition//EURASIP Journal on Audio, Speech, and Music Processing. 2011. 9 p
  • Md. Ekramul Hamid, Somlal Das, Keikichi Hirose, Md. Khademul Islam Molla Speech Enhancement Using EMD Based Adaptive Soft-Thresholding (EMD-ADT)//International Journal of Signal Processing, Image Processing and Pattern Recognition. June, 2012. V. 5(2). 16 p
  • Kais Khaldi, Abdel-Ouahab Boudraa, Abdelkhalek Bouchikhi, Monia Turki-Hadj Alouane. Speech Enhancement via EMD//Hindawi Publishing Corporation EURASIP Journal on Advances in Signal Processing. 2008. 8 p
  • Тычков А.Ю., Алимурадов А.К., Квитка Ю.С., Ярославцева Д.А. Свидетельства о государственной регистрации программ для ЭВМ «Верифицированная база речевых сигналов». № 2013621156; заявл.13.09.2013.; опубл. 06.11.2013
  • Mandic D.P., Rehman N.U., Zhaohua Wu, Huang N.E. Empirical Mode Decomposition-Based Time-Frequency Analysis of Multivariate Signals: The Power of Adaptive Data Analysis, Signal Processing Magazine//IEEE. Nov. 2013. V. 30(6). P. 74-86
  • Flandrin P., Rilling G., Goncalv𝑎´s P. Empirical Mode Decomposition as a Filter Bank//IEEE Signal Processing Letters. Feb. 2004. V. 11(2), P. 112-114
  • Gaston S., Torres M.E., Hugo L.R. Pathological Voice Analysis and Classification Based on Empirical Mode Decomposition//Development of Multimodal Interfaces: Active Listening and Synchrony Lecture Notes in Computer Science. 2010. V. 5967. P. 364-381
Еще
Статья научная