Методы применения VAD в системах распознавания казахской речи
Автор: Калимолдаев Максат Нурадилович, Мусабаев Рустам Рафикович, Мамырбаев Оркен Жумажанович, Тусупова Белла Борисовна
Журнал: Проблемы информатики @problem-info
Рубрика: Средства и системы обработки и анализа данных
Статья в выпуске: 1 (18), 2013 года.
Бесплатный доступ
Рассмотрена возможность применения алгоритма “Voice activity detection” в системе распознавания казахской речи. Предложены математическая модель VAD и способы обнаружения речевых данных: пауз между фразами, словами, отдельными звуками. Алгоритм VAD приспособлен к распознаванию казахской речи с учетом ее основных свойств. Впервые проведено исследование обнаружения голосовой активности в казахской речи.
Распознавание речи, обнаружение голосовой активности, речевой сигнал.
Короткий адрес: https://sciup.org/14320193
IDR: 14320193
Список литературы Методы применения VAD в системах распознавания казахской речи
- Дорохин О. А., Старушко Д. Г. Сегментация речевого сигнала//Искусств. интеллект. 2000. №3. С. 450-478.
- Шелепов В. Ю., Ниценко А. В. Амплитудная сегментация речевого сигнала, использующая фильтрацию и известный фонетический состав//Искусств. интеллект. 2003. №6. С. 120-123.
- Lamel L. F., Rabiner L. R., Rosenberg A. E., Wilpon J. G. An improved endpoint detector for isolated word recognition//IEEE Trans. Acoust., Speech, Signal Process. 1981. V. 29, N 4. P. 23-31.
- Rabiner L. Fundamentals of speech recognition/L. Rabiner, Juang Biing-Hwang. Englewood Cli.s: Prentice Hall, 1993.
- Deller J. R. (Jr.). Discrete-time processing of speech signals/J. R. Deller(Jr.), J.H.L.Hansen, J. G. Proakis.John Wiley and Sons. IEEE Press.
- Nilsson M., Ejnarsson M. Speech recognition using hidden Markov model//2002. Degree of Master of Science in Electrical Engineering. Blekinge Institute of Technology. Karlskrona: Kazerntryckriet AB, 2002.
- Aida-Zade К. R. Investigation of combined use of MFCC and LPC features in speech recognition systems/К. R. Aida-Zade, C. Ardil, S. S. Rustamov. World Acad. of Sci., Eng. and Technol. 2006.
- Rabiner L. R., Sambur M. R. An algorithm for determining the endpoints of isolated utterances//Bell System Tech. J. 1975. P. 298-315.
- Atal B., Rabiner L. A pattern recognition approach to voiced-unvoiced-silence classi.cation with applications to speech recognition//IEEE Trans.Acoust.,Speech, Signal Process. V.24. P.201-212,197.
- Rabiner L. R. Digital processing of speech signals/L. R. Rabiner, R. W. Schafer. Englewood Cli.s: Prentice Hall, 1978. P. 666-667.
- Рабинер Л. Р. Цифровая обработка речевых сигналов/Л. Р. Рабинер, Р. В. Шафер. М.: Радио и связь, 1981.