Оптимизация библиотеки эталонов при идентификации диктора по кросскорреляционным портретам
Автор: Галицкая Е.Ю., Крашенинников В.Р.
Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc
Рубрика: Информатика, вычислительная техника и управление
Статья в выпуске: 4-3 т.26, 2024 года.
Бесплатный доступ
В статье рассматривается применение модели речевого сигнала в виде кросскорреляционного портрета к задаче текстозависимой идентификации диктора. Эти портреты являются двумерными массивами, состоящими из выборочных значений локальных коэффициентов корреляции двух сигналов. На примере двух дикторов показано, что особенности голоса человека проявляются на портретах его речевых сигналов так, что каждый диктор имеет свой уникальный портрет его произнесения речевой команды. На этом свойстве основан метод идентификации диктора по портретам его произнесений команд. Основу метода составляет сравнение портретов команд «неизвестного» диктора (диктора, которого необходимо идентифицировать и для которого в базе данных хранятся его эталонные портреты) с заранее заданными эталонными портретами для каждого класса дикторов. Свойство сохранения индивидуальности портретов на фоне довольно сильных шумов позволяет применять метод в обстановке акустических шумов. От выбора эталонных портретов существенно зависит частота правильной идентификации дикторов. Отсюда возникает задача выбора таких произнесений для каждого класса команд, при которых портрет команды диктора будет наиболее близок ко всевозможным портретам «своего» диктора и наиболее удален от портретов команд «чужого» диктора. В работе предложен метод направленного перебора, который позволяет из имеющегося множества произнесений выбрать наиболее удачные для использования в качестве эталонных. На реальном речевом материале проведен эксперимент, который доказал эффективность предложенного в работе метода оптимизации библиотеки эталонов.
Речевая команда, идентификация диктора, кросскорреляционный портрет
Короткий адрес: https://sciup.org/148330128
IDR: 148330128 | DOI: 10.37313/1990-5378-2024-26-4(3)-363-369
Список литературы Оптимизация библиотеки эталонов при идентификации диктора по кросскорреляционным портретам
- Матвеев, Ю. Н. Технологии биометрической идентификации личности по голосу и другим модальностям / Ю.Н. Матвеев // Вестник Московского государственного технического университета им. Н.Э. Баумана. – 2012. – № 3(3). – С. 46-60.
- Ручай, А.Н. Биометрика. Текстозависимая верификация диктора: учебное пособие. Челябинск: Челябинский государственный университет / А.Н. Ручай. – 2012. – 105 с.
- Частикова, В.А. Нейросетевая система биометрической личности по голосу / В.А. Частикова, С.А. Жерлицын, Д.О. Войлова // Вестник Адыгейского государственного университета. Серия 4: Естественно-математические и технические науки. – 2023. – №. 1 (316). – С. 70-79.
- Вишнякова, О.А. Подходы к задаче идентификации диктора / О.А. Вишнякова, Д.Н. Лавров // Математические структуры и моделирование. – 2011. – № 1(22). – С. 48-54.
- Карпенко, А. П. Идентификация личности по голосу на основе самоорганизующейся карты Кохонена [Электронный ресурс] / А.П. Карпенко, А.Н. Морозов // Наука и образование: научное издание МГТУ им. НЭ Баумана. – 2012. – № 11. – С. 373-394.
- Нифонтов, С.В. Применение скрытых марковских моделей в текстонезависимых системах идентификации пользователей по голосу / С.В. Нифонтов, Ю.С. Белов //Электронный журнал: наука, техника и образование. – 2016. – № 2. – С. 116-124.
- Васильев, Р.А. Анализ возможностей применения голосовой идентификации в системах разграничения доступа к информации / Р.А. Васильев, Д.Б. Николаев // Научный результат. Информационные технологии. – 2016. – Т. 1. – № 1. – С. 48-57.
- Чернецова, Е.А. Алгоритм идентификации личности по голосу для санкционирования доступа к информации / Е.А. Чернецова, А.Д. Шишкин // Международный научно-исследовательский журнал. – 2019. – № 2 (80). – С. 59-64.
- Брюхомицкий, Ю.А. Метод текстонезависимой идентификации личности по голосу / Ю.А. Брюхомицкий, В.М. Федоров // Известия Южного федерального университета. Технические науки. – 2018. – № 8 (202). – С. 173-181.
- Бучнева, Т.И. Нейронные сети в задаче идентификации личности по голосу / Т.И. Бучнева, М.Ю. Кудряшов // Вестник Тверского государственного университета. Серия: Прикладная математика. – 2015. – №2. – С. 119-126.
- Галицкая, Е.Ю. Применение кросскорреляционных портретов речевых команд для голосовой идентификации диктора / Е.Ю. Галицкая, В.Р. Крашенинников // Автоматизация процессов управления. – 2022. – № 4(70). – С. 58–66.
- Krasheninnikov V. R., Armer A.I., Kuznetsov V.V., Lebedeva E.Yu. Cross-correlation portraits of voice signals in the problem of recognizing voice commands according to patterns // Pattern Recognition and Image Analysis. – 2011. – V. 21. – № 2. – P. 192-194.
- Крашенинников, В.Р. Математические модели речевых сигналов в виде корреляционных портретов в задачах распознавания речевых команд и идентификации дикторов / Крашенинников В.Р., Галицкая Е.Ю. // Автоматизация процессов управления. – 2024. – № 1(75). – С. 40-48.
- База звуков [Электронный ресурс] – URL: http://www.zvukogram.ru (дата обращения 14.05.2024 ).
- Krasheninnikov V.R., Krasheninnikova N.А., Kuznetsov V.V., Lebedeva E.Yu. Optimization of dictionary and model library for recognition of speech commands // Pattern Recognition and Image Analysis. – 2011. – V. 21. – № 3. – P. 505-507.
- Тампель, И.Б. Автоматическое распознавание речи: учебное пособие / Тампель И.Б., Карпов А.А.. – СПб.: Университет ИТМО, 2016. – 138 с.
- Галицкая, Е.Ю. Применение зашумления эталонов при распознавании речевых команд по их кросскорреляционным портретам / Е.Ю. Галицкая, В.Р. Крашенинников // Автоматизация процессов управления. – 2023. – № 1(71). – С.88-99.