Система автоматического субтитрирования видеофайлов
Автор: Коробкин Дмитрий Михайлович
Журнал: Сетевое научное издание «Системный анализ в науке и образовании» @journal-sanse
Статья в выпуске: 2, 2022 года.
Бесплатный доступ
В данной работе содержится описание процесса автоматического субтитрирования (распознавания звуковой составляющей) видеофайлов в процессе телепроизводства ГТРК «Волгоград-ТРВ». Значимость работы заключается в программно реализованных алгоритмах извлечения аудиодорожки из видеофайла, распознавания речи в аудиофайле, коррекции распознанного текста, добавления субтитров в видеофайл. Разработанный программный модуль автоматического субтитрирования видеофайлов использует технологии: модель распознавания русского языка Golos («Sber»), медиасервер с открытым исходным кодом Emby.
Субтитры
Короткий адрес: https://sciup.org/14124335
IDR: 14124335
Список литературы Система автоматического субтитрирования видеофайлов
- Денисенко А. Golos - самый большой русскоязычный речевой датасет, размеченный вручную // Хабр: [сайт]. Habr, 2006-2022. Дата публикации: 27.05.2021. URL: https://habr.com/ru/company/sberdevices/blog/559496/.
- Emby - The open media solution: [сайт]. Emby LLC, 2022. URL: https://emby.media/.
- ffmpeg Documentation. URL: https://ffmpeg.org/ffmpeg.html.