Система автоматического субтитрирования видеофайлов

Автор: Коробкин Дмитрий Михайлович

Журнал: Сетевое научное издание «Системный анализ в науке и образовании» @journal-sanse

Статья в выпуске: 2, 2022 года.

Бесплатный доступ

В данной работе содержится описание процесса автоматического субтитрирования (распознавания звуковой составляющей) видеофайлов в процессе телепроизводства ГТРК «Волгоград-ТРВ». Значимость работы заключается в программно реализованных алгоритмах извлечения аудиодорожки из видеофайла, распознавания речи в аудиофайле, коррекции распознанного текста, добавления субтитров в видеофайл. Разработанный программный модуль автоматического субтитрирования видеофайлов использует технологии: модель распознавания русского языка Golos («Sber»), медиасервер с открытым исходным кодом Emby.

Субтитры

Короткий адрес: https://sciup.org/14124335

IDR: 14124335

Список литературы Система автоматического субтитрирования видеофайлов

  • Денисенко А. Golos - самый большой русскоязычный речевой датасет, размеченный вручную // Хабр: [сайт]. Habr, 2006-2022. Дата публикации: 27.05.2021. URL: https://habr.com/ru/company/sberdevices/blog/559496/.
  • Emby - The open media solution: [сайт]. Emby LLC, 2022. URL: https://emby.media/.
  • ffmpeg Documentation. URL: https://ffmpeg.org/ffmpeg.html.
Статья научная