Разработка системы транскрибации аудио-и видеоконтента
Автор: Елизаров Дмитрий Александрович
Рубрика: Информатика и вычислительная техника
Статья в выпуске: 4, 2023 года.
Бесплатный доступ
Проведен анализ существующих систем транскрибации аудио- и видеоконтента. Разработка системы транскрибирования позволит повысить эффективность работы сотрудников, обеспечить текстовыми данными и визуализацией информации. Существующие системы на данном этапе не позволяют с высокой точностью проводить распознавание аудио- и видеофайлов, особенно при работе с файлами с посторонними шумами.
Транскрибация, модель, python, система, архитектура
Короткий адрес: https://sciup.org/148327857
IDR: 148327857 | DOI: 10.18137/RNU.V9187.23.04.P.87
Список литературы Разработка системы транскрибации аудио-и видеоконтента
- Елизаров Д.А., Колпакова П.Е. Применение системы транскрибирования // Сборник материалов Всероссийской научно-практической конференции с международным участием, Биробиджан, 15 декабря 2022 г. / Под науч. ред. В.М. Козина. Биробиджан: Приамурский государственный университет им. Шолом-Алейхема, 2023. С. 13–16. EDN BXAZZQ.
- Девяткина Е. Способы перевода видео в текст, автоматическое транскрибирование // Yagla. URL: https://yagla.ru/blog/marketing/6-sposobov-perevesti-audio-i-video-v-tekst--2110m94955/ (дата обращения: 03.08.2023).
- Ибушева М. Перевод аудио и видео в текст: способы транскрибации // SEOnews. 2021. 1 августа. URL: https://www.seonews.ru/analytics/7-sposobov-perevoda-video-v-tekst/ (дата обращения: 03.08.2023).
- 5 ways to transcribe audio to text // MyNewsdesk. 2019. April 18. URL: https://www.mynewsdesk.com/en/blog/5-ways-to-transcribe-audio-to-text/ (дата обращения: 03.08.2023).
- McMullin C. Transcription and Qualitative Methods: Implications for Third Sector // Voluntas. 2023. Vol. 34. No. 1. Pp. 140–153. DOI: 10.1007%2Fs11266-021-00400-3
- Блокнот для речевого ввода. URL: https://speechpad.ru (дата обращения: 03.08.2023).
- Voice Dictation – Online Speech Recognition. URL: https://dictation.io (дата обращения: 03.08.2023).
- Вопросы и ответы по AmazonTranscribe // AmazonWebServices (AWS). URL: https://aws.amazon.com/ru/transcribe/faqs/ (дата обращения: 03.08.2023).
- CloudExpert. Dragon Dictation – распознавание голоса в текст // IaaSSaaSPaaS.ru: Обзоры облачных сервисов. 2022. 22 декабря. URL: https://iaassaaspaas.ru/servisy/dragon-dictationraspoznavanie-golosa-v-tekst (дата обращения: 03.08.2023).
- Otter.ai – сервис для стенографирования видеоконференций и звонков // Startpack. URL: https://startpack.ru/application/otter-ai (дата обращения: 03.08.2023).
- Wave – чтение и запись WAV-файлов // Digitology.tech. 09.08.2023. URL: https://digitology.tech/docs/python_3/library/wave.html (дата обращения: 03.08.2023).
- Как обработать аудио с помощью ffmpeg? // VC.RU. NewTechAudit. 03.02.2020. URL: https://vc.ru/newtechaudit/110160-kak-obrabotat-audio-s-pomoshchyu-ffmpeg (дата обращения: 03.08.2023).
- NewTechAudit. Распознавание и анализ речи с помощью библиотеки SPEECH RECOGNITION, PY AUDIO и LIBROSA // Хабр. 14.09.2021. URL: https://habr.com/ru/post/577806/ (дата обращения: 03.08.2023).
- Офлайн-распознавание речи. Библиотека Vosk // VC.RU. NewTechAudit. 18.05.2021. URL: https://vc.ru/dev/247450-oflayn-raspoznavanie-rechi-biblioteka-vosk (дата обращения: 03.08.2023).
- Мы опубликовали модель, расставляющую знаки препинания и заглавные буквы в тексте на четырех языках // Хабр. 06.10.2021. URL: https://habr.com/ru/post/581946/ (дата обращения: 03.08.2023).
- Топ-10 библиотек Python для Data Science // DataStart. URL: https://datastart.ru/blog/read/top-10-bibliotek-python-dlya-data-science (дата обращения: 03.08.2023).
- Elsayed O.S., Petrov S.N. (2020) Speech and voice recognition system based on machine learning methods // Современные средства связи: материалы XХV Международной научно-технической конференции (Минск, 22–23 октября 2020 г.). Минск: Белорусская государственная академия связи, 2020. С. 222–223. EDN MZYG IJ.
Статья научная