Система контроля достоверности текстовой информации на основе n-граммных парсинговых моделей
Автор: Камилов Мирзоян Мирзаахмедович, Ахатов
Журнал: Проблемы информатики @problem-info
Рубрика: Средства и системы обработки и анализа данных
Статья в выпуске: 1 (5), 2010 года.
Бесплатный доступ
Предложен новый подход к построению компьютерной системы передачи и обработки текстовой информа- ции на основе n-граммной языковой модели. Получены методики определения условных вероятностей n-кратных ошибок в информации, разработаны способы и алгоритмы оптимизации основных компонент системы контроля и коррекции орфографии, построенных на основе механизмов парсингового представле- ния и моделирования элементов текста.
Текстовая информация, безусловная, условная вероятность, кратность ошибки, достоверность, морфологическая модель, n-граммная модель, словоформа, распознавание, кластеризация, поиск, парсинг
Короткий адрес: https://sciup.org/14320015
IDR: 14320015