Система контроля достоверности текстовой информации на основе n-граммных парсинговых моделей

Автор: Камилов Мирзоян Мирзаахмедович, Ахатов

Журнал: Проблемы информатики @problem-info

Рубрика: Средства и системы обработки и анализа данных

Статья в выпуске: 1 (5), 2010 года.

Бесплатный доступ

Предложен новый подход к построению компьютерной системы передачи и обработки текстовой информа- ции на основе n-граммной языковой модели. Получены методики определения условных вероятностей n-кратных ошибок в информации, разработаны способы и алгоритмы оптимизации основных компонент системы контроля и коррекции орфографии, построенных на основе механизмов парсингового представле- ния и моделирования элементов текста.

Текстовая информация, безусловная, условная вероятность, кратность ошибки, достоверность, морфологическая модель, n-граммная модель, словоформа, распознавание, кластеризация, поиск, парсинг

Короткий адрес: https://sciup.org/14320015

IDR: 14320015

Статья научная