Построение частотных словарей на основе исходных текстов с применением лемматизации
Автор: Ковалев Игорь Владимирович, Середин Александр Игоревич, Карасева Маргарита Владимировна, Зеленков Павел Викторович, Храпунова Валерия Владимировна
Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau
Рубрика: Математика, механика, информатика
Статья в выпуске: 4 (50), 2013 года.
Бесплатный доступ
Рассматривается вопрос снижения трудоемкости изучения информационно-терминологического базиса за счет уменьшения объема частотного словаря, на основе которого строится базис. Рассматривается вопрос построения частотных словарей на основе исходных текстов с применением лемматизации для последующего формирования информационно-терминологического базиса. Приводится алгоритм построения частотного словаря на основе исходных текстов с применением лемматизации, а также модификация данного алгоритма с использованием проверки терминов формируемого частотного словаря по специализированному словарю.
Частотный словарь, информационно-терминологический базис, лемматизация
Короткий адрес: https://sciup.org/148177155
IDR: 148177155