Разработка лингвистического процессора текстов на казахском языке

Автор: Койбагаров Кайрат Чапденович, Мусабаев Рустам Рафикович, Калимолдаев Максат Нурадилович

Журнал: Проблемы информатики @problem-info

Рубрика: Средства и системы обработки и анализа данных

Статья в выпуске: 3 (24), 2014 года.

Бесплатный доступ

Настоящая работа посвящена описанию модуля лексико-морфологического анализа слов казахского языка, который будет использоваться в качестве инструмента облачного веб-сервиса. В работе обоснованы способы представления морфологической информации и хранения и методы доступа к словам словаря. Описан принцип работы морфологического анализатора. Дан обзор методов анализа на основе теории конечных автоматов, показаны особенности и характеристики данного подхода в представленном анализаторе.

Морфологический анализ, детерминированный конечный автомат, закон сингармонизма

Короткий адрес: https://sciup.org/14320252

IDR: 14320252

Список литературы Разработка лингвистического процессора текстов на казахском языке

  • STEVEN BIRD, EWAN KLEIN, EDWARD LOPER, AND JASON BALDRIDGE. Multidisciplinary instruction with the Natural Language Toolkit/InProceedings of the 3-d Workshop on Is. in Teach. Computat. Ling. (TeachCL ’08). Association for Computational Linguistics, Stroudsburg, PA, USA, 2008. P. 62-70.
  • Ножов И. Морфологическая и синтаксическая обработка текста (модели и программы), тезисы диссертации. 2003.
  • БекмановА Г.Т. Некоторые подходы к проблемам автоматического словоизменения и морфологического анализа в казахском языке//Вестник Восточно-Казахстанского государственного технического университета им. Д. Серикбаева. Усть-Каменогорск. 2009. № 4. С. 192-197.
  • Койбагаров К.Ч., Мусабаев Р.Р., Кулманов С.К. Разработка алгоритмов автоматического анализа словоформ казахского языка//Труды Междунар. научно-теоретич. конф. ” Современное казахское языкознание“. Алма-Ата. 2012. С. 83.
  • Кудрявцев В.В., Алешин С.В., Подколзин А.С. Введение в теорию автоматов. М.: Наука, 1985.
  • KOSKENNIEMI, K.A.General Computational Model for Word-form Recognition and Production./22 An. Meeting on Association for Computational Linguistics. 1984. P. 178-181.
Статья научная