Извлечение именных групп из корпуса текстов на испанском языке

Бесплатный доступ

Рассматривается применение лексикалистского подхода к извлечению именных групп из корпуса патентных текстов на испанском языке. Проведено корпусное исследование именных групп в текстах патентов на аппараты, в результате которого определены синтаксические шаблоны именной группы, типичные для флективного языка, такого как испанский. Рассмотрены трудности, препятствующие повторному использованию базы знаний, разработанной для распознавания именной группы на английском языке. Расширен алгоритм распознавания именной группы, состоящий в фильтровании списка кандидатов в именные группы на основе анализа их лексических контекстов, посредством включения в него морфологического анализа флективных форм на испанском языке. Эффективность алгоритма оценивается через анализ причин ложного принятия и ложного отклонения кандидатов в ходе исполнения алгоритма.

Еще

Именная группа, извлечение информации, база знаний, лексика-листский подход, флективные языки, испанский язык, синтаксические шаблоны, контекст, предметная область, корпусное исследование

Короткий адрес: https://sciup.org/147153760

IDR: 147153760

Список литературы Извлечение именных групп из корпуса текстов на испанском языке

  • Леонтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы: уч.пособ. для студентов лингв, фак. вузов. М.: Издательский центр «Академия», 2006. С. 22.
  • Филлмор Ч. Дело о падеже//Зарубежная лингвистика III/общ. ред. В.Ю. Розенцвейга, В.А. Звегинцева, Б.Ю. Городецкого. -М.: Изд. группа «Прогресс», 2002. С. 127-258
  • Апресян Ю.Д. Избранные труды. 2-е изд., испр. и доп. -М.: Школа «Языки русской культуры»: Изд-во «Восточная литература» РАН, 1995. Т. 1. Лексическая семантика. -VIII, 472 с
  • Мельчук И.А. Опыт теории лингвистических моделей «Смысл Текст». М.: Школа «Языки русской культуры», 1999.
  • Huddleston, R. Introduction to the Grammar of English, Cambridge, Cambridge University Press, 1997 (reprinted). P. 120.
  • The Statistics of Word Cooccurrences: Word Pairs and Collocations. Ph.D. thesis, University of Stuttgart, 353 p.
  • Sheremetyeva S. 2009. On extracting multiword NP terminology for MT. In EAMT-2009: Proceedings of the 13th Annual Conference of the European Association for Machine Translation, ed. Lluis Marquez and Harold Somers, 14-15 May 2009. Universitat Politecnica de Catalunya, Barcelona, Spain; P. 205-212
  • Sheremetyeva S. 2009b. An efficient patent keyword extractor as translation resource. In MT Summit XII: Third Workshop on Patent Translation, August 30, 2009. Ottawa, Ontario, Canada; P. 25-32.
  • Бабина О.И. Автоматический морфологический анализ флективных языков//Наука ЮУрГУ: материалы 62-й научной конференции. Секции естественно-научных и гуманитарных наук (Челябинск, 28 апреля 2010 г.). Челябинск: Издательский центр ЮУрГУ, 2010
  • Бабина О.И. Нестрого аддитивный подход к автоматическому морфологическому анализу флективных языков//Материалы 5-й международной научно-практической конференции «Наука и современность-2010». Секция филологические науки. Новосибирск: Центр Развития Научного Сотрудничества, 2010.
Еще
Статья научная