Автоматическое выявление границ именных групп с использованием информации об именованных сущностях

Автор: Власова Наталья Александровна, Подобряев Алексей Владимирович

Журнал: Программные системы: теория и приложения @programmnye-sistemy

Рубрика: Искусственный интеллект, интеллектуальные системы, нейронные сети

Статья в выпуске: 4 (35) т.8, 2017 года.

Бесплатный доступ

В настоящей работе ставится задача автоматического выявления границ именных групп, заполняющих валентность предиката в предложении. Рассматриваются именные группы любых видов, за исключением сочиненных. Используется предварительная автоматическая сегментация предложений на фрагменты, заведомо содержащие искомые именные группы. Для проведения границ именных групп внутри найденных фрагментов применяется метод машинного обучения. В системе признаков используется информация об извлеченных на предварительном этапе анализа именованных сущностях разных типов, а также данные из базы знаний. Приводятся результаты эксперимента по выявлению границ именных групп.

Еще

ID: 143164274 Короткий адрес: https://sciup.org/143164274

Список литературы Автоматическое выявление границ именных групп с использованием информации об именованных сущностях

  • S. Abney. "Parsing by chunks", Principle-based parsing, Studies in Linguistics and Philosophy, vol. 44, Kluwer Academic Publishers, 1991. P. 257-278.
  • L. Ramshaw, M. Marcus. "Text chunking using transformation-based learning", 3rd Annual Workshop on Very Large Corpora Proceedings (Boston, Massachussetts, USA, June 1995), Text, Speech and Language Technology, vol. 11. P. 82-94.
  • О. И. Бабина, Т. Ю. Мыларщикова. Извлечение именных групп из корпуса текстов на испанском языке//Вестник Южно-Уральского государственного университета. Лингвистика, 22 2011. С. 47-53.
  • P. Jindal, D. Roth. "Extraction of events and temporal expressions from clinical narratives", Journal of Biomedical Informatics, 46, suppl. 2013, pp. S13-S19.
  • N. Vazov. "A system for extraction of temporal expressions from French texts", TALN 2001 (Tours, France, 2-5 juillet 2001), 2001. P. 313-322, URL: https://www.atala.org/doc/actes_taln/AC_0132.pdf
  • А. А. Романенко. Применения условных случайных полей в задачах обработки текстов на естественном языке, Выпускная квалификационная работа магистра, М., 2014, 27 с., URL: http://www.machinelearning.ru/wiki/images/f/fc/Romanenko2014Application. pdf
  • Л. Г. Крейдлин. Программа выделения русских индивидуализированных именных групп TagLite//Компьютерная лингвистика и интеллектуальные технологии, Сборник трудов ежегодной международной конференции "Диалог" (Звенигород, Россия, 1-6 июня 2005). С. 292-297.
  • M. S. Kudinov, A. A. Romanenko, I. I. Piontkovskaja. "Conditional random field in segmentation and noun phrase inclination tasks for Russian", Computational Linguistics and Intellectual Technologies, V. 13. No. 20. 2014. P. 297-306.
  • P. Osenova, S. Kolkovska. "Combining the named entity recognition task and NP chunking strategy for robust pre-processing", Proceedings of 1st Workshop on Treebanks and Linguistic Theories (Sozopol, Bulgaria, 20-21 September 2002). P. 167-182.
  • Д. А. Александровский, Д. А. Кормалев, М. С. Кормалева, Е. П. Куршев, Е. А. Сулейманова, И. В. Трофимов. Развитие средств аналитической обработки текста в системе ИСИДА-Т//Тр. Десятой нац. конф. по искусственному интеллекту с междунар. участием КИИ-2006. Т. 2 (Обнинск, Россия, 25-28 сентября 2006), Физматлит, М., 2006. С. 555-563.
  • Д. А. Кормалев, Е. П. Куршев, Е. А. Сулейманова, И. В. Трофимов. Технология извлечения информации из текстов, основанная на знаниях//Программные продукты и системы, 2009, №2. С. 62-66.
  • Н. А. Власова. Об одной проблеме автоматического извлечения временной информации из русскоязычных текстов//Программные системы: теория и приложения, Т. 5, № 4(22). 2014. С. 231-242, URL: http://psta.psiras.ru/read/psta2014_4_231-242.pdf
  • И. В. Трофимов. Выявление личных имен в новостных текстах на материале коллекций Persons-1000/1111-F//Электронные библиотеки: перспективные методы и технологии, электронные коллекции, XVI Всероссийская научная конференция RCDL-2014 (Дубна, Россия, 13-16 октября 2014 г.), 2014. С. 217-221.
  • Н. А. Власова, А. В. Подобряев. К вопросу об определении границ именных групп при решении задач автоматического извлечения информации из текстов на русском языке//Программные системы: теория и приложения, Т. 7, № 1(28). 2016. С. 153-170, URL: http://psta.psiras.ru/read/psta2016_1_153-170.pdf
  • Ch. Sutton, A. McCallum. "An introduction to conditional random fields", Foundations and Trends in Machine Learning, V. 4. No. 4. 2011. P. 267-373.
Еще
Ред. заметка