Извлечение сложных временных выражений из текстов в рамках задачи автоматического выявления ситуаций
Автор: Власова Наталья Александровна, Подобряев Алексей Владимирович
Журнал: Программные системы: теория и приложения @programmnye-sistemy
Рубрика: Программное и аппаратное обеспечение для супер ЭВМ
Статья в выпуске: 4 (31) т.7, 2016 года.
Бесплатный доступ
В рамках проблемы автоматического выявления ситуаций в публицистических текстах на русском языке рассматривается задача поиска сложных временных выражений. Выделение именных групп, содержащих временные выражения, понимается как подзадача частичного синтаксического анализа (shallow parsing). Предлагается алгоритм, состоящий из предварительной сегментации и последующего поиска границ именных групп в выделенном сегменте с помощью машинного обучения (CRF-модели). Приводятся результаты экспериментов
ID: 14336088 Короткий адрес: https://sciup.org/14336088
Список литературы Извлечение сложных временных выражений из текстов в рамках задачи автоматического выявления ситуаций
- V. Moriceau, X. Tannier. "French Resources for Extraction and Normalization of Temporal Expressions with HeidelTime", Proceedings of the Ninth International Conference on Language Resources and Evaluation, LREC’14 (26-31 May, 2014, Reykjavik, Iceland), ELRA, 2014, URL: http://www.lrec-conf.org/proceedings/lrec2014/pdf/45_Paper.pdf
- T. A. Miller, S. Bethard, D. Dligach, Ch. Lin, G. K. Savova. "Extracting Time Expressions from Clinical Text", Proceedings of the Workshop on Biomedical Natural Language Processing, BioNLP’15 (July 30, 2015, Beijing, China), 2015. P. 81-91, URL: http://www.aclweb.org/anthology/W15-3809
- P. Jindal, D. Roth. "Extraction of Events and Temporal Expressions from Clinical Narratives", Journal of Biomedical Informatics, 46, suppl. (December 2013), pp. S13-S19, URL: http://sharps.org/wp-content/uploads/JINDAL-JBI.pdf
- А. А. Романенко. Применение условных случайных полей в задачах обработки текстов на естественном языке, Выпускная квалификационная работа магистра, МФТИ, М., 2014, URL: http://www.machinelearning.ru/wiki/images/f/fc/Romanenko2014Application.pdf
- Н. А. Власова. Об одной проблеме автоматического извлечения временной информации из русскоязычных текстов//Программные системы: теория и приложения, Т. 5, №. 4(22). 2014. С. 231-242, URL: http://psta.psiras.ru/read/psta2014_4_231-242.pdf
- Н. С. Ландо. Современные методы автоматического анализа темпоральных выражений в текстах на естественном языке//Программные системы: теория и приложения, Т. 6, №. 4(27). 2015. С. 419-439, URL: http://psta.psiras.ru/read/psta2015_4_419-439.pdf
- J. Pustejovsky, B. Ingria, R. Sauri, J. Castano, J. Littman, R. Gaizauskas, A. Setzer, G. Katz, I. Mani. "The Specification Language TimeML", The Language of Time: A Reader Mani, eds. J. Pustejovsky, R. Gaizauskas, Oxford University Press, Oxford, 2005. P. 545-557.
- B. Boguraev, R. K. Ando. TimeML-Compliant Text Analysis for Temporal Reasoning, IBM, 2005, URL: http://riejohnson.com/rie/timemlijcai05.pdf
- N. Vazov. "A System for Extraction of Temporal Expressions from French Texts", TALN’01 (July 2-5, 2001, Tours, France). P. 315-324, URL: http://tln.li.univ-tours.fr/Tln_Colloques/TALN2001-RECITAL2001/Actes/tome1_PDF/partie2_p30_322/art29_p313_322.pdf
- F. Schilder, Ch. Habel. "From Temporal Expressions to Temporal Information: Semantic Tagging of News Messages", Proceedings of the ACL Workshop on Temporal and Spatial Information Processing, ACL’01 (July 9-11, 2001, Toulose, France). P. 65-72, URL: http://modul.mercubuana.ac.id/files/openjournal/OpenJournalOfTechnology/text/W01-1309.pdf
- A. X. Chang, Ch. D. Manning. "SUTIME: A Library for Recognizing and Normalizing Time Expressions", LREC’12 (May 21-27, 2012, Istanbul, Turkey), 2012. P. 3735-3740, URL: http://nlp.stanford.edu/pubs/lrec2012-sutime.pdf
- M. S. Kudinov, A. A. Romanenko, I. I. Piontkovskaja. Conditional random field in segmentation and noun phrase inclination tasks for Russian" (Бекасово, 4 -8 июня 2014 г.), Компьютерная лингвистика и интеллектуальные технологии, т. 13 (20), По материалам ежегодной Международной конференции "Диалог//Изд-во РГГУ, М., 2014. С. 297, 10 с., URL: http://www.dialog21.ru/digests/dialog2014/materials/pdf/KudinovMS.pdf
- Д. А. Александровский, Д. А. Кормалев, М. С. Кормалева, Е. П. Куршев, Е. А. Сулейманова, И. В. Трофимов. Развитие средств аналитической обработки текста в системе ИСИДА-Т//Труды Десятой национальной конференции по искусственному интеллекту с международным участием КИИ’2006. Т. 2 (25-28 сентября, Обнинск), Физматлит, М., 2006. С. 555-563, URL: http://www.raai.org/resurs/papers/kii2006/doklad/Alexandrovsky.doc
- Н. А. Власова, А. В. Подобряев. К вопросу об определении границ именных групп при решении задач автоматического извлечения информации из текстов на русском языке//Программные системы: теория и приложения, Т. 7, №. 1(28). 2016. С. 153-170, URL: http://psta.psiras.ru/read/psta2016_1_153-170.pdf
- Ch. Sutton, A. McCallum. "An Introduction to Conditional Random Fields", Foundations and Trends in Machine Learning, V. 4. No. 4. 2011. P. 267-373.
- J. M. Hammersley, P. Clifford.. Markov fields on finite graphs and lattices, 1971, URL: http://www.recognition.mccme.ru/pub/papers/CRF/hammersley71markov.pdf