Базовая архитектура, методы и алгоритмы системы извлечения темпоральной информации из текстов на естественном языке
Автор: Сердюк Юрий Петрович
Журнал: Программные системы: теория и приложения @programmnye-sistemy
Рубрика: Искусственный интеллект, интеллектуальные системы, нейронные сети
Статья в выпуске: 4 (27) т.6, 2015 года.
Бесплатный доступ
В данной статье представляется базовая архитектура системы извлечения темпоральной информации из текстов на естественном языке. Определяются основные структурные компоненты такой архитектуры, а также методы и алгоритмы, которые в них реализуются. В частности, выделяется этап извлечения информации о темпоральных элементах — событиях и темпоральных ссылках в тексте. Подчеркивается необходимость использования синтаксических зависимостей между словами обрабатываемого предложения, а также семантических ролей групп слов для установления отношений порядка между темпоральными элементами, извлеченными из текста. Отдельной важной компонентой предлагаемой архитектуры является модуль логического вывода, использующего статистическую информацию. Соответственно, показывается необходимость использования методов машинного обучения и различных корпусов лингвистических данных (аналогичных WordNet, SemCor, TimeBank и др.) для успешного решения общей задачи. Ключевые слова и фразы: Извлечение информации, темпоральные элементы, машинное обучение
Короткий адрес: https://sciup.org/14336176
IDR: 14336176
Список литературы Базовая архитектура, методы и алгоритмы системы извлечения темпоральной информации из текстов на естественном языке
- S. Brin. Extracting patterns and relations from the World Wide Web//WebDB Workshop at 6th International Conference on Extending Database Technology, EDBT’98. P. 172-183.
- D. E. Appelt. Introduction to information extraction//Journal AI Communications, V. 12. No. 3. 1999. P. 161-172.
- R. Sauri, R. Knippen, M. Verhagen, J. Pustejovsky. Evita: A Robust Event Recognizer for QA Systems//Proceedings of HLT/EMNLP 2005. P. 700-707.
- A. X. Chang, C. D. Manning. SUTime: a Library for Recognizing and Normalizing Time Expressions//8th International Conference on Language Resources and Evaluation LREC 2012. P. 23-25.
- N. UzZaman, J. F. Allen. TRIPS and TRIOS System for TempEval-2: Extracting Temporal Information from Text//Proceedings of the 5th International Workshop on Semantic Evaluation, SemEval’10. P. 276-283.
- J. Pustejovsky, B. Ingria, R. Sauri, J. Castano, J. Littman, R. Gaizauskas, A. Setzer, G. Katz, I. Mani. The Specification Language TimeML//The Language of Time: A Reader, eds. I. Mani, J. Pustejovsky, R. Gaizauskas, Oxford University Press, Oxford, 2005. P. 545-557.
- M. Richardson, P. Domingos. Markov logic networks//Machine Learning, V. 62. No. 1. 2006. P. 107-136.
- J. Pustejovsky et al. The TIME-BANK Corpus//Proceedings of Corpus Linguistics 2003. P. 647-656.
- C. Fellbaum (ed.). WordNet: An Electronic Lexical Database, MIT Press, Cambridge, MA, 1998.
- G. A. Miller et al. Using a semantic concordance for sense identification//Proceedings of ARPA Human Language Technology Workshop 1994. P. 240-243.
- I. Mani, G. Wilson. Processing of News//Proceedings of the 38th Annual Meeting of the Association for Computational Linguistics, ACL2000. P. 69-76.
- J. Str¨ otgen, M. Gertz. HeidelTime: High quality rule-based extraction and normalization of temporal expressions//Proceedings of the 5th International Workshop on Semantic Evaluation, SemEval’10, 2010. P. 321-324.
- D. Chen, C. D. Manning. A Fast and Accurate Dependency Parser using Neural Networks//Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing, EMNLP 2015 (25-29 October 2014, Doha, Qatar). P. 740-750.
- M.-C. de Marneffe, B. MacCartney, C. D. Manning. Generating Typed Dependency Parses From Phrase Structure Parses//5th International Conference on Language Resources and Evaluation LREC 2006. P. 449-454.
- P. Koomen, V. Punyakanok, D. Roth, W. Yih. Generalized inference with multiple semantic role labeling systems//Proceedings of the Computational Natural Language Learning Conference, CoNLL’05. P. 181-184 (shared task paper).
- X. Ling, D. S. Weld. Temporal Information Extraction//Proceedings of the 25th National Conference on Artificial Intelligence, AAAI 2010. P. 1385-1390.
- S. Kok et al.. The Alchemy system for statistical relational AI, Technical Report 2(6), Department of Computer Science and Engineering, University of Washington, 2005.