Настраиваемый подход к эффективному распознаванию текстовых ситуаций
Автор: Кормалев Дмитрий Анатольевич
Журнал: Программные системы: теория и приложения @programmnye-sistemy
Статья в выпуске: 3 (3) т.1, 2010 года.
Бесплатный доступ
В статье предложен механизм, обеспечивающий удобный способ специализированной аналитической обработки текстовой информации, не требующий от пользователя системы знания формальных языков описания правил и обеспечивающий высокую вычислительную эффективность. Подход предназначен для распознавания относительно простых контекстов, специфика которых неизвестна заранее, поэтому разработка полноценной системы правил распознавания текстовых ситуаций нецелесообразна. Высокая вычислительная эффективность обеспечивается за счет предобработки корпуса текстов и предварительной фильтрации.
Обработка текстов на естественном языке, сопоставление образцу, контекстная фильтрация, конечные автоматы
Короткий адрес: https://sciup.org/14335881
IDR: 14335881
Список литературы Настраиваемый подход к эффективному распознаванию текстовых ситуаций
- Appelt D. E., Israel D. J., "Introduction to Information Extraction. Tutorial", IJCAI'99, Sixteenth Int. Joint Conf. on Artificial Intelligence (Stockholm, Sweden, 1999)
- Ермаков А. Е., "Извлечение знаний из текста и их обработка: состояние и перспективы", Информационные технологии, 2009, №7
- Stevenson M., Greenwood M. A., "Comparing information extraction pattern models", IEBeyondDoc'06, Proceedings of the Workshop on Information Extraction Beyond The Document, Association for Computational Linguistics, Morristown, NJ, USA, 2006
- Etzioni O., Banko M., Soderland S., Weld D. S., "Open information extraction from the web", Commun. ACM, 51:12 (2008)
- Fellbaum Ch. (ed.), WordNet: An Electronic Lexical Database, The MIT Press, 1998, ISBN: 026206197X
- Александровский Д. А., Кормалев Д. А., Кормалева М. С., Куршев Е. П., Сулейманова Е. А., Трофимов И. В., "Развитие средств аналитической обработки текста в системе ИСИДА-Т", Тр. Десятой нац. конф. по искусственному интеллекту с междунар. участием КИИ-2006. т. 2, Физматлит, Москва, 2006, 555-563
- Кормалев Д. А., "Повышение производительности при распознавании текстовых ситуаций", КИИ-2008. т. 2, ЛЕНАНД, Москва, 2008, 192-200
- Broder A., Glassman S., Manasse M., Zweig G., "Syntactic clustering of theWeb", 6th International World Wide Web Conference, Elsevier Science Publishers Ltd., Santa Clara, California, United States, 1997, 1157-1166
- Broder A., "On the Resemblance and Containment of Documents", SEQUENCES'97, Proceedings of the Compression and Complexity of Sequences (1997), IEEE Computer Society, Washington, DC, USA, 1997
- Кормалев Д. А., Куршев Е. П., "Развитие языка правил извлечения информации в системе ИСИДА-Т", Программные системы: теория и приложения. т. 1, Тр. междунар. конф., Физматлит, Москва, 2006, 365-377
- Grishman R., TIPSTER Text Architecture Design. Version 3.1, New York, NYU, 1998
- Кормалев Д. А., "Представление лингвистической и предметно-ориентированной информации о тексте при помощи аннотаций", Интеллектуальный анализ информации ИАИ-2004, Четвертый российско-украинский научный семинар, Просвiта, Киев, 2004, 120-128