Методы автоматической классификации текстов по функциональным стилям
Автор: Ермакова Л.М., Абашев М.А., Никитин Р.В., Ушаков Р.И.
Журнал: Вестник Пермского университета. Серия: Математика. Механика. Информатика @vestnik-psu-mmi
Рубрика: Информатика. Информационные системы
Статья в выпуске: 4 (27), 2014 года.
Бесплатный доступ
Основной задачей информационного поиска является извлечение из массива данных неструктурированной документальной информации, релевантной информационной потребности пользователя. Однако зачастую пользователи хотят найти документы определенного функционального стиля, например научные или публицистические тексты. При этом возникает необходимость автоматической классификации документов в зависимости от функционального стиля. Статья нацелена на определение формализуемых признаков функциональных стилей, а также на обзор существующих методов автоматической классификации.
Классификация, категоризация, рубрикация, функциональный стиль, функциональная разновидность языка, функциональный тип речи, машинное обучение, информационный поиск
Короткий адрес: https://sciup.org/14729952
IDR: 14729952
Список литературы Методы автоматической классификации текстов по функциональным стилям
- Браславский П. Морфологический строй функциональных стилей (на материале документов Internet)//Известия Уральского государственного университета. 2001. № 21. P. 9-17.
- Емашова О.А., Мальковский М.Г. Функциональные стили русского языка и их влияние на задачу автоматического реферирования текста//Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции "Диалог". 2007. P.167-171.
- Kessler B., Nunberg G., Schutze H. Automatic Detection of Text Genre//CoRR. 1997.
- Жеребило Т.В. Словарь лингвистических терминов: Изд. 5-е, испр-е и дополн. Назрань: Изд-во "Пилигрим". 2010.
- Кожина М.Н. и др. Стилистический энциклопедический словарь русского языка: Изд-во "Флинта". 2003.
- Белокурова С.П. Словарь литературоведческих терминов. Паритет, 2006.
- Manning C.D. et al. The Stanford CoreNLP Natural Language Processing Toolkit//Proceedings of 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations. 2014. P. 55-60.
- Nivre J., Boguslavsky I.M., Iomdin L.L. Parsing the SynTagRus Treebank of Russian//Proceedings of the 22Nd International Conference on Computational Linguistics. Vol. 1. Strouds-burg, PA, USA: Association for Computational Linguistics, 2008. P.641-648.
- Segalovich I. A Fast Morphological Algorithm with Unknown Word Guessing Induced by a Dictionary for a Web Search Engine.//MLMTA. Citeseer, 2003. P.273-280.
- Miller G.A., Beckwith R., Fellbaum C. Introduction to WordNet: An On-line Lexical Database. 1993.
- Ermakov S., Ermakova L. Sentiment Classification Based on Phonetic Characteristics//Advances in Information Retrieval/ed. Serdyukov P. et al. Springer Berlin Heidelberg, 2013. Vol. 7814. P. 706-709.
- Kim S.-M., Hovy E. Identifying and Analyzing Judgment Opinions//Proceedings of the Human Language Technology Conference of the North American Chapter of the ACL. 2006. P. 200-207.
- Pang B., Lee L. Opinion Mining and Sentiment Analysis//Foundations and Trends in Information Retrieval. 2008. Vol. 2, № 1-2. P. 1-135.
- Лифшиц Ю. Классификация текстов . 2005. URL: http://yury.name/internet/(accessed: 10.10.2011).
- Mason J.E., Shepherd M., Duffy J. An n-gram based approach to automatically identifying web page genre//System Sciences, 2009. HICSS'09. 42nd Hawaii International Conference on. IEEE, 2009. P. 1-10.
- FreundL., Clarke C.L., Toms E.G. Towards genre classification for IR in the workplace//Proceedings of the 1st international conference on Information interaction in context. ACM, 2006. P. 30-36.
- Stamatatos E., Fakotakis N., Kokkinakis G. Automatic text categorization in terms of genre and author//Computational linguistics. 2000. Vol. 26, № 4. P. 471-495.
- Lee Y.-B., Myaeng S.H. Text genre classification with genre-revealing and subject-revealing features//Proceedings of the 25th annual international ACM SIGIR conference on Research and development in information retrieval. ACM, 2002. P. 145-150.
- Snyman D.P., Van Huyssteen G.B., Daele-mans W. Automatic Genre Classification for Resource Scarce Languages//Proceedings of the 22nd Annual Symposium of the Pattern Recognition Association of South Africa. 2011. P. 132-137.
- Petrenz P., Webber B. Stable classification of text genres//Comput. Linguist. Vol. 37, №2. P. 385-393.
- Karlgren J., Cutting D. Recognizing Text Genres with Simple Metrics Using Discriminant Analysis//Proceedings of the 15th Conference on Computational Linguistics -Volume 2. Stroudsburg, PA, USA: Association for Computational Linguistics, 1994. P.071-1075.
- Feldman S. et al. Part-of-speech histograms for genre classification of text//Acoustics, Speech and Signal Processing, 2009. ICASSP 2009. IEEE International Conference on. IEEE, 2009. P. 4781-4784.
- Dewdney N., VanEss-Dykema C., MacMillan R. The form is the substance: Classification of genres in text//Proceedings of the workshop on Human Language Technology and Knowledge Management-Volume 2001. Association for Computational Linguistics, 2001. P. 7.
- Шевелев О.Г., Петраков А.В. Классификация текстов с помощью деревьев решений и нейронных сетей прямого распространения//Вестник Томского государственного университета. 2006. Т. 290.
- Rehm G. Towards Automatic Web Genre Identification//Proceedings of the 35th Annual Hawaii International Conference on System Sciences (HICSS'02)-Volume 4 -Volume 4. Washington, DC, USA: IEEE Computer Society, 2002. P. 101.
- Boese E.S., Howe A.E. Effects of web document evolution on genre classification//Proceedings of the 14th ACM international conference on Information and knowledge management. ACM, 2005. P. 632-639.
- Abramson M., Aha D.W. What's in a URL? Genre Classification from URLs//Conference on Artificial Intelligence. 2012. P. 262-263.
- Wu Z., Markert K., Sharoff S. Fine-grained genre classification using structural learning algorithms//Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. Association for Computational Linguistics, 2010. P. 749-759.
- Petrenz P., Webber B. Robust cross-lingual genre classification through comparable corpora//The 5th Workshop on Building and Using Comparable Corpora. 2012. P. 1.