Интеллектуальный тренд-майнинг как одно из современных направлений лингвистических исследований

Бесплатный доступ

Интеллектуальный тренд-майнинг (автоматизированое выявление тенденций) из неструктурированных текстовых информационных потоков, имеет важное значение для прогнозирования и стратегического планирования. К настоящему времени исследования в области интеллектуального тренд-майнинга в связи со сложностью глубокого автоматического анализа текстов представляют собой набор узкоспециализированных методов и инструментов, не обеспечивая методологической базы и информационно-технологического ресурса для их экстраполяции на новые предметные области и языки. В настоящей статье дается обзор наиболее представительных в области исследований и делается попытка систематизировать основные направления и методы решения конкретных задач, возникающих при разработке технологий, связанных с интеллектуальной экстракцией тенденций, конечной целью которой является обработка изменений в коллекциях текстов, содержательная интерпретация выявленных изменений и представление их пользователю в «читабельной» форме. Приводятся основные этапы обработки текстов при интеллектуальной экстракции тенденций, подчеркивается связь тренд-майнинга с контент-анализом и необходимость разработки не зависящих от конкретного языка методов интеллектуального тренд-майнинга, рассматривается роль специализированных онтологий как основного ресурса для достижения этой цели. Рассматриваются наиболее релевантные методики автоматической генерации текстов, представляющих результаты тренд-майнинга.

Еще

Интеллектуальный тренд-майнинг, контент-анализ, многоязычность, лингвистическая онтология, генерация отчетов

Короткий адрес: https://sciup.org/147232058

IDR: 147232058   |   DOI: 10.14529/ling190409

Список литературы Интеллектуальный тренд-майнинг как одно из современных направлений лингвистических исследований

  • Preotёiuc-Pietro, Daniel, Sina Samangooei, Trevor Cohn, Nicholas Gibbins, Mahesan Niranjan. 2012. Trendminer: An Architecture for Real Time Analysis of Social Media Text // In Proceedings of the 6th International AAAI Conference on Weblogs and Social Media, Workshop on Real-Time Analysis and Mining of Social Streams, ICWSM, Dublin, Ireland, 2012, pp. 38-42.
  • Streibel Olga. Trend Mining with Semantic-Based Learning // In European Semantic Web Conference ESWC 2008, PhD Symposium, Teneriffe, Spain, June 2008, pp. 71-77.
  • Конкурентный анализ и основные тенденции российского рынка систем автоматического пожаротушения. URL: http://research-techart.ru/ report/fire-extinguishing-systems-report.htm (дата обращения: 07.02.2019).
  • Brand Analytics. URL: https://br-analytics.ru/BA_description. (accessed: 07.02.2019)
  • Tucker, Conrad S., Harrison M. Kim. 2011. Trend Mining for Predictive Product Design // In Journal of Mechanical Design, vol. 133, iss. 11, Nov. 11, 2011.
  • Martínez, Paloma, Isabel Segura, Thierry Declerck, Josй L. Martínez. 2014. TrendMiner: Large-scale Cross-lingual Trend Mining Summarization of Real time Media Streams // In Procesamiento del lenguaje natural, vol. 53, Sept. 2014, pp. 163-166.
  • Hwan Suh, Jong, Chung Hoon Park, Si Hyun Jeon. 2010. Applying text and data mining techniques to forecasting the trend of petitions filed to e-People // In Expert Systems with Applications, vol. 37, iss. 10, October 2010, pp. 7255-7268.
  • Shih, Meng-Jung, Duen-Ren Liu, Ming-Li Hsu. 2010. Discovering competitive intelligence by mining changes in patent trends // In Expert Systems with Applications, vol. 37, 2010, pp. 2882-2890.
  • Анализ научного текста и новые мировые тенденции. URL:http://www.socialcompas.com/2018/04/05/analiz-nauchnogo-teksta-i-novye-mirovye-tendentsii
  • TrendMiner. - URL: https://cordis.europa.eu/ project/rcn/100752_en.html. (accessed: 07.02.2019)
  • Charu, C. Aggarwal. 2003. A framework for diagnosing changes in evolving data streams // In SIGMOD 2003: Proceedings of the 2003 ACM SIGMOD international conference on Management of data, pp. 575-586.
  • Piskorski, Jakub, Martin Atkinson, Silja Huttunen, Jenya Belyaeva, Roman Yangarber, Vanni Zavarella. 2010. Real-Time Text Mining in Multilingual News for the Creation of a Pre-frontier Intelligence Picture // In ACM SIGKDD Workshop on Intelligence and Security Informatics - ISI-KDD '10, Washington, D.C., 2010.
  • Кечин А.А., Кель А.Э., Кушлинский Н.Е., Филипенко М.Л. Нейроподобный текст-майнинг для выявления и характеризации самых популярных микроРНК. Нейрокомпьютеры: разработка, применение. 2016. № 9. С. 45-56.
  • Sulova Snezhana, Latinka Todoranova, Bonimir Penchev, Radka Nacheva. 2017. Using text mining to classify research papers // In Proceedings of the 17th International Multidisciplinary Scientific GeoConference SGEM. 2017, July 2017, vol. 17.
  • Воронов Ю.П. Чтение между строк (контент-анализ в конкурентной разведке, и не только в ней). URL: http://www.ieie.nsc.ru/eco/arhiv/ ReadStatiy/ 2005_11/Voronov.htm (accessed: 07.02.2019)
  • Шалак В. Элементы математических методов компьютерного контент-анализа текстов. ECM-Journal: журнал о системах электронного документооборота (СЭД). URL: https://ecm-journal.ru/card.aspx?ContentID=1732717. (accessed: 07.02.2019)
  • Kort-Butler, Lisa A. Content Analysis in the Study of Crime, Media, and Popular Culture // In Oxford Research Encyclopedia of Criminology and Criminal Justice. URL: http://criminology.oxfordre. com/view/ (accessed: 07.02.2019)
  • DOI: 10.1093/acrefore/9780190264079.001.0001/acrefore-9780190264079-e-23
  • Majhi Sabitri, Chanda Jal, Bulu Maharana. 2016. Content analysis of Journal articles on Wiki in Science Direct Database // In Library Philosophy and Practice (e-journal), February 2016. URL: http:// digitalcommons.unl.edu/libphilprac/1331/ (accessed: 07.02.2019)
  • Rizvi S.T., Mercier D., Agne S., Erkel S., Dengel A., & Ahmed S. Ontology-based Information Extraction from Technical Documents // In ICAART. 2018.
  • Konys Agnieszka. 2015. An Approach for Ontology-Based Information Extraction System Selection and Evaluation // In Przegląd Elektrotechniczny, Nov. 2015, vol. 1, pp. 207-211.
  • Streibel Olga, & Malgorzata Mochol. 2010. Trend Ontology for Knowledge-Based Trend Mining in Textual Information // In 2010 Seventh International Conference on Information Technology: New Generations, Las Vegas, NV, USA, April 2010, pp. 1285-1288.
  • Li Q., Shilane Ph., Fridman N. Noy, Musen M.A. Ontology Acquisition from On-line Knowledge Sources. URL: http://citeseerx.ist.psu.edu/viewdoc/ download?doi=10.1.1.18.6108&rep=rep1&type=pdf (accessed: 07.02.2019)
  • Sheremetyeva S., Zinovieva A. On Modelling Domain Ontology Knowledge for Processing Multilingual Texts of Terroristic Content // In Proceedings of the International conference digital transformation & global society (DTGS - 2018). St. Petersburg, Russia, 31 May - 1 June 2018.
  • Nirenburg S., & V. Raskin. 2004. Ontological Semantics, Cambridge: MIT Press, 2004, 440 p.
  • Niles I., & A. Pease. 2003. Linking Lexicons and Ontologies: Mapping WordNet to the Suggested Upper Merged Ontology // In Proceedings of the 2003 International conference on Information and Knowledge Engineering (IKE 03), 2003, pp. 412-416.
  • Arp R., B. Smith, A.D. Spear. Building Ontologies with Basic Formal Ontology. Cambridge, MA: MIT Press, 2015, 248 p.
  • Boguslavskii I. Semantic Analysis Based on Linguistic and Ontological Resources // In: Proceedings of the 5th International Conference on the Meaning-Text Representations. Barcelona, 8-9 September 2011, pp. 25-36.
  • Mannes A.J. Golbeck. 2005. Building a Terrorism Ontology // In ISWC Workshop on Ontology Patterns for the Semantic Web, 2005, Vol. 36. URL: http://goo.gl/WXeVVv/ (accessed: 07.02.2019)
  • Turner M., Turner J., Weinberg D. A Simple Ontology for the Analysis of Terrorist Attacks, https://goo.gl/tqyTRG, / ( accessed: 07.02.2019).
  • Berners-Lee T., Hendler J., Lassila O. The Semantic Web // In Scientific American, 2001, vol. 284, iss. 5, pp. 34-43.
  • D'Aquin, M., Noy, N.F. 2012. Where to Publish and Find Ontologies? A Survey of Ontology Libraries // In Web Semantics: Science, Services and Agents on the World Wide Web. 2012, no. 11, pp. 96-111.
  • Reiter E., Dale R. Building natural language generation systems, Cambridge University Press, Cambridge, UK, 2000.
  • Portet F., Reiter E., Gatt A., Hunter J., Sripada S., Freer Y., Sykes CAutomatic generation of textual summaries from neonatal intensive care data // Journal of Artificial Intelligence. 2009, vol. 173, pp. 789-816.
  • Reiter E. An architecture for data-to-text systems // Proceedings of European workshop on natural language generation, 2007. pp. 97-104.
  • Goldstein A., Shahar Y. Generation of Natural-Language Textual Summaries from Longitudinal Clinical Records, 2015. URL: https://www. ncbi.nlm.nih.gov/pubmed/26262120 (accessed: 07.02.2019)
  • Greenwood M.A., Bontcheva K. Multi-Lingual Summarisation of Stream Media Software. 2012. URL: (https://cordis.europa.eu/docs/projects/ cnect/3/287863/080/deliverables/001-D411.pdf) (accessed: 07.02.2019)
Еще
Статья научная