Применение методов машинного обучения для выявления аргументативных связей в текстах научной коммуникации

Автор: Саломатина Н.В., Сидорова Е.А., Пименов И.С.

Журнал: Онтология проектирования @ontology-of-designing

Рубрика: Инжиниринг онтологий

Статья в выпуске: 1 (51) т.14, 2024 года.

Бесплатный доступ

Представлены результаты экспериментов по оценке применимости методов машинного обучения для решения задачи распознавания аргументативных связей в текстах научной коммуникации. Под аргументативной связью понимается отношение, связывающее посылку и заключение типового рассуждения или аргумента, используемого автором для убеждения аудитории. Для оценки качества применялись характеристики точности, полноты и F -меры, полученные при решении задачи распознавания аргументативных связей между смежными текстовыми фрагментами двух видов: предложений и клауз. Базой эксперимента послужил русскоязычный корпус текстов из области научной коммуникации с размеченной экспертами-лингвистами аргументацией. Для разметки использован инструмент ArgNetBank Studio , позволяющий создавать коллекции текстов с детализированной разметкой аргументации. На основе размеченных текстов построены наборы данных для машинного обучения, в которых соотношение связанных и несвязанных аргументативными отношениями пар фрагментов текста (предложений или клауз) составило 1 к 3. Для повышения качества обучения моделей наборы были сбалансированы двумя способами. В первом случае баланс достигался за счёт того, что из каждого текста отбиралось равное количество пар обоих типов, во втором - пары дублировались. На полученных наборах данных проведены эксперименты по связыванию фрагментов текста методами машинного обучения разных типов. Экспериментально определён диапазон изменения оценок качества при распознавании связанных фрагментов в зависимости от их доли в обучающей и тестовой коллекциях. Установлено, что в рамках существующего дисбаланса в реальных коллекциях значения оценок качества могут изменяться в пределах 40-50%. Новизна работы заключается в исследовании диапазона возможных расхождений в оценках качества при применении разных методов машинного обучения на сбалансированных и несбалансированных обучающих и тестовых коллекциях на русскоязычном материале.

Еще

Научная коммуникация, анализ аргументации, аргументативная разметка текста, аргументативные отношения, методы машинного обучения

Короткий адрес: https://sciup.org/170203866

IDR: 170203866   |   DOI: 10.18287/2223-9537-2024-14-1-82-93

Список литературы Применение методов машинного обучения для выявления аргументативных связей в текстах научной коммуникации

  • Lawrence J., Reed C. Argument Mining: A Survey. Computational Linguistics, 2019. Vol. 45 (4). P.765-818.
  • Chen T. BERT Argues: How Attention Informs Argument Mining. Honors Theses, vol. 1589. 2021.
  • Feng V.-W., Hirst G. Classifying arguments by scheme // In: Proc. of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, 2011. Vol.1. P.987-996.
  • Achmadeeva I., Kononenko I., Salomatina N., Sidorova E. Indicator Patterns as Features for Argument Mining // In: Proc. of the Int. Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON). Novosibirsk, 2019. P.0886-0891. DOI: 10.1109/SIBIRCON48586.2019.8958295.
  • Stab C., Gurevych I. Identifying argumentative discourse structures in persuasive essays // In: Proc. of the 2014 Conference on Empirical Methods in Natural Language Processing. Doha, 2014. P.46-56.
  • Sidorova E., Akhmadeeva I., Kononenko I., Chagina P. The role of Indicators in Argumentative Relation Prediction // In: Proc. of the Int. Conf. on Computational Linguistics and Intellectual Technologies "Dialogue 2023". Issue 22. 2023. P.477-485. DOI:10.28995/2075-7182-2023-22-477-485.
  • Lawrence J., Reed C. Combining argument mining techniques // In: Proc. of the 2nd Workshop on Argumentation Mining. Denver: Association for Computational Linguistics, 2015. P.127-136.
  • Lawrence J., Reed C. Mining Argumentative Structure from Natural Language text using Automatically Generated Premise-Conclusion Topic Models // In: Proc. of the 4th Workshop on Argument Mining. Denmark: Association for Computational Linguistics, 2017. P.39-48.
  • Nguyen H. V., Litman D. Context-aware argumentative relation mining // In: Proc. of the 54th Annual Meeting of the Association for Computational Linguistics, Berlin. 2016. Vol. 1: Long Papers. P.1127-1137.
  • Niculae V., Park J., Cardie C. Argument mining with structured SVMs and RNNs // In: Proc. of the 55th Annual Meeting of the Association for Computational Linguistics. 2017. Vol. 1: Long Papers. P.985-995.
  • Zasypkin A.S., Pimenov I.S., Salomatina N. V. The Combined Approach to Identifying Argumentation Structures in Short Scientific Papers // In: IEEE 24th International Conference of Young Professionals in Electron Devices and Materials (EDM). 2023. P.1800-1805. D0I:10.1109/EDM58354.2023.10225223.
  • Rahwan I., Reed C. The argument interchange format // In: G. Simari, I. Rahwan (ed.): Argumentation in Artificial Intelligence. Boston: Springer, 2009. P.383-402.
  • Walton D., Reed C., Macagno F. Argumentation schemes. Cambridge University Press, 2008. 443 p.
  • Сидорова Е.А., Ахмадеева И.Р., Загорулько Ю.А., Серый А.С., Шестаков В.К. Платформа для исследования аргументации в научно-популярном дискурсе // Онтология проектирования. 2020. Т.10, №4(38). С.489-502. DOI: 10.18287/2223-9537-2020-10-4-489-502.
  • Scikit Learn Homepage. https://scikit-learn.org/stable/supervised_learning.html.
  • Сайт Хабр. https ://habr.com/ru/articles/
  • Пименов И.С. Анализ расхождений в аргументационной разметке научных статей на русском языке // Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2023. Т.21, №2. С.89-104. DOI: 10.25205/1818-7935-2023-21-2-89-104.
Еще
Статья научная