Delta Берроуза для древнегреческих авторов: опыт применения

Автор: Алиева Ольга Валерьевна

Журнал: Schole. Философское антиковедение и классическая традиция @classics-nsu-schole

Рубрика: Статьи

Статья в выпуске: 2 т.16, 2022 года.

Бесплатный доступ

В этой статье предпринята попытка эмпирически оценить эффективность метода измерения стилистической разницы, известного как Delta Берроуза, на материале древнегреческого корпуса. Эксперимент с корпусом из четырнадцати (и затем восьми) авторов подтвердил общую эффективность метода. Даже на небольших выборках в 1000–5000 слов решения Delta по большей части корректны, а ее ошибки связаны в основном с текстами, близкими в жанровом отношении. Именно жанровое сходство в обучающей выборке, а не количество слов или длина отрывка, оказывает наибольшее влияние на результат классификации. В спорных случаях, особенно если нет возможности использовать отрывки большей длины (10 000 слов и больше), составление шорт-листов предпочтительнее, чем назначение единственного кандидата. Подобные шорт-листы дают адекватное представление о ближайших стилистических соседях испытуемого текста, оставляя свободу исследователю в интерпретации результатов.

Еще

Delta, стилометрия, частотные слова, количественные методы, машинное обучение

Короткий адрес: https://sciup.org/147237658

IDR: 147237658   |   DOI: 10.25205/1995-4328-2022-16-2-693-705

Список литературы Delta Берроуза для древнегреческих авторов: опыт применения

  • Алиева, О. (2022) “Опыт измерения стилистической однородности методом Delta на материале Платоновского корпуса,” Аристей. Вестник классической филологии и античной истории 25, 19–37.
  • Орехов, Б.В. (2020) “Илиада Е.И. Кострова и Илиада А.И. Любжина: стилеметрический аспект,” Аристей. Вестник классической филологии и античной истории 21, 282–296.
  • Argamon, Sh. (2008) “Interpreting Burrows’s Delta: Geometric and Probabilistic Foundations,” Literary and Linguistic Computing 23.2, 131–147.
  • Burrows, J. (2002) “Delta: A Measure of Stylistic Difference and a Guide to Likely Authorship,” Literary and Linguistic Computing 17.3, 267–287.
  • Eder, M. (2011) “Style-Markers in Authorship Attribution: A Cross-Language Study of the Authorial Fingerprint,” Studies in Polish Linguistics 6.1, 99–114.
  • Eder, M. (2015a) “Does Size Matter? Authorship Attribution, Small Samples, Big Problem,” Digital Scholarship in the Humanities 30.2, 167–182.
  • Eder, M. (2015b) “Taking Stylometry to the Limits: Benchmark Study on 5281 Texts from Patrologia Latina,” Digital Humanities 2015. Sydney. https://dhabstracts.library.cmu.edu/works/2364
  • Eder, M. (2017) “Short Samples in Authorship Attribution: A New Approach,” Digital Humanities 2017. Montreal. https://dh2017.adho.org/abstracts/341/341.pdf
  • Eder, M., Rybicki, J. (2012) “Do Birds of a Feather Really Flock Together, or How to Choose Training Samples for Authorship Attribution,” Literary and Linguistic Computing 28.2, 229–236.
  • Eder, M., Rybicki, J., Kestemont, M. (2016) “Stylometry with R: A Package for Computational Text Analysis,” The R Journal 8.1, 107–121.
  • Evert, S., Proisl, Th., Jannidis, F., Reger, I., Pielström, S., Schöch, Ch., Vitt, Th. (2017) “Understanding and Explaining Delta Measures for Authorship Attribution,” Digital Scholarship in the Humanities 32 (Suppl. 2), ii4–ii16.
  • Hoover, D. L. (2004a) “Delta Prime?” Literary and Linguistic Computing 19.4, 477–495.
  • Hoover, D. L. (2004b) “Testing Burrows’s Delta,” Literary and Linguistic Computing 19.4, 453–475.
  • Jannidis, F., Pielström, S., Schöch, Ch., Vitt, Th. (2015) “Improving Burrows’ Delta. An Empirical Evaluation of Text Distance Measures,” Digital Humanities 2015. Sydney.
  • Koentges, Th. (2020) “The Un-Platonic Menexenus: A Stylometric Analysis with More Data,” Greek, Roman, and Byzantine Studies 60.2, 211–241.
  • Rybicki, J., Eder, M. (2011) “Deeper Delta across Genres and Languages: Do We Really Need the Most Frequent Words?” Literary and Linguistic Computing 26.3, 315–321.
  • Savoy, J. (2020) Machine Learning Methods for Stylometry: Authorship Attribution and Author Profiling. Cham.
  • Schiefsky, M.J. (2005) Hippocrates: On Ancient Medicine. Leiden / Boston.
  • Smith, P. W. H., Aldridge, W. (2011) “Improving Authorship Attribution: Optimizing Burrows’ Delta Method,” Journal of Quantitative Linguistics 18.1, 63–88.
  • Thesleff, H. (2009) Platonic Patterns: A Collection of Studies. Las Vegas / Zurich / Athens.
  • Trevett, J. (2018) “Authenticity, Composition, Publication,” G. Martin (ed.). The Oxford Handbook of Demosthenes. Oxford, 419–430.
  • Vatri, A., McGillivray, B. (2018) “The Diorisis Ancient Greek Corpus: Linguistics and Literature,” Research Data Journal for the Humanities and Social Sciences 3.1, 55–65.
  • Vatri, A., McGillivray, B. (2020) “Lemmatization for Ancient Greek: An Experimental Assessment of the State of the Art”, Journal of Greek Linguistics 20.2, 179–196.
Еще
Статья научная