Использование теории множеств в сравнительно-логических методах выделения текстов на исламскую тематику в процессе мониторинга сетевых ресурсов

Бесплатный доступ

Выделение текстов исламского содержания в сетевых ресурсах может проводиться с помощью сравнительно-логических методов «проверка на вхождение» и «пересечение множеств». Для какого-либо языка предварительно собирается корпус прецедентных текстов на исламскую тематику. Из этого корпуса при помощи статистических методов извлекается множество ключевых понятий. Список выделенных ключевых слов представляется в виде множества. Сформированное множество ключевых понятий может быть представлено в виде базы данных и в дальнейшем используется в качестве эталонного множества А. Тексты, представляющие интерес для экспертизы, представляются в виде множества понятий Б. Множество А сравнивается с множеством А на предмет пересечения. Наличие в множестве Б элементов множества А, характер и степень пересечения двух множеств позволяет идентифицировать текст, представляющий интерес для экспертизы. Язык программирования Python предоставляет широкие возможности для работы со строками, кортежами, словарями и множествами. В процессе мониторинга сетевых ресурсов и поиска текстов на исламскую тематику необходимо использовать методы, изложенные в статье, а также базы данных с эталонными списками ключевых слов.

Еще

Информационный экстремизм, судебная лингвистическая экспертиза, сетевые ресурсы, мониторинг сетевых ресурсов, сравнительно-статистические методы, язык python, множества, лингвистические ресурсы, прецедентные тексты, ислам

Короткий адрес: https://sciup.org/147154017

IDR: 147154017   |   DOI: 10.14529/ling160304

Список литературы Использование теории множеств в сравнительно-логических методах выделения текстов на исламскую тематику в процессе мониторинга сетевых ресурсов

  • Жукова, О.С. Информационный экстремизм как угроза безопасности Российской Федерации/О.С. Жукова//Вестник Воронежского института МВД России. -2007. -Т. 1.
  • Кокорев, В.Г. Понятие и признаки религиозного экстремизма/В.Г. Кокорев//Социально-экономические явления и процессы. -2014. -Т. 5.
  • Шибаев, М.В. Манипулятивное использование прецедентных текстов в религиозном дискурсе/М.В. Шибаев//Вестник Красноярского государственного педагогического университета им. В.П. Астафьева. -2013. -Т. 3.
  • Прохоренок, Н. Python 3. Самое необходимое/Н. Прохоренок. -БХВ-Петербург, 2016.
  • Караулов, Ю.Н. Русский язык и языковая личность/Ю.Н. Караулов, Д.Н. Шмелев. -М.: Наука, 1987.
  • Бобырева, Е.В. Прецедентные высказывания религиозного дискурса/Е.В. Бобырева//Известия Волгоградского государственного педагогического университета. -2007. -Т. 2.
  • Chiarcos, C. Towards Open Data for Linguistics: Linguistic Linked Data/C. Chiarcos//New Trends of Research in Ontologies and Lexical Resources. -2013. -P. 7-25.
  • Мишанкина, Н.А. Базы данных в лингвистических исследованиях/Н.А. Мишанкина//Вопросы лексикографии. -2013. -Т. 1 (3).
  • Мишанкина, Н.А. Технология баз данных в социогуманитарных исследованиях/Н.А. Мишанкина//Гуманитарная информатика. -2012. -Т. 6.
  • Мишланов, В.А. Диалогичность церковно-религиозных текстов/В.А. Мишланов, В.А. Салимовский//Вестн. Перм. ун-та. -2010. -Т. 6, № 12. -С. 24-28.
  • Мишланов, В.А. Этнический экстремизм в массовой коммуникации с точки зрения проблем судебной лингвистической экспертизы/В.А. Мишланов, В.А. Салимовский//Вестн. Перм. ун-та. -2013. -Т. 4, № 24. -С. 63-75.
  • Saad, M. OSAC: Open Source Arabic Corpora/M. Saad, W. Ashour//6th International Conference on Electrical and Computer Systems (EECS’10), Nov 25-26, 2010, Lefke, Cyprus. 2010. -P. 118-123.
  • Фаткулин, Б.Г. Использование лингвистически ориентированных модулей на языке python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK)/Б.Г. Фаткулин//Вестник ЮУрГУ. Серия «Лингвистика». -2015. -Т. 12, № 1. -С. 72-75.
Еще
Статья научная