Методы обнаружения писем-трансформеров

Бесплатный доступ

Проведен анализ сообщений-трансформеров. Предложены методы детектирования писем-трансформеров, устойчивые к небольшим изменениям текста и темы сообщения. Особо рассматривается проблема обнаружения намеренно искаженных фрагментов. Достоинством контентного подхода является его универсальность, так как он не опирается на служебную информацию и применим к классификации документов не только в электронной почте, но и в системах мгновенного обмена сообщениями, блогах, форумах, социальных сетях.

Спам, корпусная лингвистика, фишинг, фильтрация, категоризация текстов

Короткий адрес: https://sciup.org/14729726

IDR: 14729726

Список литературы Методы обнаружения писем-трансформеров

  • Яндекс. Некоторые автоматические методы детектирования спама, доступные боль-шим почтовым системам//Компания Яндекс, 2010. URL: http://company.yandex.ru/public/articles/antispam.xml.
  • Лаборатория Касперского. Что такое спам//Securelist, 2010. URL: http://www.securelist.com/ru/encyclopedia/spam?chapter=151.
  • Наместникова М. Спам в декабре 2010 года//Securelist. 2011. URL: http://www.securelist.com/ru/analysis/208050676/Spam_v_dekabre_2010_goda.
  • Лаборатория Касперского. Спам в первом квартале 2010 года//Лаборатория Касперского. 2010. URL: http://www.kaspersky.ru/news?id=207733226
  • Электронный журнал "Спамтест" № 29//Лаборатория Касперского. 2003. URL: http://www.kaspersky.ru/news?id=144772578
  • Лаборатория Касперского. Эволюция спама//Securelist. 2009. URL: http://www.securelist.com/ru/encyclopedia/spam?chapter=155.
  • Сегалович И., Тейблюм Д., Дилевский А. Принципы и технические методы работы с незапрашиваемой корреспонденцией//Яндекс. 2010. URL: http://download.yandex.ru/company/spamooborona-latest.pdf.
  • Лаборатория Касперского Электронный журнал "Спамтест". 2009. URL: http://www.kaspersky.ru/news?id=143937135
  • Manber U. Finding similar files in a large file system//USENIX Conference. 1994.
  • Broder A. On the resemblance and contain-ment of documents//Digital Systems Research Center. 2003. URL: http://ftp.digital.com/pub/Digital/SRC/publications/broder/positano-final-wpnums.pdf.
  • Львов А.А. Обнаружение массовых рассылок электронной почты//Math-Net.Ru. 2004. URL: http://www.mathnet.ru/links/ab1f0c1f87f3371bf5990d535a6fd32b/mmkz129.pdf
  • Chakrabarti S. Mining the Web: Discovering Knowledge from Hypertext Data, 2003.
  • Coulthard M. Author Identification, Idiolect and Linguistic Uniqueness. 2004.
  • Halteren H. Linguistic Profiling for Author Recognition and Verification//Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics, 2004.
  • Сотник С.Л. Идентификация языка UNI-CODE-текста по N-граммам длиной до 4-х включительно (квадрограммам)//Мате-матичне моделювання. 2006. С.111-114.
  • Cavnar W.B., Trenkle J.M. N-Gram-Based Text Categorization//Proceedings of Third Annual Symposium on Document Analysis and Information Retrieval. 1994. С.161-175.
  • Мещеряков Р.В., Васюков Н.С. Иденти-фикация авторства методами искусствен-ного интеллекта//Научная сессия ТУСУР, 2005.
  • Фоменко В.П., Фоменко Т.Г. Авторский инва-риант русских литературных текстов//Методы качественного анализа текстов. 1983.
  • Рахимова А.А. Лингвистическая экспер-тиза//Вестник КАСУ. 2005.
  • Галяшина Е.И. Основы судебного речеве-дения. 2003.
Еще
Статья научная