Методы обнаружения писем-трансформеров
Автор: Ермакова Лиана Магдановна
Журнал: Вестник Пермского университета. Серия: Математика. Механика. Информатика @vestnik-psu-mmi
Рубрика: Информатика. Информационные системы
Статья в выпуске: 2 (6), 2011 года.
Бесплатный доступ
Проведен анализ сообщений-трансформеров. Предложены методы детектирования писем-трансформеров, устойчивые к небольшим изменениям текста и темы сообщения. Особо рассматривается проблема обнаружения намеренно искаженных фрагментов. Достоинством контентного подхода является его универсальность, так как он не опирается на служебную информацию и применим к классификации документов не только в электронной почте, но и в системах мгновенного обмена сообщениями, блогах, форумах, социальных сетях.
Спам, корпусная лингвистика, фишинг, фильтрация, категоризация текстов
Короткий адрес: https://sciup.org/14729726
IDR: 14729726
Список литературы Методы обнаружения писем-трансформеров
- Яндекс. Некоторые автоматические методы детектирования спама, доступные боль-шим почтовым системам//Компания Яндекс, 2010. URL: http://company.yandex.ru/public/articles/antispam.xml.
- Лаборатория Касперского. Что такое спам//Securelist, 2010. URL: http://www.securelist.com/ru/encyclopedia/spam?chapter=151.
- Наместникова М. Спам в декабре 2010 года//Securelist. 2011. URL: http://www.securelist.com/ru/analysis/208050676/Spam_v_dekabre_2010_goda.
- Лаборатория Касперского. Спам в первом квартале 2010 года//Лаборатория Касперского. 2010. URL: http://www.kaspersky.ru/news?id=207733226
- Электронный журнал "Спамтест" № 29//Лаборатория Касперского. 2003. URL: http://www.kaspersky.ru/news?id=144772578
- Лаборатория Касперского. Эволюция спама//Securelist. 2009. URL: http://www.securelist.com/ru/encyclopedia/spam?chapter=155.
- Сегалович И., Тейблюм Д., Дилевский А. Принципы и технические методы работы с незапрашиваемой корреспонденцией//Яндекс. 2010. URL: http://download.yandex.ru/company/spamooborona-latest.pdf.
- Лаборатория Касперского Электронный журнал "Спамтест". 2009. URL: http://www.kaspersky.ru/news?id=143937135
- Manber U. Finding similar files in a large file system//USENIX Conference. 1994.
- Broder A. On the resemblance and contain-ment of documents//Digital Systems Research Center. 2003. URL: http://ftp.digital.com/pub/Digital/SRC/publications/broder/positano-final-wpnums.pdf.
- Львов А.А. Обнаружение массовых рассылок электронной почты//Math-Net.Ru. 2004. URL: http://www.mathnet.ru/links/ab1f0c1f87f3371bf5990d535a6fd32b/mmkz129.pdf
- Chakrabarti S. Mining the Web: Discovering Knowledge from Hypertext Data, 2003.
- Coulthard M. Author Identification, Idiolect and Linguistic Uniqueness. 2004.
- Halteren H. Linguistic Profiling for Author Recognition and Verification//Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics, 2004.
- Сотник С.Л. Идентификация языка UNI-CODE-текста по N-граммам длиной до 4-х включительно (квадрограммам)//Мате-матичне моделювання. 2006. С.111-114.
- Cavnar W.B., Trenkle J.M. N-Gram-Based Text Categorization//Proceedings of Third Annual Symposium on Document Analysis and Information Retrieval. 1994. С.161-175.
- Мещеряков Р.В., Васюков Н.С. Иденти-фикация авторства методами искусствен-ного интеллекта//Научная сессия ТУСУР, 2005.
- Фоменко В.П., Фоменко Т.Г. Авторский инва-риант русских литературных текстов//Методы качественного анализа текстов. 1983.
- Рахимова А.А. Лингвистическая экспер-тиза//Вестник КАСУ. 2005.
- Галяшина Е.И. Основы судебного речеве-дения. 2003.