Построение оптимального спам-фильтра на основе совмещения статистических классификаторов

Автор: Тарасов Вениамин Николаевич, Мезенцева Екатерина Михайловна

Журнал: Инфокоммуникационные технологии @ikt-psuti

Рубрика: Технологии компьютерных систем и сетей

Статья в выпуске: 4 т.11, 2013 года.

Бесплатный доступ

В статье представлены критерии оптимальности для классификации сообщений на основе статистических методов с учетом ошибок первого и второго родов, доли ложных срабатываний и пропущенного спама. Приведены особенности тестирования и об учения спам-фильтра. Предложен подход к организации классификатора, который заключается в совместном использовании методов Байеса и Фишера. Для повышения качества фильтрации предложено использовать механизм анализа подмножеств пере сечения множеств, распознанных обоими методами по категориям (спам - не спам, ложные срабатывания и пропуск спама).

Классификация сообщений, статистические методы, ошибки первого и второго рода, доля пропущенного спама, доля ложных срабатываний, подмножества пересечений, совмещенный фильтр

Короткий адрес: https://sciup.org/140191665

IDR: 140191665

Список литературы Построение оптимального спам-фильтра на основе совмещения статистических классификаторов

  • Мезенцева Е.М., Тарасов В.Н. Защита компьютерных сетей. Веб программирование многомодульного спам-фильтра//Программная инженерия. № 4, 2012. -С. 27-32.
  • Мезенцева Е.М., Тарасов В.Н. Организация защиты компьютерных сетей. Метод многомодульной фильтрации спама на web-сайтах//Информационные технологии. №6, 2012. -С. 18-22.
  • Себестиан Г.С. Процессы принятия решений при распознавании образов. Киев: Техника, 1965. -149 с.
  • Андерсон Т. Введение в многомерный статистический анализ. М.: Физматиз, 1963. -500 с.
Статья научная