Построение оптимального спам-фильтра на основе совмещения статистических классификаторов
Автор: Тарасов Вениамин Николаевич, Мезенцева Екатерина Михайловна
Журнал: Инфокоммуникационные технологии @ikt-psuti
Рубрика: Технологии компьютерных систем и сетей
Статья в выпуске: 4 т.11, 2013 года.
Бесплатный доступ
В статье представлены критерии оптимальности для классификации сообщений на основе статистических методов с учетом ошибок первого и второго родов, доли ложных срабатываний и пропущенного спама. Приведены особенности тестирования и об учения спам-фильтра. Предложен подход к организации классификатора, который заключается в совместном использовании методов Байеса и Фишера. Для повышения качества фильтрации предложено использовать механизм анализа подмножеств пере сечения множеств, распознанных обоими методами по категориям (спам - не спам, ложные срабатывания и пропуск спама).
Классификация сообщений, статистические методы, ошибки первого и второго рода, доля пропущенного спама, доля ложных срабатываний, подмножества пересечений, совмещенный фильтр
Короткий адрес: https://sciup.org/140191665
IDR: 140191665
Список литературы Построение оптимального спам-фильтра на основе совмещения статистических классификаторов
- Мезенцева Е.М., Тарасов В.Н. Защита компьютерных сетей. Веб программирование многомодульного спам-фильтра//Программная инженерия. № 4, 2012. -С. 27-32.
- Мезенцева Е.М., Тарасов В.Н. Организация защиты компьютерных сетей. Метод многомодульной фильтрации спама на web-сайтах//Информационные технологии. №6, 2012. -С. 18-22.
- Себестиан Г.С. Процессы принятия решений при распознавании образов. Киев: Техника, 1965. -149 с.
- Андерсон Т. Введение в многомерный статистический анализ. М.: Физматиз, 1963. -500 с.