Термины → Байесовская фильтрация спама

Байесовская фильтрация спама является эффективным методом фильтрации электронной почты, который применяется в большинстве программных продуктов для защиты от спама. Этот метод позволяет идентифицировать нежелательные сообщения с высокой точностью и может настраиваться для каждого пользователя отдельно.

Работа метода основана на описанных далее принципах. На первом этапе происходит процесс обучения. Пользователь вручную помечает достаточное количество сообщений как нормальные или спам (обычно 200 и 200). Фильтр анализирует обе категории и узнает, например, что в спаме часто содержатся слова «Ролекс» или «Виагра», тогда как нормальные сообщения отправляются членами семьи или корреспондентами из адресной книги пользователя. После обработки достаточного количества сообщений байесовский фильтр может присвоить каждому сообщению определенный «индекс спама», показывающий, является ли данное сообщение спамом.

Основным преимуществом байесовского фильтра является гибкость. Например, если пользователь по профессии биолог, всем входящим сообщениям, содержимое которых может быть отнесено к биологии и другим близким сферам знаний, обычно будет присвоен более низкий индекс вероятности. Если сообщение содержит слова, которые обычно позволяют классифицировать его как нежелательное, но при этом оно было отправлено корреспондентом из адресной книги пользователя, оно будет помечено как нормальное. Это происходит потому, что наличие отправителя в адресной книге уменьшает общую вероятность спама.

Информация

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.