Принцип работы байесовского анализа
Байесовский фильтр — это адаптируемая технология защиты от спама, используемая в приложении GFI MailEssentials. Она работает на основе алгоритмов искусственного интеллекта с повышенной надежностью, которые позволяют отражать широкий ряд спам-атак, существующих на сегодняшний день.
ПРИМЕЧАНИЕ
1. По умолчанию, байесовский спам-фильтр отключен. До включения этого фильтра настоятельно рекомендуется его «обучить».
2. Приложение GFI MailEssentials должно проработать хотя бы неделю, чтобы байесовский фильтр достиг своей оптимальной эффективности. Это нужно сделать, поскольку байесовский фильтр приобретает наивысшую эффективность распознавания спама только после адаптации к работе почты.
Как работает байесовский спам-фильтр?
Байесовская фильтрацияМеханизм для защиты от спама, в котором для определения спама используется индекс статистической вероятности, основанный на его «обучении» пользователями. основана на том принципе, что большинство событий связаны, и что на основе предыдущих событий можно сделать предположение о возможности происхождения такого же события в будущем.
ПРИМЕЧАНИЕ
Чтобы узнать более подробную информацию о математическом обосновании байесовской фильтрации, нажмите ссылки ниже:
Эта же техника адаптирована приложением GFI MailEssentials для определения и классификации спама. Если определенная часть текста часто встречается в спам-сообщениях, но никогда не встречается в надежных сообщениях, будет разумно предположить, что сообщение с таким текстом, возможно, является спамом.
Создание пользовательской базы слов для байесовской фильтрации
До использования байесовской фильтрации необходимо создать базу данных со словами и знаками (например, знак $, IP-адреса и домены и т.д.). В нее можно внести слова и знаки, содержащиеся в шаблоне спам-сообщения или допустимого сообщения.
Для каждого слова или знака присваивается значение вероятности, которое устанавливается, исходя из подсчета количества появлений такого слова или знака в спам-сообщениях по сравнению с количеством его появлений в допустимых сообщениях. Для этого выполняется анализ исходящей почты пользователя и известного спама — анализируются все слова и знаки, содержащиеся в этих сообщениях, и на основе этого анализа формируется вероятность, по которой сообщение, содержащее данное слово, является спамом.
Эта вероятность рассчитывается на следующем примере.
Если слово «ипотека» встречается в 400 из 3000 спам-сообщений и в 5 из 300 надежных сообщений, то значение его вероятности — 0,8889 (т.е. [400/3000] / [5/300 + 400/3000]).
Создание пользовательской базы данных допустимых сообщений
Анализ выполняется в разрешенных почтовых сообщениях определенной компании, и поэтому его результат подойдет именно для этой компании.
- Пример: В финансовом учреждении слово «ипотека» может использоваться множество раз и поэтому при использовании набора правил для защиты от спама возможно большое количество сообщений, занесенных в спам по ошибке. С другой стороны, байесовский фильтр, если он первоначально прошел «обучение», принимает во внимание содержание допустимых исходящих сообщений компании (и определяет, что слово «ипотека» часто используется в надежных сообщениях), поэтому его процент распознавания спама гораздо выше, а процент занесения надежных сообщений в спам по ошибке гораздо ниже.
Создание базы данных спама байесовского фильтра
Помимо допустимых сообщений, байесовский фильтр сверяется с файлом базы данных спама. Этот файл базы данных спама должен включать большую выборку известного спама. Кроме того, его необходимо постоянно обновлять, добавляя новый спам с помощью ПО для защиты от спама. Благодаря этому байесовский фильтр будет всегда «в курсе» последних спам-тенденций и сможет обеспечить высокий процент распознавания спама.
Как осуществляется байесовская фильтрация?
После создания баз данных допустимых и спам-сообщений можно подсчитать значения вероятности содержания слов, и затем фильтр будет готов к работе.
Как только в фильтр поступает новое сообщение, оно разбивается на слова, самые важные из которых (слова, которые имеют наиболее важное значение для занесения сообщения в спам или Удаленные командыИнструкции, с помощью которых выполняются удаленные задачи.) затем проходят идентификацию. С помощью этих слов байесовский фильтр подсчитывает спам-вероятность нового сообщения. Если эта вероятность больше порогового значения, сообщение классифицируется как спам.
ПРИМЕЧАНИЕ
Более подробная информация о байесовской фильтрации и ее преимуществах приведена здесь:
«Обучение» фильтра байесовского анализа
ПРИМЕЧАНИЕ
«Обучение» фильтра байесовского анализа можно провести на основе общих папок. Для получения подробной информации см. раздел Настройка байесовского фильтра.
Рекомендуется через некоторое время подвергнуть фильтр байесовского анализа подготовке к потоку сообщений организации. Также можно «обучить» фильтр байесовского анализа с помощью сообщений, отправленных или полученных до установки GFI MailEssentials, используя мастер байесовского анализа. Это позволяет включить байесовский анализ немедленно.
Данный мастер анализирует источники:
- надежной почты — например, папку отправленных сообщений почтового ящика
- спама — например, папку почтового ящика для спам-сообщений.
Шаг 1: Установка мастера байесовского анализа
Мастер байесовского анализа можно установить на:
- компьютере, который взаимодействует с Microsoft ® Exchange — для анализа почты в почтовом ящике
- компьютере, на котором установлено приложение Microsoft Outlook — для анализа почты в приложении Microsoft Outlook
Установка Bayesian Analysis Wizard:
- Скопируйте файл установки Bayesian Analysis Wizard.exe на выбранный компьютер. Файл находится в папке: GFI MailEssentials путь установки\AntiSpam\BSW\
- Запустите Bayesian Analysis Wizard.exe.
- В начальном окне выберите язык и просмотрите «Лицензионное соглашение с конечным пользователем». Нажмите Далее.
- Выберите место для установки и нажмите Далее.
- Нажмите Установить для запуска установки.
- По завершении установки нажмите Готово.
Шаг 2: Анализ надежной почты и спама
Чтобы запустить анализ почты с помощью мастера байесовского анализа:
1. Откройте мастер байесовского анализа, нажав Пуск > Программы > GFI MailEssentials > Мастер байесовского анализа GFI MailEssentials.
2. В окне приветствия нажмите Далее.
3. Выберите нужное действие:
- Создать новый файл байесовского спам-профиля (.bsp) или обновить имеющийся файл. Укажите путь для хранения файла и имя файла.
- Обновить байесовский спам-профиль, используемый фильтром байесовского анализа, непосредственно при установке на компьютер, на котором установлено приложение GFI MailEssentials.
Чтобы продолжить, нажмите Далее.
4. Выберите способ доступа мастера к надежным сообщениям. Выберите:
- Использовать имеющийся на этой машине профиль Microsoft Outlook — извлечение почты из папки Microsoft Outlook. Для использования этой функции необходимо запустить приложение Microsoft Outlook.
- Подключиться к почтовому хранилищу сервера Microsoft ® Exchange — извлечение почты из почтового ящика Microsoft ® Exchange. В следующем окне укажите имя для входа и пароль.
- Не обновлять допустимую почту в байесовском спам-профиле — допустимая почта извлекаться не будет. Перейдите к шагу 6.
Чтобы продолжить, нажмите Далее.
5. После того, как мастер подключится к источнику, выберите папку, содержащую список надежных сообщений (например, папку «Отправленные») и нажмите Далее.
6. Выберите способ доступа мастера к источнику спам-сообщений. Выберите:
- Загрузить последний спам-профиль с веб-сайта GFI — загрузка файла спам-профиля, который регулярно обновляется путем сбора почты с лидирующих сайтов архивации спама. Необходимо подключение к Интернету.
- Использовать имеющийся на этой машине профиль Microsoft Outlook — извлечение спама из папки Microsoft Outlook. Для использования этой функции необходимо запустить приложение Microsoft Outlook.
- Подключиться к почтовому хранилищу сервера Microsoft ® Exchange — извлечение спама из почтового ящика Microsoft ® Exchange. В следующем окне укажите имя для входа и пароль.
- Не обновлять спам в байесовском спам-профиле — спам-сообщения извлекаться не будут. Перейдите к шагу 8.
Чтобы продолжить, нажмите Далее.
7. После того, как мастер подключится к источнику, выберите папку, содержащую список спам-сообщений, и нажмите Далее.
8. Чтобы начать извлечение указанных источников, нажмите Далее. Обработка может занять несколько минут.
9. Для того, чтобы закрыть мастер, нажмите Готово.
Шаг 3: Импорт байесовского спам-профиля
Если мастер на сервере GFI MailEssentials не запущен, импортируйте файл байесовского спам-профиля (.bsp) в приложение GFI MailEssentials.
1. Переместите файл в папку Data в директории установки GFI MailEssentials.
2. Перезапустите службы GFI MailEssentials AS Scan Engine и GFI MailEssentials Legacy Attendant.