Cómo funciona el análisis bayesiano

El filtro bayesiano es una tecnología del filtro de correo electrónico no deseado utilizada en GFI MailEssentials. Se trata de una técnica adaptativa basada en algoritmos de inteligencia artificial, con suficiente robustez para soportar la más amplia gama de técnicas de correo electrónico no deseado disponibles en la actualidad.

NOTA

1. El filtro de correo electrónico no deseado bayesiano está desactivado de forma predeterminada. Se recomienda encarecidamente entrenar el filtro bayesiano antes de habilitarlo.

2. GFI MailEssentials debe funcionar al menos durante una semana para que el filtro bayesiano alcance su rendimiento óptimo. Esta medida es necesaria porque el filtro bayesiano consigue la tasa más alta de detección cuando se adapta a los patrones del correo electrónico.

¿Cómo funciona el filtro de correo electrónico no deseado bayesiano?

El filtrado bayesiano se basa en el principio de que la mayoría de los eventos son dependientes y de que la probabilidad de que se produzca un evento en el futuro se puede deducir de las apariciones previas del mismo.

NOTA

Consulte los vínculos de abajo para obtener más información sobre la base matemática del filtro bayesiano:

http://go.gfi.com/?pageid=ME_BayesianParameterEstimation

Esta misma técnica ha sido adaptada por GFI MailEssentials para identificar y clasificar el correo electrónico no deseado. Si un fragmento de texto se repite con frecuencia en mensajes de correo electrónico no deseado, pero no en los correos electrónicos legítimos, sería razonable asumir que, probablemente, este correo electrónico es un correo no deseado.

Creación de una base de datos de palabras bayesianas hecha a medida

Antes de utilizar el filtrado Bayesiano, se debe crear una base de datos con palabras y símbolos (por ejemplo, el signo $, direcciones IP y dominios, etc.). La información se puede recoger de muestras de correo electrónico correo electrónico no deseado y válido.

Un valor de probabilidad se asigna a cada palabra o elemento, lo cual se basa en cálculos que contabilizan la frecuencia con la que una palabra aparece en el correo electrónico no deseado frente a los mensajes válidos. Esto se hace mediante el análisis de correo electrónico saliente de los usuarios y el correo electrónico no deseado conocido: todas las palabras y elementos de ambos grupos de correos electrónicos son analizadas para generar la probabilidad de que una palabra concreta en el correo electrónico haga deducir que sea correo electrónico no deseado.

Esta probabilidad se calcula según este ejemplo:

Si la palabra "hipoteca" aparece en 400 de cada 3.000 mensajes de correo electrónico no deseado y en 5 de 300 correos electrónicos legítimos, su probabilidad de ser correo electrónico no deseado sería 0,8889 (es decir, [400/3000] / [5/300 + 400/3000]).

Creación de una base de datos de correo electrónico válido personalizada

El análisis del correo electrónico legítimo se realiza en el correo electrónico de la compañía y, por tanto, se ajusta a esa compañía concreta.

  • Ejemplo: una institución financiera puede utilizar muchas veces la palabra "hipoteca" y obtendría muchos falsos positivos si utilizase un conjunto de reglas del filtro de correo electrónico no deseado genérico. Por otro lado, el filtro bayesiano, si se adapta a su empresa a través de un periodo de entrenamiento inicial, tomando nota del correo válido saliente de la empresa (y reconoce "hipoteca" como frecuentemente utilizada en mensajes legítimos), tendrá una tasa de detección de correo electrónico no deseado mucho mejor y una tasa mucho más baja de falsos positivos.

Creación de una base de datos de correo electrónico no deseado bayesiano

Además del correo válido, el filtro bayesiano también cuenta con un archivo de datos de correo electrónico no deseado. Este archivo de datos correo electrónico no deseado debe incluir una gran muestra de correo electrónico no deseado conocido. También debe ser constantemente actualizado con lo último en correo electrónico no deseado por el software del filtro de correo electrónico no deseado. Esta medida asegurará que el filtro bayesiano tenga presente las últimas tendencias de correo electrónico no deseado, cuyo resultado es una alta tasa de detección del mismo.

¿Cómo se realiza el filtrado bayesiano?

Una vez que las bases de datos de correo electrónico no deseado y de mensajes válidos se han creado, las probabilidades de la palabra pueden calcularse y el filtro está listo para su uso.

A su llegada, el nuevo correo electrónico se divide en palabras y las más relevantes (las que son más significativas para identificar si el correo es correo electrónico no deseado o no) se identifican. Empleando dichas palabras, el filtro bayesiano calcula la probabilidad de que el nuevo mensaje sea correo electrónico no deseado. Si la probabilidad es mayor que un determinado umbral, el mensaje se clasifica como correo electrónico no deseado.

NOTA

Para obtener más información sobre el filtrado bayesiano y sus ventajas, consulte:

http://go.gfi.com/?pageid=ME_Bayesian

Adaptación del filtro de análisis bayesiano

NOTA

El filtro de análisis bayesiano se puede adaptar empleando las carpetas públicas. Para obtener más información, consulte Configuración del filtro bayesiano.

Se recomienda que el filtro de Análisis bayesiano se adapte al flujo de correo de la organización durante un periodo de tiempo. También es posible que el análisis bayesiano se adapte por medio de los correos electrónicos enviados o recibidos antes de que GFI MailEssentials sea instalado a través del asistente de análisis bayesiano. De esta forma el Análisis bayesiano puede ser habilitado de inmediato.

Este asistente analiza los orígenes de:

  • correo legítimo, por ejemplo, una carpeta de elementos enviados del buzón;
  • mensajes de correo electrónico no deseado, por ejemplo, una carpeta de buzón dedicada a mensajes de correo electrónico no deseado.

Paso 1: Instalación del asistente de análisis bayesiano

El Asistente de análisis bayesiano puede ser instalado en:

  • Un equipo que se comunica con Microsoft® Exchange, con el fin de analizar el correo electrónico en un buzón de correo
  • Un equipo con Microsoft Outlook instalado, con el fin de analizar el correo electrónico en Microsoft Outlook

Para instalar el asistente para análisis bayesiano:

  1. Copie el archivo de instalación Bayesian Analysis Wizard.exe en el equipo elegido. Está ubicado aquí: GFI MailEssentials ruta de instalación\AntiSpam\BSW\
  2. Ejecute Bayesian Analysis Wizard.exe.
  3. En la pantalla inicial, elija el idioma y revise el Acuerdo de licencia de usuario final. Haga clic en Siguiente.
  4. Seleccione la carpeta de la instalación y haga clic en Siguiente.
  5. Haga clic en Instalar para empezar la instalación.
  6. Haga clic en Finalizar cuando la instalación se haya completado.

Paso 2: Análisis de correos electrónicos legítimos y de correo electrónico no deseado

Para iniciar el análisis del correo electrónico utilizando el asistente de análisis bayesiano:

1. Cargue el asistente para análisis bayesiano desde Inicio > Programas > GFI MailEssentials > Asistente para análisis bayesiano GFI MailEssentials.

2. Haga clic en Siguiente en la pantalla de bienvenida.

3. Elija:

  • Crear un nuevo archivo de perfil de correo electrónico no deseado bayesiano (.bsp) o actualizar uno existente. Especifique la ruta donde va a almacenar el archivo y el nombre de este.
  • Actualizar el perfil de correo electrónico no deseado bayesiano utilizado por el filtro de análisis bayesiano directamente si se instala en el mismo equipo que GFI MailEssentials.

Haga clic en Siguiente para continuar.

4. Seleccione la forma en que el asistente tendrá acceso a los mensajes de correo electrónico legítimos. Seleccione:

  • Utilizar el perfil de Microsoft Outlook configurado en este equipo: recupera mensajes de correo electrónico de una carpeta de correo electrónico de Microsoft Outlook. Microsoft Outlook debe estar ejecutándose para utilizar esta opción.
  • Conectar a un almacén de buzones de correo de Microsoft® Exchange Server: recupera el correo electrónico de un buzón de correo de Microsoft® Exchange. Especifique las credenciales de inicio de sesión en la pantalla siguiente.
  • No actualizar el correo legítimo (HAMCorreo electrónico legítimo) en el perfil de correo no deseado bayesiano: omite la recuperación de mensajes de correo electrónico legítimos. Vaya al paso 6.

Haga clic en Siguiente para continuar.

5. Cuando el asistente se conecte al origen, seleccione la carpeta que contiene la lista de correos electrónicos legítimos (por ejemplo, la carpeta Elementos enviados) y haga clic en Siguiente.

Seleccione la forma en que el asistente tendrá acceso al origen de los mensajes de correo electrónico no deseado. Seleccione:

  • Descargar el último perfil de correo no deseado de GFI: Descarga un archivo de perfil de correo electrónico no deseado que se actualiza regularmente mediante la recolección de correo de los principales sitios de archivos de correo electrónico no deseado. Se requiere una conexión a Internet.
  • Utilizar el perfil de Microsoft Outlook configurado en este equipo: recupera el correo electrónico no deseado de una carpeta de correo electrónico de Microsoft Outlook. Microsoft Outlook debe estar ejecutándose para utilizar esta opción.
  • Conectar a un almacén de buzones de correo de Microsoft® Exchange Server: recupera el correo electrónico no deseado de un buzón de correo de Microsoft® Exchange. Especifique las credenciales de inicio de sesión en la pantalla siguiente.
  • No actualizar el correo no deseado en el perfil de correo no deseado bayesiano: omite la recuperación de mensajes de correo electrónico no deseado. Vaya al paso 8.

Haga clic en Siguiente para continuar.

7. Tras conectarse el asistente a la fuente, seleccione la carpeta que contiene la lista de correos electrónicos de correo electrónico no deseado y haga clic en Siguiente.

8. Haga clic en Siguiente para comenzar a recuperar del origen especificado. Este proceso puede tardar varios minutos en completarse.

9. Haga clic en Finalizar para cerrar del asistente.

Paso 3: Importar el perfil de correo electrónico no deseado bayesiano

Cuando el asistente no se ejecuta en el servidor de GFI MailEssentials, importe el archivo del perfil de correo electrónico no deseado bayesiano (.bsp) a GFI MailEssentials.

1. Mueva el archivo a la carpeta Data en la ruta de la instalación de GFI MailEssentials.

2. Reinicie los servicios GFI MailEssentials AS Scan Engine y Legacy Attendant de GFI MailEssentials.