Funktionsweise der Bayes'schen Analyse

Der Bayes'sche Filter ist eine Anti-Spam-Technologie, die von GFI MailEssentials verwendet wird. Es handelt sich um eine adaptive Technik, die auf Algorithmen aus der Künstlichen Intelligenz basiert, um ein maximales Spektrum an Spam-Technologien abzuwehren.

HINWEIS

1. Der Bayes'sche Anti-Spam-Filter ist standardmäßig deaktiviert. Es wird dringend empfohlen, den Filter zu trainieren, bevor Sie ihn aktivieren.

2. GFI MailEssentials muss mindestens eine Woche lang ausgeführt werden, damit der Bayes'sche Filter seine optimale Leistung erreichen kann. Dies ist erforderlich, da der Bayes'sche Filter erst durch die Anpassung an Ihre E-Mail-Muster eine maximale Erkennungsquote erzielen kann.

Funktionsweise des Bayes'schen Spam-Filters

Die Bayes'sche FilterungEine Anti-Spam-Technik, bei der ein statistischer Wahrscheinlichkeitsindex basierend auf einer Benutzeranalyse zur Erkennung von Spam verwendet wird. basiert auf dem Prinzip, dass die meisten Ereignisse von Bedingungen abhängen und dass die Wahrscheinlichkeit, dass ein Ereignis in Zukunft eintritt, aus den vorherigen Vorkommen dieses Ereignisses abgeleitet werden kann.

HINWEIS

Weitere mathematische Hintergrundinformationen zur Bayes'schen Filtertechnologie finden Sie hier:

http://go.gfi.com/?pageid=ME_BayesianParameterEstimation

Dieses Prinzip wurde von GFI MailEssentials adaptiert, um Spam-E-Mails zu identifizieren und klassifizieren. Wenn ein Textausschnitt häufig in Spam-E-Mails, jedoch nicht in erwünschten E-Mails auftritt, liegt die Vermutung nahe, dass es sich bei der betreffenden E-Mail wahrscheinlich um Spam handelt.

Erstellen einer angepassten Bayes'schen Begriffsdatenbank

Bevor der Bayes'sche Filter verwendet werden kann, muss eine Datenbank mit Wörtern und Tokens (z. B. das $-Zeichen, IP-Adressen, Domänen usw.) erstellt werden. Diese können aus Spam-Beispielen und gültigen E-Mails (auch als „HamZulässige E-Mails“ bezeichnet) erfasst werden.

Danach wird jedem Wort oder Token ein Wahrscheinlichkeitswert zugewiesen. Dieser basiert auf Berechnungen, in die einfließt, wie oft das betreffende Wort in Spam-Nachrichten im Vergleich zu erwünschten Nachrichten vorkommt. Dazu werden ausgehende Benutzer-E-Mails und bekannte Spam-Nachrichten analysiert: Alle Wörter und Tokens in beiden E-Mail-Pools werden analysiert, um bestimmten Wörtern einen Wahrscheinlichkeitswert zuzuweisen, der sie als Spam-typisch klassifiziert.

Dieser Wahrscheinlichkeit wird wie im folgenden Beispiel berechnet:

Beim Wort „Hypothek“, das in 400 von 3.000 Spam-E-Mails und in 5 von 300 erwünschten E-Mails vorkommt, liegt die Spam-Wahrscheinlichkeit bei 0,8889 (d. h. [400/3000] / [5/300 + 400/3000]).

Erstellen einer benutzerdefinierten Ham-Datenbank

Die Bestimmung von Ham-E-Mails erfolgt für die E-Mails des Unternehmens und ist deshalb auf dieses Unternehmen zugeschnitten.

  • Beispiel: Ein Finanzunternehmen verwendet das Wort „Hypothek“ sehr häufig, daher würde die Verwendung allgemein gültiger Anti-Spam-Regeln hier zu vielen falsch-positiven Ergebnissen führen. Nach einer anfänglichen Lernphase und Anpassung an die Unternehmenskorrespondenz berücksichtigt der Bayes'sche Filter jedoch die gültige ausgehende Post des Unternehmens (und erkennt dabei „Hypothek“ als häufig genutzten Begriff in ordnungsgemäßen E-Mails). Auf diese Weise wird eine sehr hohe Spam-Erkennungsrate bei minimaler Fehlalarmrate erzielt.

Erstellen der Bayes'schen Spam-Datenbank

Neben den Ham-E-Mails stützt sich der Bayes'sche Filter auf eine Datei mit Spam-Daten. Diese Spam-Datei muss eine große Menge bekannter Spam-Nachrichten enthalten. Zudem muss sie kontinuierlich von der Anti-Spam-Software mit den neuesten Spam-Nachrichten aktualisiert werden. Hierdurch wird sichergestellt, dass der Bayes'sche Filter auch sämtliche neuen Spam-Trends erkennt und eine hohe Erkennungsrate erzielt.

Wie erfolgt die Bayes'sche Filterung?

Sind die Datenbanken für Ham- und Spam-Nachrichten erstellt, kann der Spam-Wahrscheinlichkeitswert für die einzelnen Wörter berechnet werden, und der Filter ist einsatzbereit.

Trifft eine neue E-Mail ein, wird sie in ihre einzelnen Wörter aufgeschlüsselt, wobei die wichtigsten Wörter (die mit der größten Relevanz für die Klassifizierung von E-Mails als Spam) identifiziert werden. Unter Berücksichtigung dieser Wörter errechnet der Bayes'sche Filter die Wahrscheinlichkeit, ob eine neue Nachricht als Spam eingestuft werden muss. Ist die Wahrscheinlichkeit größer als ein bestimmter Schwellenwert, wird die Nachricht als Spam klassifiziert.

HINWEIS

Weitere Informationen zur Bayes'schen Filterung und ihren Vorteilen finden Sie unter:

http://go.gfi.com/?pageid=ME_Bayesian

Trainieren des Bayes'schen Analysefilters

HINWEIS

Der Bayes'sche Analysefilter kann auch mithilfe von öffentlichen Ordnern trainiert werden. Weitere Informationen finden Sie unter Konfigurieren des Bayes'schen Filters.

Es wird empfohlen, den Bayes'schen Analysefilter anhand der E-Mail-Korrespondenz des Unternehmens über einen gewissen Zeitraum zu trainieren. Es ist auch möglich, die Bayes'sche Analyse mit E-Mails zu trainieren, die vor der Installation von GFI MailEssentials gesendet und empfangen wurden. Dafür kann der Assistent für die Bayes'sche Analyse verwendet werden. Auf diese Weise kann die Bayes'sche Analyse sofort aktiviert werden.

Der Assistent analysiert folgende Quellen:

  • Zulässige E-Mails (z. B. Postfachordner für gesendete Objekte)
  • Spam-E-Mails (z. B. Postfachordner für Spam-E-Mails)

Schritt 1: Assistent für Bayes'sche Analyse installieren

Der Assistent für die Bayes'sche Analyse kann auf folgenden Computern installiert werden:

  • Ein Rechner, der mit Microsoft® Exchange kommuniziert, um E-Mails in einem Postfach zu analysieren
  • Ein Rechner, auf dem Microsoft Outlook installiert ist, um E-Mails in Microsoft Outlook zu analysieren

So installieren Sie den Assistenten für Bayes'sche Analyse:

  1. Kopieren Sie die Setupdatei Bayesian Analysis Wizard.exe auf den ausgewählten Computer. Der Pfad zu dieser Datei lautet: Installationspfad von GFI MailEssentials\AntiSpam\BSW\
  2. Starten Sie Bayesian Analysis Wizard.exe.
  3. Wählen Sie im ersten Bildschirm die Sprache aus, und lesen Sie die Endbenutzer-Lizenzvereinbarung. Klicken Sie auf Weiter.
  4. Wählen Sie den Installationsordner aus, und klicken Sie auf Weiter.
  5. Klicken Sie auf Installieren, um die Installation zu starten.
  6. Klicken Sie auf Fertig stellen, wenn die Installation abgeschlossen ist.

Schritt 2: Zulässige und Spam-E-Mails analysieren

So starten Sie die Analyse von E-Mails mithilfe des Assistenten für die Bayes'sche Analyse:

1. Laden Sie den Assistenten für Bayes'sche Analyse von Start > Programme > GFI MailEssentials > GFI MailEssentials Assistent für Bayes'sche Analyse herunter.

2. Klicken Sie im Willkommensbildschirm auf Weiter.

3. Wählen Sie eine der beiden Möglichkeiten:

  • Eine neue Bayes'sche Spam-Profil-Datei (.bsp) erstellen oder eine vorhandene aktualisieren. Legen Sie den Dateinamen und den Pfad fest, wo die Datei gespeichert werden soll.
  • Das Bayes'sche Spam-Profil aktualisieren, das vom Bayes'schen Analysefilter direkt verwendet wird, wenn er auf demselben Rechner wie GFI MailEssentials installiert wird.

Klicken Sie auf Weiter, um fortzufahren.

4. Wählen Sie aus, wie der Assistent auf zulässige E-Mails zugreifen soll. Wählen Sie:

  • Microsoft Outlook-Profil verwenden, das auf diesem Computer konfiguriert ist: Fragt E-Mails von einem Mail-Ordner in Microsoft Outlook ab. Microsoft Outlook muss ausgeführt werden, um diese Option zu verwenden.
  • Mit Microsoft® Exchange Server-Postfachspeicher verbinden: Fragt E-Mails von einem Microsoft® Exchange-Postfach ab. Geben Sie die Anmeldedaten im nächsten Bildschirm an.
  • Zulässige E-Mails (Ham) nicht im Bayes'schen Spam-Profil aktualisieren: Die Abfrage von zulässigen E-Mails wird übersprungen. Fahren Sie mit Schritt 6 fort.

Klicken Sie zum Fortfahren auf Weiter.

5. Nachdem der Assistent eine Verbindung zur Quelle hergestellt hat, wählen Sie den Ordner aus, der die Liste der zulässigen E-Mails enthält (z. B. Ordner für gesendete Objekte). Klicken Sie anschließend auf Weiter.

6. Wählen Sie aus, wie der Assistent auf die Quelle für Spam-E-Mails zugreifen soll. Wählen Sie:

  • Aktuelles Spam-Profil von der GFI-Website herunterladen: Lädt eine Spam-Profildatei herunter, die regelmäßig durch das Sammeln von Mails von führenden Spam-Archivseiten aktualisiert wird. Es ist eine Internetverbindung erforderlich.
  • Microsoft Outlook-Profil verwenden, das auf diesem Computer konfiguriert ist: Fragt Spam-E-Mails von einem Mail-Ordner von Microsoft Outlook ab. Microsoft Outlook muss ausgeführt werden, um diese Option zu verwenden.
  • Mit Microsoft® Exchange Server-Postfachspeicher verbinden: Fragt Spam-E-Mails von einem Microsoft® Exchange-Postfach ab. Geben Sie die Anmeldedaten im nächsten Bildschirm an.
  • Spam im Bayes'schen Spam-Profil nicht aktualisieren: Überspringt die Abfrage von Spam-E-Mails. Fahren Sie mit Schritt 8 fort.

Klicken Sie zum Fortfahren auf Weiter.

7. Wählen Sie, nachdem sich der Assistent mit der Quelle verbunden hat, den Ordner aus, der die Liste der Spam-E-Mails enthält. Klicken Sie anschließend auf Weiter.

8. Klicken Sie auf Weiter, um die Abfrage der festgelegten Quellen zu starten. Dieser Vorgang kann einige Minuten dauern.

9. Klicken Sie auf Fertig stellen, um den Assistenten zu schließen.

Schritt 3: Bayes'sches Spam-Profil importieren

Wenn der Assistent nicht auf dem Server von GFI MailEssentials läuft, importieren Sie die Bayes'sche Spam-Profil-Datei (.bsp) in GFI MailEssentials.

1. Verschieben Sie die Datei in den Ordner Data im Installationspfad von GFI MailEssentials.

2. Starten Sie die Dienste GFI MailEssentials AS-Scan-Engine und GFI MailEssentials Legacy Attendant neu.