Konfigurieren der Wörtertrennung

Worttrennung ist die Aufspaltung von Texten in einzelne Text-Tokens oder Wörter. Zahlreiche Sprachen, insbesondere die auf dem lateinischen Alphabet aufbauenden, besitzen eine Reihe von Wortbegrenzern (z. B. Leerzeichen) und Satzzeichen, um Wörter, Wortgruppen und Sätze zu trennen. Worttrennzeichen müssen auf präzisen Sprachheuristiken beruhen, um verlässliche und präzise Ergebnisse zu liefern.

Komplexer sieht die Worttrennung bei zeichenbasierten Schriftsystemen oder skriptbasierten Alphabeten aus, bei denen die Bedeutung eines einzelnen Zeichens vom Kontext abhängig ist. Eine „Wörtertrennung“ ist für die korrekte Indizierung bei den meisten asiatischen (z. B. Japanisch, Chinesisch und Arabisch) und anderen Sprachen von elementarer Bedeutung.

Einrichten der Sprachanalyse

1. Wählen Sie die Registerkarte Konfiguration, und klicken Sie auf ArchivspeicherEine Sammlung von E-Mail-Quellen, E-Mail-Metadaten und Suchindizes in GFI MailArchiver..

2. Wählen Sie Indexverwaltung.

3. Konfigurieren Sie eine der folgenden Sprachanalyseoptionen:

Option Beschreibung
Integrierte Wörtertrennung aktivieren (empfohlen) Die GFI Archiver-Sprachanalyse ist standardmäßig aktiviert. Aus Gründen der optimalen Indizierungsleistung wird dringend empfohlen, diese Funktion nicht zu deaktivieren.
Microsoft Windows-Wörtertrennung aktivieren

Wählen Sie diese Option, um die integrierte Wörtertrennung von GFI Archiver zu deaktivieren und die Wörtertrennung Ihres Windows-Betriebssystems zu verwenden. Wählen Sie in der Dropdown-Liste Standardsprache die Sprache aus, die für die Indizierung archivierter Daten verwendet werden soll.

HINWEIS

Wenn die gewünschte Sprache nicht in der Dropdown-Liste Standardsprache enthalten ist, fügen Sie die Sprache über die Ländereinstellungen in der Windows®-Systemsteuerung hinzu.

Aktivieren Sie alternativ das Kontrollkästchen Automatische Spracherkennung aktivieren, damit Windows die Sprache automatisch erkennt.