Configuración del separador de palabras

La separación de palabras es la división del texto en tokens de texto individuales o palabras. Muchos idiomas, especialmente los que utilizan el alfabeto latino, disponen de una matriz de separadores de palabras (como el espacio en blanco) y signos de puntuación que se usan para diferenciar las palabras, frases y párrafos. Los separadores de palabras deben basarse en una heurística de idioma precisa que proporcione resultados fiables y precisos.

La separación de palabras es más compleja para los sistemas de escritura basados en caracteres o en los alfabetos basados en scripts, donde el significado de los caracteres individuales se determina por el contexto. Un separador de palabras es vital para conseguir una correcta indización de la mayoría de los idiomas asiáticos (por ejemplo, japonés, chino o árabe) y otros idiomas.

Configuración del analizador de idioma

1. Seleccione la ficha Configuración y haga clic en Almacenes de archivoConjunto de orígenes de correo electrónico, metadatos de correo electrónico e índices de búsqueda en GFI Archiver..

2. Seleccione Administración de índices.

3. Configure una de las siguientes opciones de análisis de idioma:

Opción Descripción
Habilitar separador de palabras integrado (recomendado) El analizador de idioma de GFI Archiver está habilitado de forma predeterminada. Para conseguir un rendimiento óptimo de la indización se recomienda encarecidamente no deshabilitarlo.
Habilitar separador de palabras de Microsoft Windows

Seleccione esta opción para deshabilitar el separador de palabras integrado deGFI Archiver y utilizar el separador de palabras de su sistema operativo Windows. Utilice la lista desplegable Idioma predeterminado para especificar el idioma que se utilizará para indizar datos archivados.

NOTA

Si el idioma requerido no aparece en la lista desplegable Idioma predeterminado, agréguelo en la opción Configuración regional del Panel de control de Windows®.

Asimismo, también puede marcar la casilla de verificaciónHabilitar la detección de idioma automática para que Windows detecte el idioma automáticamente.