Configurazione del word breaker

“Word Breaking” significa spezzare il testo in token o parole di testo singole. Molte lingue, specialmente quelle con alfabeti romani, dispongono di una matrice di separatori di parola (come lo spazio bianco) e di punteggiatura utilizzati per distinguere parole, frasi ed espressioni. I word breaker devono affidarsi all’euristica linguistica più precisa per fornire risultati affidabili e precisi.

Il word breaking è più complesso per i sistemi di scrittura basati su caratteri o gli alfabeti basati su script, dove il significato dei singoli caratteri è determinato dal contesto. Un word breaker è essenziale per indicizzare correttamente la maggior parte delle lingue asiatiche (ad esempio, giapponese, cinese e arabo) e altre lingue.

Configurazione dell’analizzatore della lingua

1. Selezionare la scheda Configuration e fare clic su Magazzini archiviRaccolta di origini e metadati di posta elettronica e indici di ricerca in GFI Archiver..

2. Selezionare Gestione indice.

3. Configurare una delle seguenti opzioni di analisi delle lingue:

Opzione Descrizione
Abilita word breaker integrato (consigliato) L’analizzatore della lingua di GFI Archiver è abilitato per impostazione predefinita. Al fine di ottenere prestazioni di indicizzazione ottimali, si consiglia di non disabilitarlo.
Abilita word breaker di Microsoft Windows

Selezionare questa opzione per disabilitare il word breaker integrato (GFI Archiver) e utilizzare il word breaker del proprio sistema operativo Windows. Utilizzare l'elenco a discesa Lingua predefinita per specificare la lingua da utilizzare per indicizzare i dati archiviati.

NOTA

Se la lingua necessaria non è presente nell’elenco a discesa Lingua predefinita, aggiungere la lingua necessaria dall’opzione Impostazioni internazionali del pannello di controllo di Windows®.

In alternativa, spuntare la casella di controllo Abilita rilevamento automatico lingua per consentire a Windows di rilevare la lingua automaticamente.