Configurazione del word breaker
“Word Breaking” significa spezzare il testo in token o parole di testo singole. Molte lingue, specialmente quelle con alfabeti romani, dispongono di una matrice di separatori di parola (come lo spazio bianco) e di punteggiatura utilizzati per distinguere parole, frasi ed espressioni. I word breaker devono affidarsi all’euristica linguistica più precisa per fornire risultati affidabili e precisi.
Il word breaking è più complesso per i sistemi di scrittura basati su caratteri o gli alfabeti basati su script, dove il significato dei singoli caratteri è determinato dal contesto. Un word breaker è essenziale per indicizzare correttamente la maggior parte delle lingue asiatiche (ad esempio, giapponese, cinese e arabo) e altre lingue.
Configurazione dell’analizzatore della lingua
1. Selezionare la scheda Configuration e fare clic su Magazzini archiviRaccolta di origini e metadati di posta elettronica e indici di ricerca in GFI Archiver..
2. Selezionare Gestione indice.
3. Configurare una delle seguenti opzioni di analisi delle lingue:
Opzione | Descrizione |
---|---|
Abilita word breaker integrato (consigliato) | L’analizzatore della lingua di GFI Archiver è abilitato per impostazione predefinita. Al fine di ottenere prestazioni di indicizzazione ottimali, si consiglia di non disabilitarlo. |
Abilita word breaker di Microsoft Windows |
Selezionare questa opzione per disabilitare il word breaker integrato (GFI Archiver) e utilizzare il word breaker del proprio sistema operativo Windows. Utilizzare l'elenco a discesa Lingua predefinita per specificare la lingua da utilizzare per indicizzare i dati archiviati. NOTA Se la lingua necessaria non è presente nell’elenco a discesa Lingua predefinita, aggiungere la lingua necessaria dall’opzione Impostazioni internazionali del pannello di controllo di Windows®. In alternativa, spuntare la casella di controllo Abilita rilevamento automatico lingua per consentire a Windows di rilevare la lingua automaticamente.
|