A separação de palavras consiste na separação de texto em itens e palavras de texto individual. Muitos idiomas, especialmente os do alfabeto romano, têm diversos separadores de palavras (como espaços em branco) e pontuação usados para distinguir palavras, frases e orações. Os separadores de palavras devem confiar em heurísticos de idioma precisos para fornecer resultados precisos e fiáveis.
A separação de palavras é mais complexa para sistemas de escrita baseados em caracteres ou alfabetos baseados em script nos quais o significado dos caracteres individuais é determinado pelo contexto. É essencial usar um separador de palavras para indexar corretamente a maioria dos idiomas asiáticos (como japonês, chinês e árabe) e outros idiomas.
1. Selecione a guia Configuration e clique em Archive Stores.
2. Selecione Index Management.
3. Configure uma das seguintes opções de análise de idioma:
Opção | Descrição |
---|---|
Enable built-in word breaker (recommended) | O analisador de idiomas do GFI Archiver está habilitado por padrão. Para um desempenho de indexação ideal, é recomendável que essa opção não seja desabilitada. |
Enable Microsoft Windows word breaker |
Selecione essa opção para desabilitar o separador de palavras integrado do GFI Archiver e usar o separador de palavras do seu sistema operacional Windows. Use a lista suspensa Default Language para especificar o idioma a ser usado para indexar os dados arquivados. OBS. Se o idioma necessário não estiver listado na lista suspensa Default Language, adicione o idioma necessário a partir da opção de configuração Regional no painel de controle do Windows®. Também é possível marcar a caixa de seleção Enable automatic language detection para permitir que o Windows detecte o idioma automaticamente. |
Você achou estas informações úteis? Envie-nos seus comentários