[sapl-dev] TextIndexNG3 com problemas de acentuação

Leandro Roberto Silva leandroroberto.br em gmail.com
Sexta Junho 12 10:29:46 BRT 2015


Olá...

Já havia falado com alguns do Interlegis na semana do EnGITEC sobre
problemas de pesquisa no catalogo de normas jurídicas

Qdo usavamos o SAPL 2.5 as pesquisas eram feitas corretamente...

depois que migrei para a versão 3.0 não ocorre mais

meus textos integrais são guardados assim...
<http://sapl.camarajatai.go.gov.br/sapl/sapl_documentos/norma_juridica/4637_texto_html>
é esse texto que está indexado e funciona normalmente a busca de palavras
não acentuadas...

*o caso teste... *pesquisa da palavra *gratifica[ção]*

pela palavra *gratifica* retorna 78 documentos que na verdade contém a
palavra gratificação
<http://sapl.camarajatai.go.gov.br/sapl/1?pesquisa=gratifica&mtnm=nm&page=1&step=10&printer=&cod_parlamentar=&tip_materia=&mt_tramitando=&mt_status=&nm_tip_norma=&autostart=on&history=1>

pela palavra *gratificação* não retorna documentos
<http://sapl.camarajatai.go.gov.br/sapl/1?pesquisa=gratifica%C3%A7%C3%A3o&mtnm=nm&page=1&step=10&printer=&cod_parlamentar=&tip_materia=&mt_tramitando=&mt_status=&nm_tip_norma=&autostart=on&history=1>

a função que retorna o dicionário de pesquisa não está no SAPL oficial mas
pode ser vista aqui.
<https://github.com/LeandroRoberto/sapl/blob/master/il/sapl/skins/pysc/busca_materias_normas_pysc.py>

esse código pode ser testado diretamente de dois modos...
1) verificando com a variável debug=1 (linha 135) com a palavra gratifica
<http://sapl.camarajatai.go.gov.br/sapl/pysc/busca_materias_normas_pysc?pesquisa=gratifica&mtnm=nm&page=1&step=10&printer=&cod_parlamentar=&tip_materia=&mt_tramitando=&mt_status=&nm_tip_norma=1&autostart=on&history=1&debug=1>
2) verificando com a variável debug=1
<http://sapl.camarajatai.go.gov.br/sapl/pysc/busca_materias_normas_pysc?pesquisa=gratifica%C3%A7%C3%A3o&mtnm=nm&page=1&step=10&printer=&cod_parlamentar=&tip_materia=&mt_tramitando=&mt_status=&nm_tip_norma=1&autostart=on&history=1&debug=1>(linha
135)
<http://sapl.camarajatai.go.gov.br/sapl/pysc/busca_materias_normas_pysc?pesquisa=gratifica&mtnm=nm&page=1&step=10&printer=&cod_parlamentar=&tip_materia=&mt_tramitando=&mt_status=&nm_tip_norma=1&autostart=on&history=1&debug=1>
com
a palavra gratificação
<http://sapl.camarajatai.go.gov.br/sapl/pysc/busca_materias_normas_pysc?pesquisa=gratifica%C3%A7%C3%A3o&mtnm=nm&page=1&step=10&printer=&cod_parlamentar=&tip_materia=&mt_tramitando=&mt_status=&nm_tip_norma=1&autostart=on&history=1&debug=1>

esse mesmo código funcionava no sapl 2.5 e pode ser visto aqui...
<http://sapl3.camarajatai.go.gov.br/sapl/1?pesquisa=gratifica%C3%A7%C3%A3o&mtnm=nm&page=1&step=10&printer=&cod_parlamentar=&tip_materia=&mt_tramitando=&mt_status=&nm_tip_norma=1&autostart=on&history=1>
(está
com menos resultados pois paramos de alimentar com arquivos de texto
integral...

*como fazer o TextIndexNG3 responder da mesma forma?*

ps: já vi que existe uma implementação mais sofisticada de pesquisa que eu
não conhecia... mas também não está buscando corretamente... feita por esse
código
<https://github.com/LeandroRoberto/sapl/blob/master/il/sapl/skins/pysc/norma_texto_buscar_pysc.py>
que
é código oficial
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.interlegis.gov.br/pipermail/sapl-dev/attachments/20150612/8d5b1be3/attachment.html>


Mais detalhes sobre a lista de discussão SAPL-dev