[Gitec] Scaneamento de Leis - Era: leis

Ivan Lucio Garcia cpd at cma.pr.gov.br
Mon Dec 5 12:21:14 BRST 2005


Paulo,
ja estou mandando ver nas leis.. o ano de 1998 ja esta todo scaneado e no
sistema. CONFIRA:
http://201.15.240.42:8080/sapl/generico/norma_juridica_pesquisar_proc?inclui
r=0&lst_tip_norma=&txt_numero=&txt_ano=1998&txt_assunto=&btn_norma_pesquisar
=Pesquisar


Estou usando um programa que vem junto com o SCANNER HP 5590 Readris PRO 8
Nao posso baixar a resolução pra menos de 200 dpi porque a norma.PDF poderá
ser impressa. Elas parecem ser imagem mas na verdade é texto, pois consigo
fazer pesquisa textual nela..

Mas ta dando tudo certo..
abraços
Ivan
CMApucarana.pr




----- Original Message -----
From: "paulofernandes" <paulofernandes at interlegis.gov.br>
To: "Grupo de Trabalho Interlegis de Tecnologia"
<gitec at listas.interlegis.gov.br>
Sent: Monday, December 05, 2005 9:40 AM
Subject: Re: [Gitec] Scaneamento de Leis - Era: leis


Portal COLAB, o ponto de encontro da Comunidade de Desenvolvimento do
Interlegis.
http://genesis.interlegis.gov.br

____________________________________________________________________________
___


----------------------------------------------------------------------------
----


Ivan,

  Que programa você está usando para digitalizar os documentos?

[]s,

Paulo Fernandes
Programa Interlegis
Brasília - DF.


Em Qua, 2005-11-30 às 12:24 -0200, Ivan Lucio Garcia escreveu:
> Portal COLAB, o ponto de encontro da Comunidade de Desenvolvimento do
> Interlegis.
> http://genesis.interlegis.gov.br
>
>
____________________________________________________________________________
___
> Caros companheiros... (lula..)
> Ciciliati.. Luciano ..André .. Marcio ... ... ...
>
> Veja bem.. de 1999 ate 2005.. tenho as leis na integra todas em HTML com
> arquivos de tamanho 15k
> Instalei esse scanner para colocar as lei anteriores no sistema..
> O scanner ja salva em PDF e parecer ser imagem. Mas acho q é isso mesmo q
o
> ciciliati falou (uma versão "OCR-zada", ) pois ja fiz alguns teste e
> realmente o sistema ta fazendo a pesquisa textual. veja:
>
http://201.15.240.42:8080/sapl/documentos/norma_juridica/738_texto_integral
> Esse é o link da lei 61/98 que scaniei agora para texte.. nela possui a
> palavra "água" e essa palavra nao esta na sumula e se efetuar uma pesquisa
> textual pela palavra "água" o sistema vai retornar varias leis e a lei
> 61/1998 estará la no meio.. Isso quer dizer o q o ciciliati falou..
>
> Este outro link é para pesquisa:
>
http://201.15.240.42:8080/sapl/generico/norma_juridica_pesquisar_form?inclui
> r=0
>
> Agora
> Meu maior problema sera mesmo com o tamanho do arquivo. pois quando estava
> fazendo em HTM tava dando 15k agora ta indo pra 250k.  Para as leis de uma
> pagina acho q nao teria problema..O problema maior sera para leis de 80
> paginas conforme o Luciano falou. Quanto ao meu servidor acho que ele
> suporta.. pois temos uma media de 2.000 leis... acho que não daria nem 1
> giga..
>
> Senão to pensando em scanear elas todas em TEXTO e salvar em HTM... mas em
> texto ela perde um pouco ai teria que tar fazendo uma correção.. mais
> trabalho né....
>
> Grato
> Ivan
> C.M.Apucarana - Pr.
>
>
>
>
>
> ----- Original Message -----
> From: "Fernando Ciciliati Jr." <fernandociciliati at interlegis.gov.br>
> To: "Grupo de Trabalho Interlegis de Tecnologia"
> <gitec at listas.interlegis.gov.br>
> Sent: Wednesday, November 30, 2005 10:50 AM
> Subject: [Gitec] Scaneamento de Leis - Era: leis
>
>
> Portal COLAB, o ponto de encontro da Comunidade de Desenvolvimento do
> Interlegis.
> http://genesis.interlegis.gov.br
>
>
____________________________________________________________________________
> ___
> Caro Ivan,
>
>        Os arquivos PDF têm a capacidade de armazenar textos e imagens.
> Normalmente
> em um processo de "scaneamento" o resultado é uma "fotografia" do texto,
> sendo
> tratada, portanto, como imagem. Isso impediria a busca textual no SAPL.
>
>        Você poderia me mandar um arquivo PDF gerado dessa forma só para
> que eu
> possa dar uma avaliada?
>
>        Acredito que o programa de digitalização esteja armazenando junto
> com a imagem
> uma versão "OCR-zada", o que pode permitir a pesquisa textual no SAPL,
> mas com qualidade
> questionável, pois os programas de OCR têm uma taxa de acerto no
> reconhecimento
> geralmente entre 99% e 99,5%, o que daria de 5 a 10 erros a cada 1000
> caracteres.
>
>        Independentemente dessa questão, é importante considerar o que o
> pessoal tem
> apontado na lista a respeito do tamanho do arquivo. O Zope suportará
> tranquilamente
> uma base grande, mas o seu servidor terá que ser bem dimensionado com
> relação a
> memória e a espaço em disco.
>
> []s,
> Ciciliati.
>
>
> -----------------------------------------------
> Fernando Ciciliati
> INTERLEGIS - Senado Federal
> fernandociciliati at interlegis.gov.br
>
> Ivan Lucio Garcia wrote:
>
> >Portal COLAB, o ponto de encontro da Comunidade de Desenvolvimento do
> >Interlegis.
> >http://genesis.interlegis.gov.br
> >
>
>___________________________________________________________________________
> ____
> >
> >
> > ------------------------------------------------------------------------
> >
> > Pessoal
> >
> > Acabei de instalar aqui um SCANNER HP 5590, para scanear todas leis e
> > colocar elas na integra no SAPL...
> > O Scanner tem uma opção que ja salva em PDF, e os arquivos gira em
> > tornos de 220kb..
> > Essa leis scaneadas vão em forma de imagem com assinatura e tudo..
> >
> > Fiz alguns teste e pude perceber que mesmo esses pdfs sendo imagens o
> > sapl 2.02 consegue fazer pesquisa textual....
> >
> > Luciano de Fazio vc que ja fez esse tipo de trabalho o que tem a me
> > dizer. e
> > A Versão 2.1 com certeza tambem fará essa pesquisa textual ????
> >
> > aguardo sugestões.. ante de começar a detonar as leis...
> >
> > [] s
> >
> > Ivan
> > Câmara Apucarana - Pr.
> >
> >------------------------------------------------------------------------
> >
> >______________________________________________
> >Gitec mailing list
> >Gitec at listas.interlegis.gov.br
> >http://listas.interlegis.gov.br/mailman/listinfo/gitec
> >
> >
> ______________________________________________
> Gitec mailing list
> Gitec at listas.interlegis.gov.br
> http://listas.interlegis.gov.br/mailman/listinfo/gitec
>
> ______________________________________________
> Gitec mailing list
> Gitec at listas.interlegis.gov.br
> http://listas.interlegis.gov.br/mailman/listinfo/gitec



----------------------------------------------------------------------------
----


______________________________________________
Gitec mailing list
Gitec at listas.interlegis.gov.br
http://listas.interlegis.gov.br/mailman/listinfo/gitec



Mais detalhes sobre a lista de discussão Gitec