[Gitec] SAPL 2.0.1 - Textos integrais

Luciano De Fázio luciano at camaracatanduva.sp.gov.br
Thu Nov 4 13:41:04 BRST 2004


Ciciliati,

Está tudo como você disse.

Ocorre que os arquivos que eu estava tentando incluir possuíam um brasão 
no cabeçalho.

Simplesmente retirei o brasão dos arquivos e o SAPL conseguiu extrair 
corretamente o texto.

Não sei se foi um problema específico dos arquivos com os quais trabalhei.

De qualquer forma, agradeço a atenção.

Aproveitando a oportunidade, pergunto se existe algum controle de 
alterações dos arquivos do SAPL 2.0.1 em relação à versão 2.0, um diff 
por exemplo.

Existe a possibilidade de encaminhar ou relacionar as alterações dos 
arquivos (forms e procs) do módulo normas jurídicas?

Com relação aos produtos, parece que não houve atualização de versões, 
isto está correto ?

Abraço,

Luciano De Fázio
Coordenador de Informática e Tecnologia
Câmara Municipal de Catanduva - SP

Fernando Ciciliati Jr. escreveu:

> Luciano De Fázio escreveu:
>
> Olá Luciano,
>
>       Por projeto, era para funcionar. Na verdade, temos testado muito 
> mais o pdf que outros tipos de arquivo.
> Você tem certeza que o PDF que você está testando tem conteúdo de 
> texto? Não é uma imagem scaneada?
> Por favor, rode o comando "pdftotext <nome_do_arquivo_pdf>" para ver 
> se ele consegue extrair o texto
> desse arquivo pdf que você está testando.  É esse o utilitário que o 
> sapl usa para fazer a indexação de pdf.
> Verifique também, dentro de /sapl/documentos/norma_juridica/Catalog, 
> clicando na aba "Indexes", clique em
> "PrincipiaSearchSource", depois em "Converters", e veja se aparece 
> algo do tipo:
>
> Mime-Types 	Description 	depends on
> application/msword,application/ms-word,application/vnd.ms-word 
> Microsoft Word 	wvWare  
> * application/pdf * 	* Adobe Acrobat PDF * 	* pdftotext   *
> application/postscript 	Adobe Postscript Document 	ps2ascii  
> application/vnd.sun.xml.writer 	OpenOffice 	 
> text/html 	Converter HTML to ASCII 	 
> text/plain 	Null converter 	 
> text/sgml,text/xml 	Converter SGML to ASCII 	 
>
>
>        Veja se o conversor para pdf está aparecendo.
>         De qualquer forma, estarei pesquisando algo mais por aqui também.
>
> SDS,
> Ciciliati.
>
>> Pessoal,
>>
>> Por que, ao cadastrar um arquivo "PDF - texto" como texto integral de 
>> uma norma jurídica, o item Catalog correspondente não possui nenhum 
>> dado para indexação, e nem funciona pesquisa textual para ele?
>>
>> Com outros tipos de arquivo (doc, txt) funciona tudo corretamente.
>>
>> Lembro que na versão anterior o cadastramento com PDF texto também 
>> funcionava para pesquisa textual.
>>
>> Abraço,
>>
>> Luciano De Fázio
>> Coordenador de Informática e Tecnologia
>> Câmara Municipal de Catanduva - SP
>>
>>
>> _______________________________________________
>> Gitec mailing list
>> Gitec at listas.interlegis.gov.br
>> http://listas.interlegis.gov.br/mailman/listinfo/gitec
>>
>------------------------------------------------------------------------
>
>_______________________________________________
>Gitec mailing list
>Gitec at listas.interlegis.gov.br
>http://listas.interlegis.gov.br/mailman/listinfo/gitec
>  
>



Mais detalhes sobre a lista de discussão Gitec