[gitec] Conversão de áudio para texto

Giovana Rodrigues giovana.divcol em gmail.com
Sexta Janeiro 19 16:47:25 BRST 2018


Olá, Pessoal,

Não consegui testar o dictate.ms com som interno; parece que não tenho o
*drive *instalado e não consegui baixá-lo ainda. Mas valeu, Adriana. Bom
saber do que você conseguiu.

Estive conversando sobre nosso tema com a equipe de um laboratório da UFMG (
LEEL <http://150.164.100.248/CMS/index.asp?pasta=leel>) que trabalha muito
com transcrição de falas e conversei a respeito também com um técnico de
som aqui da Câmara.

No LEEL, me falaram que o que estamos buscando é o que o Google está
buscando também: um sistema de conversão de voz em texto que reconheça
vozes de todo tipo e exija o mínimo de intervenção humana para produzir
transcrições de qualidade. Alentador :( .

Mas, nessas conversas, me pareceu que a grande questão é empregar ou
desenvolver recursos para melhorar a captura do som e para evitar que sua
qualidade se perca no processamento. E isso porque, nos nossos testes (com
alguns demos), as vozes "mais claras" são bem transcritas. Esses recursos
incluiriam, entre tantas outras coisas, investir em bons microfones de
lapela, tratar o som com um programa tipo o Sound Forge
<http://www.magix.com/us/sound-forge/?utm_source=sonycreativesoftware&utm_medium=referral&utm_campaign=redirect>,
instruir os locutores para um melhor uso do microfone...

No caso de reuniões apenas com parlamentares, penso que essa instrução
possa ser bem produtiva e que seja possível também programar para que um
transcritor automático reconheça melhor as vozes mais rotineiras. No caso
de audiências públicas, porém, isso já seria mais complicado.

Mas acho que vale a pena continuarmos conversando com outras instâncias que
de alguma forma lidam com a questão. Na Letras, por exemplo, há outros
laboratórios, como o de Fonética, de Tradução, que devem fazer seus
malabarismos para automatizar ao máximo seus trabalhos. Reiniciando o ano
letivo, vou procurá-los. Fica a sugestão para quem puder conversar com
outros centros de pesquisa com laboratórios do tipo.

Em síntese, programas para tratar arquivos maiores existem, inclusive o do
Google; o problema é que são pagos, de código fechado, e precisam de uma
qualidade de som que ainda não alcançamos em nossas reuniões.

Por ora, é isso. Ótimo final de semana a todxs!

Giovana


Giovana de Sousa Rodrigues - Redatora
SECRED/DIVCOL/DIRLEG
Câmara Municipal de Belo Horizonte - CMBH
(31) 3555-1309
giovana.divcol em gmail.com
giovana em cmbh.mg.gov.br


Em 17 de janeiro de 2018 09:17, Adriana Chaves <a.agchaves em hotmail.com>
escreveu:

> Bom dia Gitec's
>
> Testei o Dictate e é muito bom, mas me parece tb que tem um limite de
> palavras, estou tentando descobrir aqui.
> Ele conseguiu digitar 528 palavras, totalizando 3.113 caracteres.
> Transcrevi de um áudio do Youtube de mais ou menos 10 minutos, ou seja,
> ainda é precário, mas ajuda bem na transcrição de uma ata. Verifiquei aqui
> mas ainda não achei algum lugar que pudesse estar configurando o tempo, ou
> o número maior de palavras.
> O DICTATE é bem legal. Fica direto no Word.
> Estou usando o Dictate de 32bits para o Office 2016.
>
>
> *Adriana Augusto Chaves*
> Chefe da Divisão de Informática
> Câmara Municipal de Piraí - RJ
> www.pirai.rj.leg.br
> Tel:(24) 2411-9500
> ------------------------------
> *De:* gitec-bounces em listas.interlegis.gov.br <gitec-bounces em listas.
> interlegis.gov.br> em nome de Adriana Chaves <a.agchaves em hotmail.com>
> *Enviado:* segunda-feira, 15 de janeiro de 2018 16:54
> *Para:* Giovana Rodrigues; Grupo Interlegis de Tecnologia
>
> *Assunto:* Re: [gitec] Conversão de áudio para texto
>
> SHOWWW PESSOAS!!!
>
> Estou adorando esta troca de informação.
> Giovana vou testar o DICTATE aqui.
> Valeu por mais essa dica.
>
> Abraços,
>
> *Adriana Augusto Chaves*
> Chefe da Divisão de Informática
> Câmara Municipal de Piraí - RJ
> www.pirai.rj.leg.br
> Tel:(24) 2411-9500
> ------------------------------
> *De:* gitec-bounces em listas.interlegis.gov.br <gitec-bounces em listas.
> interlegis.gov.br> em nome de Giovana Rodrigues <giovana.divcol em gmail.com>
> *Enviado:* segunda-feira, 15 de janeiro de 2018 16:47
> *Para:* Grupo Interlegis de Tecnologia
> *Assunto:* Re: [gitec] Conversão de áudio para texto
>
> Eu acharia ótimo, Ângelo!
> A propósito, estava testando agora o Dictate <http://dictate.ms/>, mas
> meu Office aqui na Câmara é 2010 e não o suportou (x_x). Amanhã vou testar
> no meu note.
> Se você quiser ir testando aí, Adriana; é uma extensão da Microsoft para o
> Word, PPT e Outlook que permite a edição enquanto o som é transcrito nesses
> programas.
> E, Adriano, vou tentando aqui pra ver por que não consigo tratar arquivos
> maiores no Google Speech.
> Abraços,
> Giovana
>
> Giovana de Sousa Rodrigues - Redatora
> SECRED/DIVCOL/DIRLEG
> Câmara Municipal de Belo Horizonte - CMBH
> (31) 3555-1309
> giovana.divcol em gmail.com
> giovana em cmbh.mg.gov.br
>
>
> Em 15 de janeiro de 2018 16:17, Angelo Marcondes de Oliveira Neto <
> angelomarcondes em gmail.com> escreveu:
>
> Olá Pessoal,
>
> Boa tarde.
> Então, este é um tema recorrente aqui no GITEC. E muito me interessa. :)
> Pessoalmente, creio que seja até um tema muito interessante para uma
> palestra no próximo EnGITEC. O que acham?
>
> Abraços
>
>
> Angelo Marcondes de Oliveira Neto.
> (34) 9 9141 4287
> Carneirinho - MG
>
>
> Em 15 de janeiro de 2018 14:26, Adriana Chaves <a.agchaves em hotmail.com>
> escreveu:
>
> Olá Giovana,
>
> Também testei e funciona direitinho, preciso de uma solução de 200MB tb.
> Se conseguir avisa a gente aqui ok.
>
> Um abraço,
>
> *Adriana Augusto Chaves*
> Chefe da Divisão de Informática
> Câmara Municipal de Piraí - RJ
> www.pirai.rj.leg.br
> Tel:(24) 2411-9500
> ------------------------------
> *De:* gitec-bounces em listas.interlegis.gov.br <
> gitec-bounces em listas.interlegis.gov.br> em nome de Giovana Rodrigues <
> giovana.divcol em gmail.com>
> *Enviado:* segunda-feira, 15 de janeiro de 2018 14:22
> *Para:* Grupo Interlegis de Tecnologia
> *Assunto:* Re: [gitec] Conversão de áudio para texto
>
> Olá, Adriano,
>
> Deu certo agora.
> Essa versão gratuita permite transcrever arquivos pequenos. Foi boa para
> testar a qualidade da captura.
> Continuo procurando uma solução de baixo custo, ou de preferência
> gratuita, que suporte um arquivo de som com cerca de 200MB.
> Grata,
>
> Giovana
>
> Giovana de Sousa Rodrigues - Redatora
> SECRED/DIVCOL/DIRLEG
> Câmara Municipal de Belo Horizonte - CMBH
> (31) 3555-1309
> giovana.divcol em gmail.com
> giovana em cmbh.mg.gov.br
>
>
> Em 12 de janeiro de 2018 17:44, Adriano <camaramg2 em gmail.com> escreveu:
>
> Boa tarde Giovana,
>
> Já testei transcrevendo à partir de um arquivo de áudio MP3 e os
> resultados foram satisfatórios.
>
> Segui esse mesmo tutorial e deu certo.
>
> Att.,
> Adriano.
>
>
> Em sexta-feira, 12 de janeiro de 2018, Giovana Rodrigues <
> giovana.divcol em gmail.com> escreveu:
>
> Obrigada pela sugestão, Adriano, mas eu já havia tentado essa
> configuração. Não sei por quê, ela não funcionou. Inclusive pedi para a
> nossa TI ajuda, e a configuração continuou não dando o resultado esperado.
> Você já testou isso no seu PC?
>
> Giovana de Sousa Rodrigues - Redatora
> SECRED/DIVCOL/DIRLEG
> Câmara Municipal de Belo Horizonte - CMBH
> (31) 3555-1309
> giovana.divcol em gmail.com
> giovana em cmbh.mg.gov.br
>
>
> Em 12 de janeiro de 2018 15:43, Adriano <camaramg2 em gmail.com> escreveu:
>
> https://www.oficinadanet.com.br/post/17738-como-transcrever-
> uma-gravacao-usando-o-google
>
> Em 12 de janeiro de 2018 15:25, Giovana Rodrigues <
> giovana.divcol em gmail.com> escreveu:
>
> Carxs Gitecers,
>
> Vocês conhecem algum aplicativo para converter fala em texto? Vocês usam
> em sua casa legislativa algo assim para transcrever fala de reuniões?
> Temos interesse tanto em um aplicativo que possa converter a fala que
> esteja em arquivo de aúdio ou de vídeo quanto em um que possa reconhecer o
> som interno da máquina online, sem a necessidade de projetá-lo em microfone
> externo.
> De preferência, um aplicativo gratuito e de uso fácil.
> Um ótimo começo de ano para todxs!
>
> Giovana
>
>
> Giovana de Sousa Rodrigues - Redatora
> SECRED/DIVCOL/DIRLEG
> Câmara Municipal de Belo Horizonte - CMBH
> (31) 3555-1309
> giovana.divcol em gmail.com
> giovana em cmbh.mg.gov.br
>
>
> --
> Histórico do grupo:
> http://colab.interlegis.leg.br/search/?type=thread&order=latest&list=gitec
>
> Regras de participação:
> http://colab.interlegis.leg.br/wiki/ComoParticiparComunidade
>
> Para administrar ou excluir sua conta visite:
> https://listas.interlegis.gov.br/mailman/listinfo/gitec
>
>
>
>
> --
> Adriano de Castro
> www.careacu.mg.leg.br
>
> --
> Histórico do grupo:
> http://colab.interlegis.leg.br/search/?type=thread&order=latest&list=gitec
>
> Regras de participação:
> http://colab.interlegis.leg.br/wiki/ComoParticiparComunidade
>
> Para administrar ou excluir sua conta visite:
> https://listas.interlegis.gov.br/mailman/listinfo/gitec
>
>
>
>
> --
> Adriano de Castro
> www.careacu.mg.leg.br
>
>
> --
> Histórico do grupo:
> http://colab.interlegis.leg.br/search/?type=thread&order=latest&list=gitec
>
> Regras de participação:
> http://colab.interlegis.leg.br/wiki/ComoParticiparComunidade
>
> Para administrar ou excluir sua conta visite:
> https://listas.interlegis.gov.br/mailman/listinfo/gitec
>
>
>
> --
> Histórico do grupo:
> http://colab.interlegis.leg.br/search/?type=thread&order=latest&list=gitec
>
> Regras de participação:
> http://colab.interlegis.leg.br/wiki/ComoParticiparComunidade
>
> Para administrar ou excluir sua conta visite:
> https://listas.interlegis.gov.br/mailman/listinfo/gitec
>
>
>
> --
> Histórico do grupo:
> http://colab.interlegis.leg.br/search/?type=thread&order=latest&list=gitec
>
> Regras de participação:
> http://colab.interlegis.leg.br/wiki/ComoParticiparComunidade
>
> Para administrar ou excluir sua conta visite:
> https://listas.interlegis.gov.br/mailman/listinfo/gitec
>
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.interlegis.gov.br/pipermail/gitec/attachments/20180119/510730ca/attachment.html>


Mais detalhes sobre a lista de discussão GITEC