ISSN 2359-5191

02/12/2008 - Ano: 41 - Edição Nº: 136 - Ciência e Tecnologia - Escola Politécnica
Software reconhece locutor pela voz

São Paulo (AUN - USP) -Seu tio confunde sua voz com a do seu irmão quando você atende ao telefone? Ao chamar pela sua mãe em um supermercado abarrotado de gente, três ou quatro mães olham para trás? Um programa de computador apresentado na Escola Politécnica da USP (Poli/USP) pelo engenheiro elétrico, Michel Alves Lacerda, mostra que a precisão das máquinas pode ser mais eficaz do que anos de convivência com a voz de uma pessoa.

O software desenvolvido é capaz de reconhecer indivíduos imediatamente, apenas pelo som que elas emitem ao falar. O método utilizado tem menor custo computacional e é mais eficiente do que os processos atuais, como o HMM (Hidden Markov Models) e o DTW (Dynamic Time Warping). O programa é desenvolvido com a parceria entre a Escola de Engenharia da USP São Carlos (EESC), o Instituto de Física da USP São Carlos (IFSC) e o SpeechLab – United Group for Audio & Speech Processing (Laboratório de Processamento de Áudio e Voz, localizado no Instituto de Física da USP, em São Carlos).

O software analisa propriedades físicas da fala. São consideradas a freqüência e a dimensão fractal das amostras de voz, associadas a redes neurais artificiais. As freqüências identificadas são as mais fortes, portanto, uma voz de freqüência mais baixa é mais difícil de ser reconhecida pelo programa, admitiu o engenheiro Lacerda. A dimensão fractal mede o grau de auto-similaridade de um sinal, relacionando tendências estatisticamente. Lacerda explica que as vozes são descontínuas, ou seja, formadas por sinais de som curtos, porém com intervalos muito rápidos, o que dá a impressão de continuidade. O número de vezes que um mesmo som se repete para construir uma continuidade varia de pessoa para pessoa. A dimensão fractal faz o cálculo dessas repetições. Finalmente, as chamadas redes neurais artificiais “simulam, modestamente, o comportamento de neurônios do cérebro humano, para obtermos o reconhecimento de quaisquer outras amostras, com base nas conhecidas”, explica o engenheiro.

O programa ainda não foi aplicado em um aparelho, mas existem planos para isso. A implementação de uma máquina capaz de reconhecer de vozes pode ser útil em sistemas de segurança para o bloqueio da entrada de pessoas em locais não permitidos, comandos na robótica, ou mesmo para identificação de clientes em serviços telefônicos.

Leia também...
Nesta Edição
Destaques

Educação básica é alvo de livros organizados por pesquisadores uspianos

Pesquisa testa software que melhora habilidades fundamentais para o bom desempenho escolar

Pesquisa avalia influência de supermercados na compra de alimentos ultraprocessados

Edições Anteriores
Agência Universitária de Notícias

ISSN 2359-5191

Universidade de São Paulo
Vice-Reitor: Vahan Agopyan
Escola de Comunicações e Artes
Departamento de Jornalismo e Editoração
Chefe Suplente: Ciro Marcondes Filho
Professores Responsáveis
Repórteres
Alunos do curso de Jornalismo da ECA/USP
Editora de Conteúdo
Web Designer
Contato: aun@usp.br