Reconhecimento de sons e voz

Disponível somente no TrabalhosFeitos
  • Páginas : 13 (3154 palavras )
  • Download(s) : 0
  • Publicado : 24 de setembro de 2011
Ler documento completo
Amostra do texto
1 INTRODUÇÃO
A tecnologia de reconhecimento de voz está se consolidando comercialmente e possibilitando sua utilização no mercado atual através de uma excelente relação custo/benefício. Este fato está fortemente atrelado a uma série de características que tornam o emprego desta nova tecnologia altamente atrativa.
No entanto existem muitas dúvidas e peculiaridades em torno deste assunto que nosparece muito obscuras, portanto neste trabalho tentaremos entender um pouco mais de como funciona, como é realizado a captação do som ou da voz, o processo de transformação de um sinal e como é efetuado esse entendimento entre homem – máquina.

2 REFERENCIAL TEÓRICO
2.1 DEFINIÇÃO
O reconhecimento de comandos de voz é um conjunto de hardwares e softwares específicos que possibilitam ogerenciamento e a otimização na execução de tarefas, podendo assim ser aplicado em vários segmentos. (PETRY, 2002).
A partir da voz, é possível identificar várias características de quem fala (idade, sexo, lugar onde mora, estado emocional, estado de saúde, etc.).
A voz é uma onda acústica, radiada do sistema quando o ar é expelido dos pulmões, por isso a voz é um som e possui todas as característicassonoras do mesmo. Ela se propaga como ondas de pressão atmosférica e pode ser convertida em sinais elétricos por transdutores, como o alto-falante e os microfones.
Pesquisas no reconhecimento automático da fala por máquinas têm sido feitas por quase quatro décadas.
O sinal da fala é um sinal que varia lentamente no tempo e quando examinado num período de tempo suficientemente pequeno (entre 5 e100 msec) suas características permanecem estacionárias. Entretanto em períodos longos de tempo (na ordem de 0.2 segundos ou mais) as características do sinal mudam para refletir os diferentes sons da fala. (SOUZA, REZENDE, SOUZA, 2011 p.11).

Ao contrário do que muitos pensam um sistema de reconhecimento de voz, reconhece a freqüência da voz e não a voz propriamente dita e é através do sinal dafreqüência do sinal que o software consegue reconhecer a voz e os sons.

2.2 FORMAS DE OBTENÇÃO
Basicamente, um sistema de reconhecimento de voz funciona da seguinte maneira:
O usuário dá o comando, o sistema capta o som (que em sua forma natural e analógico) através de transdutores (microfones) e este segue para a placa de som, onde, juntamente com um conversor A/D digitaliza o sinal de voz.Com o som digitalizado o sistema obtém a freqüência do sinal de voz e o compara com as informações existentes em seu banco de dados, definindo assim qual comando foi solicitado, e conseqüentemente executa-o.
(SILVA, 1999 p. 1).

Após a aquisição do sinal de voz, é realizado um pré-processamento nas amostras a fim de prepará-las para a extração de suas características. As características sãoutilizadas no algoritmo de reconhecimento de padrões. O pré- processamento é composto pelas etapas de pré- ênfase, divisão do sinal em frames e janelamento.
A pré-ênfase objetiva eliminar uma tendência espectral de aproximadamente -6dB/oitava na fala irradiada dos lábios. Essa distorção espectral não traz informação adicional e pode ser eliminada através da aplicação de um filtro, de respostaaproximadamente +6dB/oitava, que ocasionaria um nivelamento no espectro. Para um sistema digital, tais pré-ênfases podem ser implementadas como um circuito analógico, o qual precede o filtro e o amostrador, ou como uma operação digital no sinal
amostrado, através de um filtro FIR de primeira ordem. O efeito de ascensão de +6dB/oitava pode ser obtido pela diferenciação da entrada. A equação 1 descreveo pré-enfatizamento realizado no sinal amostrado. y(n)=x(n)-a.x(n-1) (1)
para 1 ≤ n < M, onde M é o número de amostras do sinal amostrado x(n), y(n) é o sinal pré-enfatizado e o parâmetro constante "a" é usualmente escolhido entre 0,9 e 1. (PETRY, A., ZANUZ, A. E BARONE, D. A. C, 2000 P. 1).

Para o processamento de sinais é...
tracking img