Algoritmo para detecção dos intervalos de silêncio na fala

1490 palavras 6 páginas
Universidade do Minho
Escola de Engenharia

Mestrado Integrado em Engenharia Electrónica Industrial e Computadores
Unidade Curricular de Processamento Digital de Sinal
2012-2013

Algoritmo para detecção dos intervalos de silêncio na fala

Trabalho realizado por:
Fábio Fernandes A62008
Professor: Carlos Lima

Guimarães, Julho de 2013

Enunciado:
Pretende-se implementar um algoritmo para detecção dos intervalos de silêncio na fala. Em comunicações estes intervalos são desprezados e não são enviados pois não contêm informação linguística.
Pretende-se usar o conhecido “Shewart Protocol” mas com threshold adaptativo às condições do ruído. Este mecanismo requer:
1) Estudo do melhor valor de threshold para cada relação sinal-ruído. Pretende-se que faça este estudo para SNR de 0 a 50 dB com intervalos de 10 dB. Este estudo requer síntese de ruído branco, soma ao sinal e detecção dos segmentos contendo apenas ruído usando vários valores do threshold, valores entre 0.2 e 5, que devem ser colocados numa tabela. Trata-se de um estudo heurístico que deve ser justificado em relatório.
2) Cálculo automático da SNR e aplicação dos valores calculados no ponto 1).

Problema:


Os pontos do sinal que correspondem à fala também podem estar dentro dos parâmetros do Modelo do Ruído;



Pode existir um barulho de fundo durante um curto período de tempo e que é confundido com fala.

Para tal, analisa-se o sinal, segmento a segmento, e verifica-se se nesse tempo houve mais amostras cujos valores estavam dentro ou fora dos parâmetros do Modelo do Ruído. Se houver mais amostras dentro é ruído, senão é fala.

Fundamentos Teóricos:
Ruído branco e Modelo do Ruído:
O ruído branco é um tipo de ruído produzido pela combinação simultânea de sons de todas as frequências. O adjectivo branco é utilizado para descrever este tipo de ruído em analogia ao funcionamento da luz branca, dado que esta é obtida por meio da combinação simultânea de todas as

Relacionados

  • Reconhecimento de fala
    1425 palavras | 6 páginas
  • Som e imagem
    4171 palavras | 17 páginas
  • Codecs voip
    2810 palavras | 12 páginas
  • Protocolo de Acesso Multiplo
    968 palavras | 4 páginas
  • PROJETO DE INTERFACE PARA GRAVAÇÃO DA BASE DE DADOS
    9770 palavras | 40 páginas
  • SMU Slide 03 Compress O
    6826 palavras | 28 páginas
  • Resumo - vehicular networking
    6731 palavras | 27 páginas
  • Senhor
    26963 palavras | 108 páginas
  • Metodologias e Avaliações da Qualidade de Fluxos de Voz
    6716 palavras | 27 páginas
  • Enlace de dados
    8009 palavras | 33 páginas