Voice Source Assessment (proposal)

From HLT@INESC-ID

Revision as of 17:14, 29 August 2007 by David (talk | contribs) (Voice Source Assessment moved to Voice Source Assessment (proposal))
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
The printable version is no longer supported and may have rendering errors. Please update your browser bookmarks and please use the default browser print function instead.

Proposta de Tese de Mestrado 2007/2008

Orientação

Objectivos

Neste trabalho pretende-se desenvolver algoritmos de análise de fala que permitam identificar de forma automática a possibilidade da existência de patologias ao nível das cordas vocais.

Enquadramento

A vibração das cordas vocais produz uma onda de pressão normalmente identificada como a fonte sonora (voice source). É esta onda de pressão que é responsável pela estimulação do tracto oral que resulta na produção do sinal de fala. Dada a supremacia da fala como meio de comunicação entre humanos, as patologias associadas às cordas vocais para além de produzir uma diminuição da qualidade de vida podem limitar o exercício de profissões tais como as de professores, cantores, locutores e de outros profissionais. O diagnóstico precoce destas patologias pode evitar a irrecuperabilidade dos danos, mas a sua a análise e identificação exige a realização de exames laringológicos efectuados por especialistas competentes e com equipamento adequado.

Descrição

O desenvolvimento das tecnologias de processamento da fala tem conduzido ao desenvolvimento de ferramentas de análise cada vez mais sofisticadas e rigorosas na determinação dos principais parâmetros acústicos. Um dos desenvolvimentos mais relevantes neste sentido é o da estimação da forma da fonte sonora a partir do sinal de fala captado com um microfone de boa qualidade e em condições acústicas aceitáveis. Com uma boa estimativa deste sinal é possível obter medições que anteriormente só eram possíveis utilizando um laringoscópio e métodos de iluminação que permitissem determinar os modos de vibração das cordas vocais. Com a estimativa da fonte sonora é possível determinar a evolução temporal dos instantes de fecho e abertura das cordas vocais, identificando as irregularidades na sua vibração normalmente associadas a diversos tipos de patologias. Este trabalho terá os seguintes passos:

  • Definição da base de dados de gravações a utilizar, definindo a composição dos conjuntos de treino e de avaliação
  • Selecção e afinação do algoritmo de filtragem inversa
  • Selecção e afinação do detector de instantes relevantes na onda glotal
  • Desenvolvimento de um classificador de fala patológica e não patológica com eventual tentativa de identificação da patologia
  • Avaliação do sistema de classificação sobre o conjunto de avaliação
  • Divulgação dos resultados em publicação científica


Resultado esperado

Pretende-se que no final do trabalho estejam disponíveis um conjunto de ferramentas computacionais para identificar fala patológica e que os resultados sejam reportados numa publicação científica.

Observações

Dar-se-á preferência aos alunos que demonstrem ter interesse em algoritmos de processamento de sinal e na sua implementação computacional.