Voice Source Assessment (proposal)

From HLT@INESC-ID

Revision as of 17:14, 29 August 2007 by David (Talk | contribs) (Voice Source Assessment moved to Voice Source Assessment (proposal))

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Proposta de Tese de Mestrado 2007/2008

Orientação

Objectivos

Neste trabalho pretende-se desenvolver algoritmos de análise de fala que permitam identificar de forma automática a possibilidade da existência de patologias ao nível das cordas vocais.

Enquadramento

A vibração das cordas vocais produz uma onda de pressão normalmente identificada como a fonte sonora (voice source). É esta onda de pressão que é responsável pela estimulação do tracto oral que resulta na produção do sinal de fala. Dada a supremacia da fala como meio de comunicação entre humanos, as patologias associadas às cordas vocais para além de produzir uma diminuição da qualidade de vida podem limitar o exercício de profissões tais como as de professores, cantores, locutores e de outros profissionais. O diagnóstico precoce destas patologias pode evitar a irrecuperabilidade dos danos, mas a sua a análise e identificação exige a realização de exames laringológicos efectuados por especialistas competentes e com equipamento adequado.

Descrição

O desenvolvimento das tecnologias de processamento da fala tem conduzido ao desenvolvimento de ferramentas de análise cada vez mais sofisticadas e rigorosas na determinação dos principais parâmetros acústicos. Um dos desenvolvimentos mais relevantes neste sentido é o da estimação da forma da fonte sonora a partir do sinal de fala captado com um microfone de boa qualidade e em condições acústicas aceitáveis. Com uma boa estimativa deste sinal é possível obter medições que anteriormente só eram possíveis utilizando um laringoscópio e métodos de iluminação que permitissem determinar os modos de vibração das cordas vocais. Com a estimativa da fonte sonora é possível determinar a evolução temporal dos instantes de fecho e abertura das cordas vocais, identificando as irregularidades na sua vibração normalmente associadas a diversos tipos de patologias. Este trabalho terá os seguintes passos:

  • Definição da base de dados de gravações a utilizar, definindo a composição dos conjuntos de treino e de avaliação
  • Selecção e afinação do algoritmo de filtragem inversa
  • Selecção e afinação do detector de instantes relevantes na onda glotal
  • Desenvolvimento de um classificador de fala patológica e não patológica com eventual tentativa de identificação da patologia
  • Avaliação do sistema de classificação sobre o conjunto de avaliação
  • Divulgação dos resultados em publicação científica


Resultado esperado

Pretende-se que no final do trabalho estejam disponíveis um conjunto de ferramentas computacionais para identificar fala patológica e que os resultados sejam reportados numa publicação científica.

Observações

Dar-se-á preferência aos alunos que demonstrem ter interesse em algoritmos de processamento de sinal e na sua implementação computacional.