Voice Source Assessment (proposal): Difference between revisions
From HLT@INESC-ID
No edit summary |
m (Voice Source Assessment moved to Voice Source Assessment (proposal)) |
(No difference)
|
Latest revision as of 17:14, 29 August 2007
Proposta de Tese de Mestrado 2007/2008
Orientação
- Orientador: Luís Caldas de Oliveira
Objectivos
Neste trabalho pretende-se desenvolver algoritmos de análise de fala que permitam identificar de forma automática a possibilidade da existência de patologias ao nível das cordas vocais.
Enquadramento
A vibração das cordas vocais produz uma onda de pressão normalmente identificada como a fonte sonora (voice source). É esta onda de pressão que é responsável pela estimulação do tracto oral que resulta na produção do sinal de fala. Dada a supremacia da fala como meio de comunicação entre humanos, as patologias associadas às cordas vocais para além de produzir uma diminuição da qualidade de vida podem limitar o exercício de profissões tais como as de professores, cantores, locutores e de outros profissionais. O diagnóstico precoce destas patologias pode evitar a irrecuperabilidade dos danos, mas a sua a análise e identificação exige a realização de exames laringológicos efectuados por especialistas competentes e com equipamento adequado.
Descrição
O desenvolvimento das tecnologias de processamento da fala tem conduzido ao desenvolvimento de ferramentas de análise cada vez mais sofisticadas e rigorosas na determinação dos principais parâmetros acústicos. Um dos desenvolvimentos mais relevantes neste sentido é o da estimação da forma da fonte sonora a partir do sinal de fala captado com um microfone de boa qualidade e em condições acústicas aceitáveis. Com uma boa estimativa deste sinal é possível obter medições que anteriormente só eram possíveis utilizando um laringoscópio e métodos de iluminação que permitissem determinar os modos de vibração das cordas vocais. Com a estimativa da fonte sonora é possível determinar a evolução temporal dos instantes de fecho e abertura das cordas vocais, identificando as irregularidades na sua vibração normalmente associadas a diversos tipos de patologias. Este trabalho terá os seguintes passos:
- Definição da base de dados de gravações a utilizar, definindo a composição dos conjuntos de treino e de avaliação
- Selecção e afinação do algoritmo de filtragem inversa
- Selecção e afinação do detector de instantes relevantes na onda glotal
- Desenvolvimento de um classificador de fala patológica e não patológica com eventual tentativa de identificação da patologia
- Avaliação do sistema de classificação sobre o conjunto de avaliação
- Divulgação dos resultados em publicação científica
Resultado esperado
Pretende-se que no final do trabalho estejam disponíveis um conjunto de ferramentas computacionais para identificar fala patológica e que os resultados sejam reportados numa publicação científica.
Observações
Dar-se-á preferência aos alunos que demonstrem ter interesse em algoritmos de processamento de sinal e na sua implementação computacional.