: Difference between revisions

From HLT@INESC-ID

No edit summary
 
No edit summary
Line 7: Line 7:


* '''Orientador:''' [[João P. Neto]]
* '''Orientador:''' [[João P. Neto]]
* '''Co-orientador:''' [[Diamantino Caseiro]]


== Enquadramento ==
== Enquadramento ==


O L2F tem uma longa experiência no desenvolvimento de sistemas de reconhecimento de fala contínua para pequenos, médios e largos vocabulários, possuindo tecnologia própria. Com a disponibilização de dispositivos móveis cada vez com mais capacidade torna-se necessário desenvolver sistemas adequados para estes dispositivos.
O L2F utiliza modelos baseados em redes neuronais para classificação acústica obtendo taxas de classificação elevadas. Com a disponibilização de grandes quantidades de dados de fala torna-se necessário investigar diferentes métodos que utilizem de uma forma racional essas quantidades de dados.


== Objectivos ==
== Objectivos ==


Desenvolvimento de um sistema de reconhecimento de fala contínua, para diferentes dimensões de vocabulários e de modelos de linguagem, adaptado às características dos dispositivos móveis.
Com este trabalho pretende-se realizar investigação de novos métodos de classificação acústica e de aprendizagem que lidem de uma forma eficiente, e com elevado desempenho, com grandes quantidades de dados de fala.


== Descrição ==
== Descrição ==


Este trabalho pretende avaliar as características de vários dispositivos móveis, PDAs e telemóveis, e adaptar as características dos vários módulos de um sistema de reconhecimento de fala contínua a esses dispositivos. O trabalho terá várias fases em que numa fase inicial os módulos de reconhecimento estarão distribuídos e serão sucessivamente portados para o dispositivo móvel, até que na fase final o sistema estará totalmente adaptado ao dispositivo e associado a uma aplicação de edição de texto.  
Com a disponibilização de um conjunto elevado de dados de fala, passou-se das poucas dezenas de horas para milhares de horas, torna-se necessário procurar novos métodos de classificação que tirem partido da diversidade dos dados acústicos.
Pretende-se estudar novos métodos que usem sílabas em lugar de fonemas, métodos que estudem a redundância dos dados acústicos para um classificador e métodos incrementais de selecção de padrões de treino.


== Requisitos ==
== Requisitos ==


O aluno deverá ter bons conhecimentos de Sistemas e Sinais e de Análise e Síntese de Algoritmos.
O aluno deverá ter bons conhecimentos de Aprendizagem Automática.


== Resultado Esperado ==
== Resultado Esperado ==
Uma API de reconhecimento a funcionar num dispositivo móvel.


== Observações ==
== Observações ==


Esta proposta foi elaborada em conjunto com o aluno João Miranda.


[[category:Research]]
[[category:Research]]
[[category:Masters Theses Proposals 2007/2008]]
[[category:Masters Theses Proposals 2007/2008]]

Revision as of 18:39, 18 April 2007

Proposta de Tese de Mestrado 2007/2008

Orientação

Enquadramento

O L2F utiliza modelos baseados em redes neuronais para classificação acústica obtendo taxas de classificação elevadas. Com a disponibilização de grandes quantidades de dados de fala torna-se necessário investigar diferentes métodos que utilizem de uma forma racional essas quantidades de dados.

Objectivos

Com este trabalho pretende-se realizar investigação de novos métodos de classificação acústica e de aprendizagem que lidem de uma forma eficiente, e com elevado desempenho, com grandes quantidades de dados de fala.

Descrição

Com a disponibilização de um conjunto elevado de dados de fala, passou-se das poucas dezenas de horas para milhares de horas, torna-se necessário procurar novos métodos de classificação que tirem partido da diversidade dos dados acústicos. Pretende-se estudar novos métodos que usem sílabas em lugar de fonemas, métodos que estudem a redundância dos dados acústicos para um classificador e métodos incrementais de selecção de padrões de treino.

Requisitos

O aluno deverá ter bons conhecimentos de Aprendizagem Automática.

Resultado Esperado

Observações

Retrieved from ""