: Difference between revisions
From HLT@INESC-ID
No edit summary |
m (Validação de matrizes léxico-sintácticas moved to Validação de matrizes léxico-sintácticas (proposal)) |
||
(One intermediate revision by one other user not shown) | |||
Line 23: | Line 23: | ||
== Observações == | == Observações == | ||
Trabalho proposto pelo aluno Nº 52341, Fernando Miguel Filipe Gomes | |||
[[category:Research]] | [[category:Research]] | ||
[[category:Masters Theses Proposals 2007/2008]] | [[category:Masters Theses Proposals 2007/2008]] |
Latest revision as of 17:10, 29 August 2007
Proposta de Tese de Mestrado 2007/2008
Orientação
- Orientador: Nuno Mamede
- Co-orientador: Luísa Coheur
Objectivos
Este trabalho enquadra-se numa das principais linhas de actividade do Laboratório de Sistemas de Língua Falada (L2F do INESC-ID). Integra sobretudo tecnologias que facilitem o desenvolvimento de aplicações de processamento de Língua Natural.
Descrição
A informação lexical é um dos elementos fundamentais para o processamento computacional de língua natural, já que o comportamento das expressões linguísticas é em grande medida determinado pelo material lexical envolvido. Para certos fragmentos da gramática da língua é já possível dispor de descrições de vários tipos de propriedades (morfológicas, sintácticas, distribucionais, transformacionais e semânticas) mas que são geralmente construídas com recurso exclusivo (ou quase) à introspecção. Apesar do seu inegável interesse, essas descrições carecem de uma validação empírica, baseada em empregos reais, observados em corpora. A associação de informação de frequência permitiria, além disso, desenvolver ou tornar mais eficientes diversos tipos de aplicações. O objectivo principal do estudo consiste, pois, na construção/adaptação das ferramentas necessárias para o processamento desse tipo de descrições e o desenvolvimento de estratégias para a sua validação (semi-)automática a partir de corpora textuais.
Resultado Esperado
Espera-se que no final esteja construído um conjunto de ferramentas [para o processamento de descrições formalizadas de vários tipos de propriedades (morfológicas, sintácticas, transformacionais e semânticas) associadas a unidades lexicais] e desenvolvidas estratégias de validação (semi-)automática, a partir de corpora textuais, de descrições formalizadas de vários tipos de propriedades linguísticas.
Observações
Trabalho proposto pelo aluno Nº 52341, Fernando Miguel Filipe Gomes