From HLT@INESC-ID
Date
- October 24, 2000
Speaker
- Gael Harry Dias
Abstract (in Portuguese)
Apresentarei uma nova medida probabilística para a extracção de unidades polilexicais contíguas e não contíguas. Dando um corpus não tratado, o sistema SENTA elege, sem definição de valores limites, nomes e verbos compostos assim como locuções. Os resultados, embora interessantes, mostram os limites dos estudos baseados unicamente nas palavras. No âmbito de melhorar a precisão dos resultados, mostro uma experiência que integra o conhecimento de padrões sintácticos no sistema SENTA.