: Difference between revisions
From HLT@INESC-ID
mNo edit summary |
|||
Line 1: | Line 1: | ||
__NOTOC__ | |||
== Date == | == Date == | ||
Revision as of 15:16, 7 July 2006
Date
- February 08, 2000
Speaker
Abstract (in Portuguese)
A extracção de unidades multi-palavra (Multi-Word Units) a partir de corpora de texto tem importantes aplicações: enriquecimento do léxico de PLN, melhor precisão no parsing de frases em Língua Natural, maior correcção no attachment entre sintagmas, etc.. Além do mais, estas unidades multi-palavra permitem uma interacção mais natural entre os utilizadores não-especialistas com os motores de extracção de informação. Apresentaremos um método estatístico para extracção de unidades multi-palavra, baseado num novo algoritmo (LocalMaxs), uma nova medida de associação.