: Difference between revisions
From HLT@INESC-ID
No edit summary |
No edit summary |
||
Line 4: | Line 4: | ||
== Speaker == | == Speaker == | ||
* Joaquim Ferreira da Silva | * [[Joaquim Ferreira da Silva]] | ||
== Summary (in Portuguese) == | == Summary (in Portuguese) == |
Revision as of 02:21, 16 February 2006
Date
- February 08, 2000
Speaker
Summary (in Portuguese)
A extracção de unidades multi-palavra (Multi-Word Units) a partir de corpora de texto tem importantes aplicações: enriquecimento do léxico de PLN, melhor precisão no parsing de frases em Língua Natural, maior correcção no attachment entre sintagmas, etc.. Além do mais, estas unidades multi-palavra permitem uma interacção mais natural entre os utilizadores não-especialistas com os motores de extracção de informação. Apresentaremos um método estatístico para extracção de unidades multi-palavra, baseado num novo algoritmo (LocalMaxs), uma nova medida de associação.