From HLT@INESC-ID

Revision as of 15:28, 7 July 2006 by David (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Date

  • October 24, 2000

Speaker

  • Gael Harry Dias

Abstract (in Portuguese)

Apresentarei uma nova medida probabilística para a extracção de unidades polilexicais contíguas e não contíguas. Dando um corpus não tratado, o sistema SENTA elege, sem definição de valores limites, nomes e verbos compostos assim como locuções. Os resultados, embora interessantes, mostram os limites dos estudos baseados unicamente nas palavras. No âmbito de melhorar a precisão dos resultados, mostro uma experiência que integra o conhecimento de padrões sintácticos no sistema SENTA.

Retrieved from ""