Limites dos sistemas probabilísticos e integração de conhecimento linguístico para a extracção de unidades polilexicais

From HLT@INESC-ID

Date

  • October 24, 2000

Speaker

  • Gael Harry Dias

Abstract (in Portuguese)

Apresentarei uma nova medida probabilística para a extracção de unidades polilexicais contíguas e não contíguas. Dando um corpus não tratado, o sistema SENTA elege, sem definição de valores limites, nomes e verbos compostos assim como locuções. Os resultados, embora interessantes, mostram os limites dos estudos baseados unicamente nas palavras. No âmbito de melhorar a precisão dos resultados, mostro uma experiência que integra o conhecimento de padrões sintácticos no sistema SENTA.