Actas de Orientação de Ricardo Daniel Ribeiro: Difference between revisions

From Wiki**3

Line 3: Line 3:
Este mês marca o início das reuniões semanais regulares. As reuniões têm lugar à 2ª feira, pelas 10:00.
Este mês marca o início das reuniões semanais regulares. As reuniões têm lugar à 2ª feira, pelas 10:00.


== 2006/02/20 ==
* [[2006/02/20]]
 
=== Tópicos Avançados ===
 
* '''Análise da actividade anterior''':
** Recolha bibliográfica (ainda em curso)
** Estruturação do trabalho (conducente ao índice do relatório final)
 
* Relativamente às várias abordagens:
** Analisar as correntes de análise de discurso e formar grupos de abordagens relacionadas
** Analisar a frequência de citação e as obras mais citadas na literatura
 
* Relativamente às entradas e saídas de um sistema de análise computacional do discurso:
** Convergir para a concretização dos modelos de entrada e saída de um sistema de análise de discurso e, em particular, de sistemas de análise computacional do discurso.
 
* Ferramentas de anotação: RSTtool (análise preliminar)
 
* '''Objectivos até à próxima reunião''': (não definidos)


== 2006/02/27 ==
== 2006/02/27 ==

Revision as of 11:03, 6 March 2006

Fevereiro de 2006

Este mês marca o início das reuniões semanais regulares. As reuniões têm lugar à 2ª feira, pelas 10:00.

2006/02/27

Tópicos Avançados

  • Análise da semana anterior:
    • Recensão bibliográfica (continuação) (ver tópicos abaixo)
    • "Timeline" para a disciplina de análise computacional do discurso (fase preliminar; não documentada)
    • Estudo da variedade de entradas e saídas de sistemas de análise computacional do discurso
    • Estudo da frequência de citação relativa às publicações na área; especial incidência na Computational Linguistics (fase preliminar; não documentado)
  • Relativamente às entradas e saídas de um sistema de análise computacional do discurso:
    • será mesmo útil restringir na análise o modelo de entrada e de saída? ou
    • deverão ser apresentados todos e indicado(s) o(s) mais promissor(es)?
  • Interesses de médio-prazo:
    • Publicação do "survey": interesse sobre correntes e abordagens
    • Terá interesse actualizar a Wikipedia? (eventualmente) (boa forma de disseminar o estudo)
  • Objectivos até à próxima reunião:
    • Documentação relativa à "timeline" de análise de discurso (considerar a informação da Wikipedia)
    • Documentação relativa à informação de citações como indicadores de relevância (análise crítica dos números)
    • Definir um índice para o relatório final para a disciplina de Tópicos Avançados
    • Contactar docente responsável para informações sobre a avaliação

Partilha e Reutilização de Conhecimento

  • Análise da semana anterior: (não houve actividade)
  • Estado da disciplina:
    • Em avaliação: projecto entregue e aceite pelo docente; não são expectáveis modificações ao relatório entregue
    • Existe a possibilidade de submissão de um artigo em conferência ("extended abstract" para LREC 2006 foi rejeitado; o grupo ainda considera re-submissão de um artigo ainda por escrever)
  • Objectivos até à próxima reunião: (não se prevê actividade)

Projecto em Língua Natural

  • Análise da semana anterior: (não houve actividade)
  • Análise do ambiente
    • Base de dados de serviços noticiosos transcritos
    • Consideração de integração com wiki (motor MediaWiki), como forma de apresentação de sumários e informação relacionada
  • Objectivos até à próxima reunião: (não se prevê actividade)

Trabalho de Tese

Apesar de não ser o trabalho de tese, o estudo do estado da arte em análise computacional do discurso e o trabalho de sumarização de serviços noticiosos por extracção contribuem significativamente para o sucesso do empreendimento de sumarização por geração (trabalho a desenvolver no contexto da tese de doutoramento).

2006/03/06

Tópicos Avançados

  • Análise da semana anterior:
    • Documentação relativa à "timeline" de análise de discurso (considerar a informação da Wikipedia)
      • Em curso: adição ao documento das datas iniciais (pós-Aristóteles: apenas 2ª metade do séc. XX)
      • Obtido artigo do Harris (via Jorge Baptista)
    • Documentação relativa à informação de citações como indicadores de relevância (análise crítica dos números)
      • ISI web of knowledge considerada como fonte mais idónea de números acerca das citações
      • Artigo mais citado (ISI): Barbara Grosz et al. 1995: "Centering - A Framework for Modeling the Local Coherence of Discourse"
      • Artigo mais citado (citeseer): RSTs (1992?)
    • Definir um índice para o relatório final para a disciplina de Tópicos Avançados: FALHOU
    • Contactar docente responsável para informações sobre a avaliação
      • Docente contactado: entrega até final do ano lectivo (Junho 2006)
  • Recensão bibliográfica (continuação)
    • Tese de doutoramento de Daniel Marcu (e índice de livro correspondente: não acrescenta muito, se algo, à tese)
    • Marcu: Análise de Discurso + RSTs + Sumários automáticos
  • Objectivos até à próxima reunião:
    • Definir um índice para o relatório final para a disciplina de Tópicos Avançados: TRANSITA (1 de 3)
      • Nota: à 3ª transição o objectivo é reconsiderado no calendário de desenvolvimento do trabalho

Partilha e Reutilização de Conhecimento

  • Análise da semana anterior: ACTIVIDADE EXTRAORDINÁRIA
    • Re-submissão de artigo rejeitado na LREC 2006: rentabilização do esforço prévio: submetido à HLT/NAACL 2006
  • Estado da disciplina:
    • Em avaliação: projecto entregue e aceite pelo docente; não são expectáveis modificações ao relatório entregue
    • Consideram produção de relatório técnico após avaliação formal pelo docente
  • Objectivos até à próxima reunião: (não se prevê actividade)

Projecto em Língua Natural

  • Análise da semana anterior: (não houve actividade)
  • Análise do ambiente
    • Base de dados de serviços noticiosos transcritos
  • Objectivos até à próxima reunião: (não se prevê actividade)
    • Familiarização do modelo de extensões do motor MediaWiki, como forma de apresentação de sumários e informação relacionada
    • Consideração de demo permanente no site do L²F à la Google News, mas com base em noticiários televisivos nacionais
  • Notas adicionais:
    • Consideração de trabalho de PLN como base para projecto de graduação ou pós-graduação (mestrado, possivelmente), para realização de descodificação/sumarização/processamento de multíplos canais televisivos - cooperação com projecto NLE-GRID

Trabalho de Tese

(ver semana anterior)