Actas de Orientação de Ricardo Daniel Ribeiro: Difference between revisions
From Wiki**3
No edit summary |
No edit summary |
||
Line 69: | Line 69: | ||
Apesar de não ser o trabalho de tese, o estudo do estado da arte em análise computacional do discurso e o trabalho de sumarização de serviços noticiosos por extracção contribuem significativamente para o sucesso do empreendimento de sumarização por geração (trabalho a desenvolver no contexto da tese de doutoramento). | Apesar de não ser o trabalho de tese, o estudo do estado da arte em análise computacional do discurso e o trabalho de sumarização de serviços noticiosos por extracção contribuem significativamente para o sucesso do empreendimento de sumarização por geração (trabalho a desenvolver no contexto da tese de doutoramento). | ||
== 2006/03/06 == | |||
=== Tópicos Avançados === | |||
* '''Análise da semana anterior''': | |||
** Documentação relativa à "timeline" de análise de discurso (considerar a informação da Wikipedia) | |||
*** Em curso: adição ao documento das datas iniciais (pós-Aristóteles: apenas 2ª metade do séc. XX) | |||
*** Obtido artigo do Harris (via Jorge Baptista) | |||
** Documentação relativa à informação de citações como indicadores de relevância (análise crÃtica dos números) | |||
*** ISI web of knowledge considerada como fonte mais idónea de números acerca das citações | |||
*** Artigo mais citado (ISI): Barbara Grosz et al. 1995: "Centering - A Framework for Modeling the Local Coherence of Discourse" | |||
*** Artigo mais citado (citeseer): RSTs (1992?) | |||
** Definir um Ãndice para o relatório final para a disciplina de Tópicos Avançados: '''FALHOU''' | |||
** Contactar docente responsável para informações sobre a avaliação | |||
*** Docente contactado: entrega até final do ano lectivo (Junho 2006) | |||
* Recensão bibliográfica (continuação) | |||
** Tese de doutoramento de Daniel Marcu (e Ãndice de livro correspondente: não acrescenta muito, se algo, Ã tese) | |||
** Marcu: Análise de Discurso + RSTs + Sumários automáticos | |||
* '''Objectivos até Ã próxima reunião''': | |||
** Definir um Ãndice para o relatório final para a disciplina de Tópicos Avançados: '''TRANSITA''' (1 de 3) | |||
*** Nota: à 3ª transição o objectivo é reconsiderado no calendário de desenvolvimento do trabalho | |||
=== Partilha e Reutilização de Conhecimento === | |||
* '''Análise da semana anterior''': '''ACTIVIDADE EXTRAORDINÃRIA''' | |||
** Re-submissão de artigo rejeitado na LREC 2006: rentabilização do esforço prévio: submetido à HLT/NAACL 2006 | |||
* Estado da disciplina: | |||
** Em avaliação: projecto entregue e aceite pelo docente; não são expectáveis modificações ao relatório entregue | |||
** Consideram produção de relatório técnico após avaliação formal pelo docente | |||
* '''Objectivos até à próxima reunião''': (não se prevê actividade) | |||
=== Projecto em LÃngua Natural === | |||
* '''Análise da semana anterior''': (não houve actividade) | |||
* Análise do ambiente | |||
** Base de dados de serviços noticiosos transcritos | |||
* '''Objectivos até à próxima reunião''': (não se prevê actividade) | |||
** Familiarização do modelo de extensões do motor MediaWiki, como forma de apresentação de sumários e informação relacionada | |||
** Consideração de demo permanente no [http://www.l2f.inesc-id.pt/ ''site'' do L²F] à la [http://news.google.pt/ Google News], mas com base em noticiários televisivos nacionais | |||
* Notas adicionais: | |||
** Consideração de trabalho de PLN como base para projecto de graduação ou pós-graduação (mestrado, possivelmente), para realização de descodificação/sumarização/processamento de multÃplos canais televisivos (cooperação com projecto [http://www.l2f.inesc-id.pt/wiki/index.php/NLE-GRID_-_Natural_Language_Engineering_on_a_Computational_Grid NLE-GRID] | |||
=== Trabalho de Tese === | |||
(ver [[#2006/02/27|semana anterior]]) |
Revision as of 11:00, 6 March 2006
Fevereiro de 2006
Este mês marca o inÃcio das reuniões semanais regulares. As reuniões têm lugar à 2ª feira, pelas 10:00.
2006/02/20
Tópicos Avançados
- Análise da actividade anterior:
- Recolha bibliográfica (ainda em curso)
- Estruturação do trabalho (conducente ao Ãndice do relatório final)
- Relativamente à s várias abordagens:
- Analisar as correntes de análise de discurso e formar grupos de abordagens relacionadas
- Analisar a frequência de citação e as obras mais citadas na literatura
- Relativamente à s entradas e saÃdas de um sistema de análise computacional do discurso:
- Convergir para a concretização dos modelos de entrada e saÃda de um sistema de análise de discurso e, em particular, de sistemas de análise computacional do discurso.
- Ferramentas de anotação: RSTtool (análise preliminar)
- Objectivos até Ã próxima reunião: (não definidos)
2006/02/27
Tópicos Avançados
- Análise da semana anterior:
- Recensão bibliográfica (continuação) (ver tópicos abaixo)
- "Timeline" para a disciplina de análise computacional do discurso (fase preliminar; não documentada)
- Estudo da variedade de entradas e saÃdas de sistemas de análise computacional do discurso
- Estudo da frequência de citação relativa à s publicações na área; especial incidência na Computational Linguistics (fase preliminar; não documentado)
- Relativamente à s entradas e saÃdas de um sistema de análise computacional do discurso:
- será mesmo útil restringir na análise o modelo de entrada e de saÃda? ou
- deverão ser apresentados todos e indicado(s) o(s) mais promissor(es)?
- Interesses de médio-prazo:
- Publicação do "survey": interesse sobre correntes e abordagens
- Terá interesse actualizar a Wikipedia? (eventualmente) (boa forma de disseminar o estudo)
- Objectivos até Ã próxima reunião:
- Documentação relativa à "timeline" de análise de discurso (considerar a informação da Wikipedia)
- Documentação relativa à informação de citações como indicadores de relevância (análise crÃtica dos números)
- Definir um Ãndice para o relatório final para a disciplina de Tópicos Avançados
- Contactar docente responsável para informações sobre a avaliação
Partilha e Reutilização de Conhecimento
- Análise da semana anterior: (não houve actividade)
- Estado da disciplina:
- Em avaliação: projecto entregue e aceite pelo docente; não são expectáveis modificações ao relatório entregue
- Existe a possibilidade de submissão de um artigo em conferência ("extended abstract" para LREC 2006 foi rejeitado; o grupo ainda considera re-submissão de um artigo ainda por escrever)
- Objectivos até à próxima reunião: (não se prevê actividade)
Projecto em LÃngua Natural
- Análise da semana anterior: (não houve actividade)
- Análise do ambiente
- Base de dados de serviços noticiosos transcritos
- Consideração de integração com wiki (motor MediaWiki), como forma de apresentação de sumários e informação relacionada
- Objectivos até à próxima reunião: (não se prevê actividade)
Trabalho de Tese
Apesar de não ser o trabalho de tese, o estudo do estado da arte em análise computacional do discurso e o trabalho de sumarização de serviços noticiosos por extracção contribuem significativamente para o sucesso do empreendimento de sumarização por geração (trabalho a desenvolver no contexto da tese de doutoramento).
2006/03/06
Tópicos Avançados
- Análise da semana anterior:
- Documentação relativa à "timeline" de análise de discurso (considerar a informação da Wikipedia)
- Em curso: adição ao documento das datas iniciais (pós-Aristóteles: apenas 2ª metade do séc. XX)
- Obtido artigo do Harris (via Jorge Baptista)
- Documentação relativa à informação de citações como indicadores de relevância (análise crÃtica dos números)
- ISI web of knowledge considerada como fonte mais idónea de números acerca das citações
- Artigo mais citado (ISI): Barbara Grosz et al. 1995: "Centering - A Framework for Modeling the Local Coherence of Discourse"
- Artigo mais citado (citeseer): RSTs (1992?)
- Definir um Ãndice para o relatório final para a disciplina de Tópicos Avançados: FALHOU
- Contactar docente responsável para informações sobre a avaliação
- Docente contactado: entrega até final do ano lectivo (Junho 2006)
- Documentação relativa à "timeline" de análise de discurso (considerar a informação da Wikipedia)
- Recensão bibliográfica (continuação)
- Tese de doutoramento de Daniel Marcu (e Ãndice de livro correspondente: não acrescenta muito, se algo, Ã tese)
- Marcu: Análise de Discurso + RSTs + Sumários automáticos
- Objectivos até Ã próxima reunião:
- Definir um Ãndice para o relatório final para a disciplina de Tópicos Avançados: TRANSITA (1 de 3)
- Nota: à 3ª transição o objectivo é reconsiderado no calendário de desenvolvimento do trabalho
- Definir um Ãndice para o relatório final para a disciplina de Tópicos Avançados: TRANSITA (1 de 3)
Partilha e Reutilização de Conhecimento
- Análise da semana anterior: ACTIVIDADE EXTRAORDINÃRIA
- Re-submissão de artigo rejeitado na LREC 2006: rentabilização do esforço prévio: submetido à HLT/NAACL 2006
- Estado da disciplina:
- Em avaliação: projecto entregue e aceite pelo docente; não são expectáveis modificações ao relatório entregue
- Consideram produção de relatório técnico após avaliação formal pelo docente
- Objectivos até à próxima reunião: (não se prevê actividade)
Projecto em LÃngua Natural
- Análise da semana anterior: (não houve actividade)
- Análise do ambiente
- Base de dados de serviços noticiosos transcritos
- Objectivos até à próxima reunião: (não se prevê actividade)
- Familiarização do modelo de extensões do motor MediaWiki, como forma de apresentação de sumários e informação relacionada
- Consideração de demo permanente no site do L²F à la Google News, mas com base em noticiários televisivos nacionais
- Notas adicionais:
- Consideração de trabalho de PLN como base para projecto de graduação ou pós-graduação (mestrado, possivelmente), para realização de descodificação/sumarização/processamento de multÃplos canais televisivos (cooperação com projecto NLE-GRID
Trabalho de Tese
(ver semana anterior)